27 июля 2023, 09:45

Представлена Stable Diffusion XL 1.0: лучше рисует текст, тени и требует менее мощного железа

Авторы генеративной модели заявили, что новая версия ИИ гораздо лучше справляется с поставленной задачей

Вчера, 26 июля, компания Stability AI официально выпустила новую версию своей генеративной нейронной сети Stable Diffusion XL 1.0 (SDXL 1.0), которая представлена в формате софта с открытым исходным кодом и доступна абсолютно всем желающим. А учитывая, что данная версия, по словам разработчиков, требует куда менее производительное «железо», можно смело предположить, что поклонников у нейросети будет гораздо больше, чем у версии 0.9. Более того, SDXL 1.0 доступна как на платформе GitHub со всеми конфигурациями и файлами, так и в формате веб-приложения на платформах Clipdrop и DreamStudio.

Подписывайтесь на наш Телеграм

В рамках интервью изданию TechCrunch Джо Пенн (Joe Penn), один из ведущих разработчиков Stability AI, рассказал, что новая версия генеративной нейронной сети может похвастаться более яркими цветами и точной цветопередачей, улучшенной контрастностью, более детальными тенями и продвинутой работой с освещением. В целом данная версия работает гораздо лучше решения предыдущего поколения и в компании называют SDXL 1.0 самой продвинутой генеративной нейронной сетью на современном рынке. Добиться столь внушительных результатов удалось за счёт интеграции 3,5 миллиардов параметров в новейшую модель, плюс теперь она способна формировать изображения с разрешением в 1 Мп (это 720р) буквально на секунды.

Разработчики нейросети отмечают, что модель Stable Diffusion XL 0.9 тоже могла генерировать изображения с достаточно высоким разрешением, но проблема заключалась в том, что для этого софту требовалось внушительная производительность ПК. Теперь, судя по информации профильного издания SiliconANGLE, запускать SDXL 1.0 можно даже на очень простых системах и получать вполне приемлемый результат, что делает модель более доступной, чем конкуренты. Также представители компании Stability AI рассказали, что они существенно прокачали технологию генерации текстового контента — на текущий момент даже лучшие генеративные сети могут «промахиваться» при формировании изображения с различного рода текстовыми надписями или логотипами.

В SDXL 1.0 эту проблему решили — модель умеет создавать текст в разборчивом виде, так что теперь генеративные изображения с преобладающим текстовым контентом будут выглядеть куда приятнее. А ещё модель оснастили функциями inpainting (умеет восстанавливать повреждённые или недостающие элементы на изображении) и outpainting (условно расширяет зону видимости в кадре, дорисовывая новые детали на изображении). Да и новая версия модели теперь работает даже со сложными текстовыми инструкциями, которые могут состоять из нескольких отдельных подсказок.

Telegram-канал создателя Трешбокса про технологии

···

Последнее изменение:
28 июля 2023, 20:31

https://tbx.su/hQP

columbus

Администратор ⭑

Фанат Хогвартса Ryzen 5 1600 AF / RTX 3060 Ti

ИИ

8,7K участников

Вступить

1 комментарий

Оставьте комментарий...

Wovik253 1 год

SD версии 1.5 генерила даже на 4Гб видеопамяти, а для SDXL минималка 12 Гб, а так да, железо надо менее мощное. Прежде чем писать о нейросетях, хотя бы просто из любопытства, хоть поверхностно изучите вопрос.

Ответить