adblock check

Состоялся релиз FLUX.2 — генеративной модели изображений, понимающей физику, освещение и логику

При желании энтузиасты могут запустить новую большую языковую модель локально на своём компьютере. Нужно лишь иметь 90 ГБ видеопамяти на борту
Обложка: Black Forest Labs

Вчера, 25 ноября, компания Black Forest Labs официально представила FLUX.2 — новое семейство моделей генеративного искусственного интеллекта, которое предназначено для создания более реалистичных изображений. Разработчики проекта рассказали, что второе поколение LLM, состоящее из FLUX.2 [pro], FLUX.2 [flex], FLUX.2 [dev] и FLUX.2 [klein], поддерживает обработку сразу множества источников — пользователь может ссылаться одновременно на десять изображений, чтобы получить желаемый результат с сохранением стиля и характера. При этом, естественно, новая генеративная модель гарантирует более высокую детализацию финального изображения, хотя и FLUX.1 в этом плане демонстрировала хорошие результаты.

Состоялся релиз FLUX.2 — генеративной модели изображений, понимающей физику, освещение и логику
Изображение: Black Forest Labs

Также с релизом второго поколения специалисты компании обещают более высокую чёткость текстур и усовершенствованное освещение — это, по словам представителей Black Forest Labs, позволит с высоким уровнем качества «снимать» различные товары, выполнять сложную визуализацию и многое другое. Кроме того, новая модель гораздо лучше справляется с рендерингом текстового контента — FLUX.2 способна генерировать сложную типографику, инфографику, мемы, макеты пользовательского интерфейса с разборчивым мелким текстом и всё в таком духе. Это действительно важный момент, так как даже Nano Banana последней итерации с мелким текстом справляется довольно плохо.

Состоялся релиз FLUX.2 — генеративной модели изображений, понимающей физику, освещение и логику
Изображение: Black Forest Labs

Среди важных улучшений генеративной модели FLUX.2 разработчики отмечают более точное следование подсказкам автора контента — модель будет лучше следовать сложным и структурированным инструкциям, что предоставит возможность быстрее добиться желаемого результата, потратив меньше ресурсов. Кроме того, авторы модели сделали акцент на том, что LLM нового поколения теперь гораздо лучше понимает окружающий мир — включая освещение и пространственную логику. Это позволяет системе генерировать более логичные сцены с ожиданием поведения генеративной модели. Завершает же список важных апдейтов возможность редактировать изображения с разрешением до 4 Мп.

Состоялся релиз FLUX.2 — генеративной модели изображений, понимающей физику, освещение и логику
Изображение: Black Forest Labs

И, что весьма интересно, так как модель поставляется с открытым исходным кодом, её можно запустить локально на компьютере пользователя. Правда, версия LLM на 32 миллиарда параметров требует 90 ГБ видеопамяти, так что на «обычной» системе FLUX.2 всё же не запустить при всём желании.

Источник

ИИ ИИ
13,6K участников
Вступить
Комментариев пока нет
Оставьте комментарий...
Оставьте комментарий...