20 сентября 2023, 22:13

Новый генератор картинок DALL-E 3 объединили с ChatGPT. Работает идеально

Визуальный ИИ теперь максимально точно соответствует ключевым словам запроса и намного меньше ошибается — прогресс налицо

Новости / ИИ

Новый генератор картинок DALL-E 3 объединили с ChatGPT. Работает идеально

Компания OpenAI объявила о скором запуске третьего поколения генеративной нейросети DALL-E, которая создаёт изображения любой сложности по простейшему текстовому описанию. По утверждениям разработчиков, DALL-E 3 является «значительным обновлением» технологии — было исправлено множество различных ошибок, включая недостаточную точность совпадений с ключевыми словами при обработке длинных запросов и некорректную генерацию частей человеческого тела (особенно касается детализации и количества пальцев).

Подписывайтесь на наш Телеграм

DALL-E 3 рисует ещё лучше и качественнее, а также понимает больше нюансов и деталей по сравнению с DALL-E 2. Заявлен серьёзный прогресс даже при повторной генерации изображения по одному и тому же описанию — и на самом деле разница видна невооружённым глазом (сравнение представлено ниже). Огромный акцент делается на то, что теперь система максимально точно соответствует запросу и в целом креативит на голову выше предшественника. При этом OpenAI по-прежнему против копирования стилей реальных художников и порнографического контента, ограничения продолжат действовать и в DALL-E 3.

«Выразительная картина маслом, изображающая баскетболиста на фоне взрыва туманности». DALL-E 2 (слева) и DALL-E 3 (справа)

В дополнение ко всем нововведениям в архитектуру DALL-E 3 интегрировали ChatGPT, поэтому чат-бот теперь может выступать в качестве партнёра по быстрой генерации идей или помочь подробно дополнить запрос, чтобы добиться идеального результата. Для отдельной помощи с визуальным ИИ ChatGPT научили генерировать индивидуальные подсказки или вносить правки в уже созданное изображение от DALL-E 3, если кажется, что с ним что-то не так или чего-то не хватает.

Глобальный публичный доступ к DALL-E 3 откроется уже в начале октября, но только по платной подписке ChatGPT Plus (и ChatGPT Enterprise). О бесплатной версии для всех конкретной информации пока нет. Опубликовать API для разработчиков планируется до конца осени. Как и ранее, все изображения, сгенерированные с помощью DALL-E 3, не требуют разрешений или лицензии на распространение и продажу — владелец вправе использовать их, как угодно.

Галерея тестовых картинок DALL-E 3 от OpenAI: