Компания OpenAI объявила о скором запуске третьего поколения генеративной нейросети DALL-E, которая создаёт изображения любой сложности по простейшему текстовому описанию. По утверждениям разработчиков, DALL-E 3 является «значительным обновлением» технологии — было исправлено множество различных ошибок, включая недостаточную точность совпадений с ключевыми словами при обработке длинных запросов и некорректную генерацию частей человеческого тела (особенно касается детализации и количества пальцев).
DALL-E 3 рисует ещё лучше и качественнее, а также понимает больше нюансов и деталей по сравнению с DALL-E 2. Заявлен серьёзный прогресс даже при повторной генерации изображения по одному и тому же описанию — и на самом деле разница видна невооружённым глазом (сравнение представлено ниже). Огромный акцент делается на то, что теперь система максимально точно соответствует запросу и в целом креативит на голову выше предшественника. При этом OpenAI по-прежнему против копирования стилей реальных художников и порнографического контента, ограничения продолжат действовать и в DALL-E 3.
В дополнение ко всем нововведениям в архитектуру DALL-E 3 интегрировали ChatGPT, поэтому чат-бот теперь может выступать в качестве партнёра по быстрой генерации идей или помочь подробно дополнить запрос, чтобы добиться идеального результата. Для отдельной помощи с визуальным ИИ ChatGPT научили генерировать индивидуальные подсказки или вносить правки в уже созданное изображение от DALL-E 3, если кажется, что с ним что-то не так или чего-то не хватает.
Глобальный публичный доступ к DALL-E 3 откроется уже в начале октября, но только по платной подписке ChatGPT Plus (и ChatGPT Enterprise). О бесплатной версии для всех конкретной информации пока нет. Опубликовать API для разработчиков планируется до конца осени. Как и ранее, все изображения, сгенерированные с помощью DALL-E 3, не требуют разрешений или лицензии на распространение и продажу — владелец вправе использовать их, как угодно.
Галерея тестовых картинок DALL-E 3 от OpenAI: