adblock check

Алиса AI научилась без ошибок генерировать изображения с надписями на русском языке

Более того, разработчики тренировали нейросеть, чтобы она лучше понимала русский культурный код. Это положительно скажется на качестве генерации
Обложка: Яндекс

Ни для кого не секрет, что генеративные модели искусственного интеллекта весьма посредственно справляются с созданием текстового контента, особенно на русском языке. Всё дело в том, что LLM обычно обучаются на открытых датасетах, в которых русский язык не представлен вовсе или представлен на очень низком уровне. Соответственно, представители компании Яндекс решили эту проблему свести на нет — теперь ИИ-ассистент Алиса AI использует для создания изображений обновлённую большую языковую модель Alice AI ART, которую компания обучила на собственном масштабном датасете. В результате пользователи получили возможность создавать постеры, афиши, открытки и многое другое с надписями на русском языке практически без ошибок.

Представители компании рассказали, что для обучения своей модели в стенах Яндекса был создан датасет изображений с надписями на русском языке и детальной разметкой текста. Более того, компания изменила архитектуру своей модели, что в итоге позволило российской нейросети в три раза чаще генерировать изображения без ошибок или нечитаемых букв.

«Для этого достаточно использовать простые приёмы: заключать текст в кавычки, писать сложные слова заглавными буквами, разбивать длинные надписи на более короткие фразы», — объяснили представители компании Яндекс.

Но это ещё не всё — также разработчикам удалось повысить качество генерации изображений примерно на треть. Теперь ИИ выдаёт меньше картинок с визуальными искажениями, плюс нейросеть гораздо лучше понимает русский культурный код. Для этого, если верить пресс-релизу компании, нейросеть обучали на русскоязычных промптах.

«Например, если написать в чате с Алисой AI „Изобрази русский народный ансамбль”, нейросеть создаст изображение с гармонистами и балалаечниками, а по запросу „Традиционный русский праздничный стол” — картинку с икрой, соленьями и самоваром. Если попросить Алису AI создать иллюстрацию на космическую тему, модель добавит на картинку российских космонавтов», — сообщили представители Яндекса.

Примечательно, что ИИ после апдейта заинтересует в том числе бизнес — можно создавать изображения для карточек товаров, лендинги, брошюры и так далее.

Источник

ИИ ИИ
17K участников
Вступить
2 комментария по лайкам по дате
Оставьте комментарий...
Оставьте комментарий...
LuckyBoy
Не знаю насчёт остальных, но Gemini давно всё прекрасно умеет, и, имхо, результат лучше, чем на превью у Алисы. Это, конечно, круто, что допиливают отечественный продукт, но громкие заявления и попытки выдать желаемое за действительное — скорее отталкивают.
columbus
3 недели
Фанат Хогвартса
Автор
ChatGPT тоже умеет, да, но ошибки случаются довольно часто, особенно если речь идёт о мелком тексте или тексте, расположенном на каких-то поверхностях
есть надежда, что у новой Алисы с этим получше
но, в любом случае, конкуренция это круто