test adv
,

Сбер «перевёл» нейросеть DALL-E на русский язык: она создаёт картинки по описанию

ИИ учитывает точное описание желаемого объекта и создаёт изображение, которое до этого не существовало, что не под силу поиску

Сбер, он же «Сбербанк России», который превратился из просто банка в технологическую экосистему сервисов, представил свой новый продукт, разработанный командами SberDevices, Sber AI и SberCloud. Это нейросеть, в основу которой легла анонсированная в январе 2021 года DALL-E от OpenAI.

Новая нейросеть от Сбера, получившая имя ruDALL-E, умеет генерировать изображения по запросу на русском языке. Создатели утверждают, что нейросеть постоянно обучается на картинках и текстах и способна создавать неограниченное количество картинок по описанию. Достаточно написать текстовый запрос и получить сгенерированную искусственным интеллектом картинку. Процесс генерации занимает несколько минут. Система самостоятельно создаёт уникальные изображения и объекты, которых никогда не существовало в реальном мире. Их можно использовать, к примеру, для иллюстрации статей или в рекламных целях.

Сбер «перевёл» нейросеть DALL-E на русский язык: она создаёт картинки по описанию
Ёжик в тумане (рисунок ruDALL-E XL)

Создатели ruDALL-E отмечают, что хотели создать мультимодальную нейронную сеть, которая бы изучала концепции в нескольких модальностях, чтобы лучше понимать мир. И, похоже, им это удалось. Отмечается, что это самая большая вычислительная задача в истории России и первая в мире нейросеть для генерации картинок по описанию на русском языке. Обучение модели заняло больше 23 тысяч GPU-часов. Система ruDALL-E включает в себя три нейросети. Первая занимается обработкой запроса и генерацией изображений, вторая — выбирает из них более удачные, а третья — увеличивает картинки в размере без потери качества. Платформа авторегрессивно моделирует токены текста и изображения как единый поток данных. Самая большая обученная модель ruDALL-E Kandinsky XXL с 12 млрд параметров сравнима с оригинальной DALL-E от Open-AI.

Сбер «перевёл» нейросеть DALL-E на русский язык: она создаёт картинки по описанию
Синяя лягушка с пушистым хвостом (рисунок ruDALL-E XXL)

Сбер уже выложил модель ruDALL-E XL с 1,3 млрд параметров в открытый доступ на GitHub. Также в скором времени она вместе с XXL-версией нейросети появится на платформе ML Space.


Последнее изменение:
 
kamyshastiy
kamyshastiy, 2 ноября 2021, 21:45   (...)
Более сложные предложения не понимает и отказывается генерировать.
Ответить
susaru9
susaru9 , 2 ноября 2021, 23:34   (...)
С простыми не лучше
Ответить
AbelPlank
AbelPlank, 3 ноября 2021, 11:19   (...)
Ответить
380687288787
380687288787, 3 ноября 2021, 11:11   (...)
Подождите 55 минут. Прямо, как в настоящем сбере очереди. Или они наняли реальных людей и сами делают изображения 🤔🤔🤔
Ответить
the_komm
the_komm , 3 ноября 2021, 15:15   (...)
55? Он на запрос «автомобиль Tesla Cybertruck» пишет что 78 мин ждать 😹😹😹
Ответить
Alina94
Alina94, 4 ноября 2021, 09:04   (...)
Мне на запрос «мопс» пришлось подождать всего 18 минут
Ответить

Добавить комментарий
Если нужно ответить кому-то конкретно,
лучше нажать на «Ответить» под его комментарием