24 марта 2024, 14:44

Учёные из MIT разработали новый метод генерации изображений: он в 30 раз быстрее существующих

Новый метод под названием Distribution Matching Distillation способен сгенерировать изображение всего за 0,05 секунды

Исследователи из Массачусетского технологического института (MIT) сообщили о создании нового метода генерации изображений по текстовому описанию, который назвали «дистилляция с согласованным распределением» (distribution matching distillation). Утверждается, что он в 30 раз быстрее популярных нынче генеративных ИИ-моделей для создания картинок.

Подписывайтесь на Telegram-канал про технологии

Существующие нейронные сети основаны на технике «диффузия». Принцип её действия очень прост. На начальном этапе создаётся очень размытое изображение, а далее с каждым шагом оно детализируется до максимально возможного качества. Данный метод занимает сравнительно много времени, поэтому учёные MIT поставили перед собой цель — ускорить этот процесс.

Новый метод генерирует изображение в один проход, что намного быстрее, чем 30–50 проходов, которые характерны для современных диффузных нейросетей. Так, например, ИИ-модель Stable Diffusion создаёт изображение по запросу пользователя в среднем за 1,5 секунды. У метода DMD на это уходит 0,05 секунды.

Результаты своей работы исследовали MIT продемонстрировали на видео:

https://youtu.be/3vo6mzk9K4s

На данном этапе DMD — это разработка, которая не добралась до коммерческого продукта. Вероятнее всего, на это потребуется ещё какое-то время.

···

Последнее изменение:
24 марта 2024, 14:44