Исследователи из Массачусетского технологического института (MIT) сообщили о создании нового метода генерации изображений по текстовому описанию, который назвали «дистилляция с согласованным распределением» (distribution matching distillation). Утверждается, что он в 30 раз быстрее популярных нынче генеративных ИИ-моделей для создания картинок.
Существующие нейронные сети основаны на технике «диффузия». Принцип её действия очень прост. На начальном этапе создаётся очень размытое изображение, а далее с каждым шагом оно детализируется до максимально возможного качества. Данный метод занимает сравнительно много времени, поэтому учёные MIT поставили перед собой цель — ускорить этот процесс.
Новый метод генерирует изображение в один проход, что намного быстрее, чем 30–50 проходов, которые характерны для современных диффузных нейросетей. Так, например, ИИ-модель Stable Diffusion создаёт изображение по запросу пользователя в среднем за 1,5 секунды. У метода DMD на это уходит 0,05 секунды.
Результаты своей работы исследовали MIT продемонстрировали на видео:
На данном этапе DMD — это разработка, которая не добралась до коммерческого продукта. Вероятнее всего, на это потребуется ещё какое-то время.