2 июля 2026, 13:42

Стажёр Сбера создал языковую модель, которая генерирует текст «пачками» и на 45% быстрее GigaChat

2 июля 2026 года Сбер выложил в опенсорс диффузионную модель GFusion на базе GigaChat. Её разработал стажёр-студент ВШЭ, а генерация ускорена до 45% за счёт параллельной обработки токенов.

Новости / Сбер

Стажёр Сбера создал языковую модель, которая генерирует текст «пачками» и на 45% быстрее GigaChat

Сбер опубликовал в открытом доступе экспериментальную диффузионную языковую модель GFusion и метод её обучения, сообщили редакции Трешбокс.ру в пресс-службе компании. В отличие от классических LLM, которые генерируют текст последовательно — слово за словом, — GFusion сначала создаёт приблизительный «набросок» ответа, а затем пошагово его дорабатывает. Такой подход устраняет жёсткую привязку к порядку слов и позволяет модели самой выбирать, какую часть ответа улучшить на каждом шаге.

Telegram-канал создателя Трешбокса про технологии

Автор проекта — Даниил Тихонов. В момент создания модели он был стажёром в команде фундаментальных моделей Сбера и студентом 4-го курса Факультета компьютерных наук НИУ ВШЭ. Сейчас Даниил успешно защитил диплом и работает в штате банка.

По тестам Сбера GFusion генерирует текст до 45% быстрее GigaChat 3, на основе которого обучалась. Достигается это за счёт того, что токены генерируются не по одному, а сразу пачками. Среди других особенностей модели:

— нелинейная генерация: текст не обязан идти строго слева направо;

— повышенная эффективность обучения: модель может проходить по одному и тому же датасету несколько раз, извлекая больше информации из ограниченного объёма данных.

Вместе с моделью Сбер выложил инструменты для ускорения обучения диффузионных языковых моделей. Это первый такой опенсорс-проект в России, утверждают в компании. Кроме того, команда внесла изменения в SGLang — популярный опенсорс-инструмент для запуска языковых моделей, — добавив в него поддержку GFusion и нового алгоритма генерации, который улучшает качество любых dLLM.

«Диффузионные модели лучше структурируют ответы и могут генерировать текст непоследовательно, самостоятельно выбирая порядок написания. Они эффективнее используют ограниченный объём данных при обучении. Это пока открытое направление, и мы надеемся, что GFusion даст другим командам рабочую точку отсчёта», — прокомментировал Даниил Тихонов.

В Сбере отмечают, что активное развитие диффузионных языковых моделей идёт с конца 2025 года. Сегодня такие модели уже применяются для автодополнения кода в реальном времени, агентных сценариев и в приложениях, критичных к задержкам. Приоритетной задачей остаётся выведение качества ответов и способности к рассуждению на уровень классических LLM.

···

Последнее изменение:
2 июля 2026, 13:42

Максим Черкасов

@Astramak

Шеф-редактор

Раз в пару лет перехожу с айфона на андроид и наоборот

🇷🇺Mi A1 Dota 2 enjoyer Exeed LX

2 комментария по лайкам по дате

Оставьте комментарий...

pugov268 3 недели

Сбер в последнее время заметно усилил направление ии. Если даже стажёры делают такие разработки, значит, внутри компании действительно сильная школа.

Ответить

Limows 3 недели

Консольщик

Быстрее не значит лучше. Пока что качество ответов и текстов, связанных с технической областью, оставляет желать лучшего. Но это проблема многих моделей.

Ответить