30 сентября 2025, 14:39

DeepSeek придумал необычную оптимизацию ИИ: новая модель V3.2 выбирает только важное из запроса

Новый подход с так называемым «рассеянным вниманием» делает работу с длинным контекстом вдвое дешевле и быстрее. При этом качество остаётся на высоком уровне

Новости / ИИ

DeepSeek придумал необычную оптимизацию ИИ: новая модель V3.2 выбирает только важное из запроса

Solen Feyissa, Unsplash

Разработчики DeepSeek представили новую экспериментальную модель V3.2-exp, созданную для существенной экономии на обслуживание ИИ. Она почти вдвое снижает затраты на вывод информации при использовании в сценариях с длинным контекстом. Ключевой особенностью новой модели является механизм DeepSeek Sparse Attention — система фильтрации, которая выбирает наиболее важное из контекста без потери качества ответов.

Telegram-канал создателя Трешбокса про технологии

DeepSeek V3.2-exp, по сути, использует модуль «молниеносный индексатор» для приоритизации определённых фрагментов из контекстного окна. После этого система точного выбора токенов выбирает из этих фрагментов определённые токены для загрузки в ограниченное окно внимания модуля. Всё это в совокупности позволяет Sparse Attention работать с большими фрагментами контекста при сравнительно небольшой нагрузке на сервер. Для операций с длинным контекстом преимущества системы весьма существенны. Предварительное тестирование DeepSeek показало, что стоимость простого вызова API может быть снижена вдвое. Для более надёжной оценки потребуются дополнительные тестирования.

Новая модель DeepSeek — одна из тех, что направлены на решение проблемы затрат на работу предварительно обученной ИИ-модели. В бенчмарках она не уступает предыдущей версии, а в тестах на рассуждение и кодирование разница совсем незначительная. Модель работает в 2-3 раза быстрее, меньше потребляет память и вдвое эффективнее. Такой подход с «рассеянным вниманием» может подтолкнуть других разработчиков взять на вооружение этот приём, чтобы снизить затраты на обслуживание ИИ.

Источник

···

Последнее изменение:
1 октября 2025, 21:41

Svidetel Автор

ИИ

13,5K участников

Вступить

5 комментариев по лайкам по дате

Оставьте комментарий...

Genshin_Infarkt 1 месяц

Вот мы и дожили до того момента, когда даже искусственный интеллект ленится читать текст полностью. Скоро нейронам буду использовать другие более тупые нейронк, чтобы не читать самим весь текст, а читать только пересказ текста.

И это шутка только наполовину, потому что новая Клауди 4.5 от Антропик уже научилась определять, когда ее тестируют в бенчмарках, и подгонять свои ответы именно под бенчмарк

Ответить