Mistral представила новую LLM для вайб-кодинга: её можно запустить на RTX-видеокартах
Сегодня, 9 декабря, компания Mistral официально представила Devstral 2 — большую языковую панель, заточенную под программирование, которая доступна в двух версиях. Старшая Devstral 2 предлагает 123 миллиарда параметров и распространяется по модифицированной лицензии MIT, тогда как Devstral Small 2 содержит 24 миллиарда параметров и предлагается на базе расширенной лицензии Apache 2.0. И, как это часто бывает с новыми большими языковыми моделями, LLM демонстрирует впечатляющие результаты в специфических бенчмарках. Например, в SWE-bench Verified полноценная Devstral 2 демонстрирует 72,2% точности — в мире существует всего четыре модели, которые способны её обойти.
И лишь одна, DeepSeek V3.2, относится к моделям с открытыми весами. У Devstral Small 2 результат немного хуже — в том же бенчмарке она набирает 68% точности. С другой стороны, разработчики модели отмечают, что «сжатая» версия LLM демонстрирует результаты, сопоставимые с моделями, превосходящими её по размеру в пять раз или даже более. Это существенное преимущество, особенно с учётом того, что Devstral Small 2 способна работать локально на потребительском оборудовании. То есть любой энтузиаст с достаточно производительным железом может запускать её буквально у себя дома, получая высокое качество генерации контента.
«Devstral 2 (123 миллиарда) и Devstral Small 2 (24 миллиарда) в 5 и 28 раз меньше, чем DeepSeek V3.2, и в 8 и 41 раз меньше, чем Kimi K2. Это доказывает, что компактные модели могут тягаться или даже превосходить гораздо более крупных конкурентов. При этом их уменьшенные размеры позволяют удобно развёртывать новые модели на ограниченном оборудовании, снижая порог входа для разработчиков, малого бизнеса и энтузиастов», — говорится в официальной публикации компании Mistral.
Правда, в рамках прямого сравнения оказалось, что хотя Devstral 2 обходит DeepSeek V3.2 в 42,8% сценариев, тягаться с Claude Sonnet 4.5 новинке всё же проблематично. Это, по мнению разработчиков, указывает на сохраняющееся отставание их решения от моделей с закрытым исходным кодом.
С другой стороны, Devstral Small 2 можно запускать даже на графических процессорах DGX Spark и GeForce RTX, то есть нет необходимости покупать невероятно дорогую систему H100. Да и посредством API стоимость модели довольно низкая — 40 центов за миллион токенов на ввод и 2 доллара за миллион токенов на вывод (в рамках бесплатного периода пользоваться моделью можно бесплатно).

