ИИ-модели семейства Mistral 3 с открытым исходным кодом приближаются к крупным конкурентам
Французский стартап Mistral представил новое семейство моделей искусственного интеллекта Mistral 3 с открытым исходным кодом. Компания считает, что способна стать лидером в области общедоступности ИИ и сможет предложить продукт лучше, чем конкуренты с закрытым исходным кодом, созданные технологическими гигантами. По словам сооснователя Mistral Гийом Лампле (Guillaume Lample), изначальное сравнение с эталонными моделями может быть обманчивым. Крупные модели с закрытым исходным кодом работают лучше на первоначальном этапе, но реальный прирост достигается при настройке.
«Во многих случаях вы действительно можете поравняться с моделями с закрытым исходным кодом или даже превзойти их», — заявил сказал Гийом Лампле.
В линейку Mistral 3 входят девять небольших моделей и Mistral Large 3 — самая мощная в семействе. Последняя по некоторым параметрам догоняет GPT-4o и Gemini 2. Mistral Large 3 — одна из первых моделей с открытым исходным кодом, сочетающая в себе мультимодальные и многоязыковые возможности, что ставит её в один ряд с Llama 3 и Qwen3-Omni. Она обладает архитектурой «гранулированной смеси экспертов» с 41 млрд активных и 675 млрд общих параметров, что позволяет обрабатывать большие данные, осуществлять научные вычисления и выступать в качестве ИИ-агента для решения сложных корпоративных задач. Компания позиционирует Large 3 как инструмент для анализа документов, кодирования, создания контента и автоматизации рабочих процессов.
Семейство малых моделей под общим названием Ministral 3 имеет оптимизации для решения разных задач с возможностью автономной работы. Компания предоставляет разработчикам гибкость в подборе моделей под конкретные задачи, независимо от того, нужна ли им чистая производительность, экономическая эффективность или специализированные возможности. Ministral 3 имеют показатели на уровне или выше, чем другие конкуренты с открытым исходным кодом, но при этом модели более эффективные и генерируют меньше токенов для решения одних и тех же задач, обеспечивая наилучшее соотношение цены и производительности.
Ministral 3 могут работать на одном графическом процессоре, что делает их пригодными для развёртывания на доступном оборудовании — от локальных серверов, ноутбуков, роботов и других периферийных устройств. Даже без подключения к интернету.

