Вчера, 19 мая, компания Google официально представила Gemini 3.5 — новейшее семейство больших языковых моделей, при разработке которых поисковой гигант сделал ставку на эффективность и агентские возможности. Примечательно, что релиз данного семейства LLM компания решила начать с Gemini 3.5 Flash — наиболее лёгкой версии большой языковой модели.
«Она обеспечивает наиболее продвинутые возможности для ИИ-агентов и задач в области программирования, прекрасно справляясь со сложными задачами с длительным горизонтом планирования», — заявили представители Google.
Ключевое преимущество Gemini 3.5 Flash в том, что данная модель обеспечивает возможности, сопоставимые с крупными флагманскими моделями, но с гораздо более высокой скоростью генерации токенов (собственно, в этом и заключается основная фишка Flash-версий моделей). В Google даже заявили, что если рассматривать количество выходных токенов в секунду, данная модель в четыре раза быстрее, чем другие топовые модели на рынке. Это действительно впечатляющий результат, тем более, что в большинстве бенчмарков Gemini 3.5 Flash обходит Gemini 3.1 Pro.
Это особенно заметно в бенчмарках, заточенных на программировании. В Terminal-Bench 2.1 новейшая модель набирает 76,2% точности, тогда как Gemini 3 Flash демонстрирует всего 58%, а Gemini 3.1 Pro выдаёт 70,3%. Правда, стоит отметить, что GPT-5.5 находится впереди новинки — модель OpenAI набирает в том же тесте 78,2%. И, естественно, разработчики делают особый акцент на том, что эта модель отлично подходит для агентских функций — Gemini 3.5 Flash способна справляться с решением долгосрочных задач, на которые ранее у пользователей уходили дни или целые недели. И, что немаловажно, теперь именно эта модель используется по умолчанию в приложении Gemini и в режиме ИИ-поиска Google.
