OpenAI представила GPT-5.2: модель для быстрых ответов и сложных задач
Вчера, 11 декабря, компания OpenAI официально представила большую языковую модель GPT-5.2, которая, по данным разработчика, является «самой функциональной моделью для профессиональной работы». Стоит отметить, что данная модель представлена в трёх версиях — Instant, Thinking и Pro. Instant, о чём нетрудно догадаться из названия, предназначена для быстрых ответов, генерации текстового контента или поиска нужных пользователю данных. Версия модели Thinking оптимальна для программирования, рефакторинга кода и прочих задач, требующих размышления и структурированного выполнения задания, а версия Pro лучше всего подходит для наиболее сложных задач.
В OpenAI вновь заявили, что применение технологий на базе искусственного интеллекта в корпоративном секторе по подписке ChatGPT Enterprise экономит специалисту от 40 до 60 минут в день, а активные пользователи чат-бота экономят свыше 10 часов в неделю, выполняя больше работы за то же время. И GPT-5.2, по словам бренда, разработали специально для того, чтобы повысить экономическую выгоду для различного рода специалистов. Например, теперь ИИ лучше справляется с генерацией электронных таблицы, подготовкой презентаций, написанием кода, распознаванием изображений, пониманием длинного контекста и всем в таком духе.
Также стоит отметить, что в бенчмарке GDPval, новой метрике, которая создана OpenAI и оценивает возможности LLM в рамках прикладных задач из 44 профессий, GPT-5.2 даёт точные ответы в 70,9% сценариев. Стоит отметить, что GPT-5.1, которая вышла менее месяца назад, в том же бенчмарке набирает всего 38,8%. То есть компания сделала упор на прокачку тех направлений чат-бота, которые позволяют выполнять рутинные задачи с более высоким качеством финального ответа, что очень ценится в корпоративном секторе и, вероятно, позволяет лучше продавать подписку на ChatGPT Enterprise.
При этом в остальных бенчмарках прирост точности от поколения к поколению не такой уж значительный. Например, в SWE-Bench Pro модель GPT-5.2 опережает предшественника всего на 4,8%, а в SWE-bench Verified — на 3,7%. В рамках бенчмарка GPQA Diamond с научными вопросами новинку прокачали с 88,1% до 92,4%, а в некоторых бенчмарках разница и того меньше. Впрочем, так как это минорное обновление, такой подход вполне ожидаем.
Разворачивать GPT-5.2 Instant, Thinking и Pro в рамках ChatGPT компания начинает уже сегодня, но только для владельцев платной подписки. Информации о том, когда GPT-5.2 появится на бесплатных аккаунтах, пока что нет.



