OpenAI представила модель GPT-5.3-Codex: она помогала в разработке самой себя
Вчера, 5 февраля, компания OpenAI официально представила свою новую большую языковую модель GPT-5.3-Codex, которая, по словам представителей ИИ-гиганта, является самой мощной на сегодняшний день агентской ИИ-моделью в вопросах программирования. В компании рассказали, что LLM объединила передовые возможности в области написания кода модели GPT-5.2-Codex с возможностями GPT-5.2 в области рассуждений и профессиональных знаний. И, что довольно примечательно, в результате новинка может выполнять те же задачи, что и вышеперечисленные модели, только на 25% быстрее.
Но куда интереснее, что GPT-5.3-Codex является первой моделью в арсенале OpenAI, которая сыграла решающую роль в своей же разработке. В официальном блоге представители бренда заявили, что команда Codex использовала ранние версии этой модели для отладки процессов обучения, управления развёртыванием LLM и диагностики результатов тестирования.
«С GPT-5.3-Codex платформа Codex превращается из агента, способного писать и проверять код, в агента, который может делать практически всё, что и разработчики на своём компьютере», — говорится в официальном пресс-релизе компании OpenAI.
И, естественно, новая модель демонстрирует впечатляющие результаты в области написания кода. Например, в бенчмарке SWE-Bench Pro, в котором проверяются возможности ИИ в разрезе реальных задач разработки программного обеспечения, GPT-5.3-Codex демонстрирует наилучшие результаты среди моделей OpenAI. Примечательно, что Anthropic, например, на релизе Claude Opus 4.6 выпустила графики, показав в том числе сравнение с моделями Google и OpenAI, тогда как сама OpenAI сравнивать GPT-5.3-Codex с конкурентами не стала.
Аналогичная ситуация наблюдается в бенчмарке Terminal-Bench 2.0 — новая модель работает с терминалом лучше и тратить меньше токенов, но сравнения с конкурентами нет.
Кроме того, представители компании заявили, что GPT-5.3-Codex лучше понимает запросы пользователей в процессе создания сайтов по сравнению с GPT-5.2-Codex.
«Простые или недостаточно детализированные запросы теперь по умолчанию приводят к генерации сайтов с большим набором функций и настроек», — говорится в блоге компании.
Также новая модель может создавать игры, писать документацию, редактировать текстовый контент, собирать и анализировать различные метрики и многое другое. Но, судя по всему, это скорее минорный апдейт модели, нежели какой-то прорыв.

