adblock check

OpenAI представила GPT-5.4 — ИИ-модель, которая умеет работать с компьютером через интерфейс

Искусственный интеллект научился нажимать кнопочки в пользовательским интерфейсе, заполнять формы и работать со снимками экрана
Обложка: OpenAI

Компания OpenAI официально представила новую флагманскую ИИ-модель — GPT-5.4. Она призвана заменить сразу две модели: кодерскую GPT-5.3-Codex и универсальную GPT-5.2. Отмечается, что GPT-5.4 является самой токеноэффективной моделью, так как тратит минимум токенов (единица обработки данных для моделей ИИ) для решения тех же задач, что и предшественники.

Ключевой особенностью новой модели стал встроенный computer use. GPT-5.4 научился взаимодействовать с приложениями через интерфейс — он без проблем заполнит любую форму, нажмёт на кнопку или переключатель, а также проверит результат таких действий. До этого момента подобный функционал был доступен исключительно в экспериментальных версиях.

Ещё одно нововведение — tool search. ИИ-модель теперь подгружает определения инструментов по запросу, а не передаёт все сразу. На практике это означает использование меньшего числа токенов, а также возможность выбора более точного инструмента в агентских задачах.

И именно в агентских задачах GPT-5.4 показал рост по результатам тестирования в бенчмарках. Так, например, в OSWorld-Verified его результат составил 75% против 47,3% у GPT-5.2. В BrowseComp — 82,7% против 65,8%, а в GDPval — 83% против 70,9%.

OpenAI представила GPT-5.4 — ИИ-модель, которая умеет работать с компьютером через интерфейс

Разработчики решили не ограничивать новую ИИ-модель в возможностях мышления, и установили уровень xhigh — это режим экстремального мышления, когда искусственный интеллекта тратит значительно больше ресурсов на решение сложных задач. Сообщается, что доля ложных утверждения сократилась на 33%, а доля ответов с ошибками снизилась на 18%.

GPT-5.4 получила поддержку компакции, то есть в ходе выполнения многошаговых задач ИИ-модель выполняет сжатие контекста, чтобы не терять ключевую информацию. Также надо отметить, что GPT-5.4 Thinking перед выполнением сложного запроса показывает план работы пользователю, чтобы тот смог скорректировать его по своему усмотрению.

GPT-5.4 стала дефолтной моделью и в API, и в Codex. Отмечается рост цены в API — 2,50 доллара США за миллион входных токенов и 15 долларов США за миллион выходных.

Источник

ИИ ИИ
15,4K участников
Вступить
Комментариев пока нет
Оставьте комментарий...
Оставьте комментарий...