Идея ИИ-агентов, которые могут выполнять различные задачи с реальными приложениями за пользователя, обсуждаются уже достаточно давно, и вчера, 17 июля, компания OpenAI совершила значительный прорыв в данном направлении, представив агента ChatGPT.
Соответственно, теперь пользователь чат-бота может попросить систему проверить свой календарь и сообщить о предстоящих встречах с клиентами, спланировать и купить ингредиенты для ужина на четверых персон, проанализировать данные трёх конкурентов, создав на основе этой информации презентацию, и многое другое. В процессе ChatGPT будет перемещаться по веб-сайтам, фильтровать результаты, редактировать слайды и таблицы, запускать код и не только.
Представители компании OpenAI заявили, что ChatGPT выполняет все эти задачи при помощи своего собственного виртуального компьютера, плавно переключаясь между процессами рассуждений и действиями, дабы обрабатывать сложные рабочие процессы от начала и до конца, полностью следуя инструкциям пользователя.
При этом владелец системы всё время имеет возможность полностью контролировать процесс выполнения поставленной задачи — ChatGPT будет запрашивать разрешение перед тем, как предпринять какие-то важные действия, и пользователь всегда может прервать искусственный интеллект, взяв управление браузером или другой задачей в свои руки. Впрочем, ИИ и сам неплохо справляется с сёрфингом в интернете.
«Теперь наша модель может активно взаимодействовать с веб-сайтами — нажимать на ссылки, фильтровать информацию и собирать более точные данные», — заявили в компании OpenAI.
Более того, в определённых сценариях ИИ-агент может предложить подключить аккаунты от Gmail или GitHub, дабы искать информацию, которая будет более релевантна запросам пользователя, а затем использовать полученные данные в своих ответах.
«ИИ может собирать информацию о вашем календаре через API, эффективно обрабатывать большие объёмы текста посредством текстового браузера и визуально взаимодействовать с браузерами, которые изначально были созданы для людей», — цитата из официального пресс-релиза.
Правда, пока что нововведение доступно только пользователям чат-бота с платной подпиской Pro, Plus и Team, плюс разработчики отмечают, что новый ИИ-агент — лишь начало пути. В будущем, скорее всего, он получит гораздо больше возможностей и интеграций с различными сервисами.