Генеративный чат-бот ChatGPT в очередной раз получает обновление удивительных масштабов и снова поднимает планку для конкурентов. Однако не только он оказался главным достоянием прошедшей конференции DevDay 2023, которая, что весьма примечательно, стала первым подобным мероприятием за восьмилетнюю историю развития компании OpenAI. Ведущий разработчик систем искусственного интеллекта представил десятки мощных улучшений для основной линейки фирменных нейросетей и объявил об организации целого рынка кастомных GPT-решений от сторонних разработчиков.
Анонсов оказалось неожиданно много, поэтому совсем скоро индустрия ИИ сделает ещё один огромный шаг в будущее.
GPT-4 Turbo
Оригинальную языковую модель GPT-4 добавили в платную подписку ChatGPT Plus в марте и развернули для разработчиков в июле. Всего 3 месяца спустя OpenAI начинает обкатывать предварительную версию следующего поколения флагманской технологии — GPT-4 Turbo. База для обучения (открытые данные из интернета и мировые события) актуализирована и теперь датируется апрелем 2023 года. Оптимизация производительности также позволила значительно снизить цены за токен (относительно начальной конфигурации GPT-4).
Нововведения GPT-4 Turbo:
- крупнейшее контекстное окно — 128 000 токенов (объём одного запроса, эквивалентный 300 страницам текста);
- выполнение нескольких действий в рамках одного запроса (для функций приложения или внешних API-интерфейсов);
- улучшенное соответствие инструкциям в таких случаях, как генерация определённых форматов (например, «всегда отвечать в формате XML»);
- режим JSON с возможностью ограничивать выходные данные, гарантирующий генерацию синтаксически корректного объекта JSON;
- усовершенствованная точность и удвоенная скорость.
Входные токены GPT-4 Turbo в 3 раза дешевле GPT-4 с контекстным окном на 8 тыс. токенов (0,01 доллара вместо 0,03 доллара). Выходные токены в 2 раза дешевле (0,03 доллара вместо 0,06 доллара). Для сравнения, GPT-4 с 32 тыс. токенов оценена в 0,06 доллара и 0,12 доллара соответственно. Релиз стабильной модели GPT-4 Turbo, готовой к массовому внедрению, состоится в ближайшие недели.
GPT-3.5 Turbo
Модернизированная нейросеть GPT-3.5 Turbo теперь способна обрабатывать более длинные запросы — контекстное окно по умолчанию расширено до 16 385 токенов (ранее было 4 096 токенов). Более того, для промежуточной модели тоже реализовали поддержку ключевых возможностей GPT-4 Turbo, в том числе выполнение нескольких действий в рамках одного запроса, улучшенное соответствие инструкциям и режим JSON. Качество форматирования при генерации JSON, XML и YAML повысилось на 38%.
Входные токены GPT-3.5 Turbo в 3 раза дешевле предыдущей GPT-3.5 Turbo (0,001 доллара вместо 0,003 доллара). Выходные токены в 2 раза дешевле (0,002 доллара вместо 0,004 доллара). Приложения, использующие старую модель GPT-3.5 Turbo, будут автоматически обновлены 11 декабря.
ИИ для автоматизации приложений
API Assistants — специальный ИИ, позволяющий упростить разработку приложений с функциями чат-бота. Инструмент помогает легко интегрировать ИИ-технологии OpenAI, чтобы автоматизировать сложные задачи. Например, разработчики могут настроить взаимодействие с нейросетями GPT и включить интерпретатор кода (пишет и запускает код на Python в изолированной среде, генерирует графики, диаграммы, СSV-таблицы, PDF-документы и обрабатывает файлы с различными данными и форматированием).
Ключевым удобством API Assistants называются постоянные и бесконечные цепочки запросов с уточнениями контекста в автономных окнах. По сути они снимают ограничения стандартного объёма — с помощью API Assistants к существующему сообщению просто добавляется дополнительный тред. Среди прочего, ИИ умеет обращаться к конкретным функциям приложения и встраивать ответ от них прямо в чат, а поиск можно сделать интеллектуальным по методике ChatGPT.
API Assistants находится на этапе бета-тестирования и доступен к ознакомлению в виде онлайн-платформы без необходимости написания кода.
Свободная генерация изображений через DALL-E 3
Теперь любой желающий разработчик имеет право интегрировать в собственные приложения и продукты графическую нейросеть DALL-E 3, которая недавно появилась в ChatGPT Plus и у корпоративных пользователей ChatGPT Enterprise. Официальный API Images на основе DALL-E 3 уже успешно применяют для своих клиентов и рекламных материалов такие компании, как Snap, Coca-Cola и Shutterstock. OpenAI предлагает множество форматов и вариантов разрешения по цене от 0,04 доллара за одну картинку.
Преобразование текста в речь
API TTS (Text-to-speech) превращает текст в естественную человекоподобную речь. Новая модель ИИ-преобразователя содержит 6 предустановленных образцов голоса на выбор. Есть две модификации — tts-1 (работает в режиме реального времени) и tts-1-hd (оптимизирована для генерации максимально реалистичного голоса). Цена начинается от 0,015 доллара за 1000 символов.
Магазин GPT и конструктор чат-ботов
- GPT — редактор ChatGPT от OpenAI, простой способ создания индивидуальной версии чат-бота для дома, работы, учёбы, творчества или персональных направлений с желаемой комбинацией навыков, только для себя, для внутреннего использования в компании или для всех. Можно задать преимущественную функциональность: поиск в интернете, генерация изображений или анализ данных. Знания кодинга не требуются. Доступен на chat.openai.com/create по подписке ChatGPT Plus и ChatGPT Enterprise.
- Магазин GPT — пользователи теперь могут самостоятельно придумывать уникальные ChatGPT и делиться ими публично. Маркетплейс кастомных чат-ботов с лучшими концепциями откроется в ноябре, отдельно будут выделены категории «производительность», «образование» и «для удовольствия». OpenAI обещает заработок авторам самых популярных GPT-проектов.
- Защита — OpenAI взяла на себя обязательство полноценно защищать корпоративных клиентов. В случае судебного иска о нарушении авторских прав ответственной стороной выступит компания, клиентам обеспечат юридическую поддержку и оплату понесённых расходов по программе Copyright Shield. С этого момента она распространяется на общедоступные функции ChatGPT Enterprise и платформу для разработчиков.