ByteDance выпустила серию больших языковых моделей Seed 2.0: они готовы к эре ИИ-агентов
Сегодня, 14 февраля, компания ByteDance, разработчик платформы вертикальных видео TikTok, официально представила новую серию больших языковых моделей под названием Seed 2.0. Представители гиганта заявили, что данные LLM создавались и оптимизировались для решения сложных задач, актуальных в реальном мире, а также для использования в крупномасштабных производственных условиях.
«Анализируя использование модели Seed в сервисах MaaS, мы обнаружили, что наибольшая доля запросов приходится на обработку информационного контента, содержащего неструктурированную информацию. Предприятиям требуется, чтобы модель сначала выполняла задачи, требующие «чтения и размышлений», прежде чем переходить к сложному процессу работы», — объяснили представители компании.
И чтобы удовлетворить актуальные запросы пользователей, серия Seed 2.0 была оптимизирована по трём ключевым направлениям. Во-первых, разработчики сделали акцент на более глубоком визуальном и мультимодальном понимании контента — было значительно повышено качество анализа сложных документов, таблиц, графиков, видеоконтента, плюс визуальная обработка информации стала более точной. Во-вторых, в Seed 2.0 разработчики сделали упор на более точном выполнении сложных инструкций — задачи с множественными ограничениями и длинными цепочками действий выполняются гораздо лучше. В теории, так как ошибок у ИИ будет меньше, это должно положительно сказаться на эффективности моделей.
И, в-третьих, серия Seed 2.0 состоит из трёх моделей, отличающихся по размеру — речь о самой компактной Mini, Lite и крупной Pro. Кроме того, для программирования была выпущена специальная версия Code, которая оптимизирована под задачи разработчиков. Соответственно, пользователь может подобрать подходящую ему версию модели исходя из конкретных задач и возможностей — кому-то будет достаточно и небольшой версии Mini, а кому-то для тяжёлых сценариев пригодится Pro-модификация. Последняя, что весьма ожидаемо, демонстрирует впечатляющие показатели в популярных бенчмарках.
Например, в математических бенчмарках MathVista и MathVision модель Seed 2.0 Pro набирает 89,8 и 88,8 балла соответственно, тогда как GPT-5.2 High набирает всего 83,1 и 86,8 балла. Конкурировать с новинкой из Китая в этой области может лишь Gemini 3 Pro High. Да и по остальным направлениям показатели у новой модели очень достойные — на уровне или лучше ИИ-гигантов из США.



