Сегодня, 20 июня, сотрудники компании Anthropic официально представили продвинутую нейросеть Claude 3.5 Sonnet — первую в новом семействе больших языковых моделей с индексом 3.5. Разработчики нейронной сети отмечают, что им удалось существенно повысить планку интеллекта в отрасли, создав ещё больший разрыв по сравнению с основными конкурентами в сегменте. Например, новую версию нейросети существенно «прокачали» в области мышления на уровне знаний бакалавриата, выпускника высшего учебного заведения, а также в вопросах программирования и базовой математики. Стоит напомнить, что ещё предыдущая версия Claude 3 уже обладала приличными преимуществами в этих областях, а теперь модель стала ещё умнее.
Например, новая нейросеть гораздо лучше понимает различные нюансы поданной информации, воспринимает юмор и сложные инструкции, а также может писать достаточно качественный контент естественным языком. Более того, авторы проекта отмечают, что новая версия нейросети оказалась в два раза быстрее Claude 3 Opus — вместе с большей доступностью это делает Claude 3.5 Sonnet идеальным инструментом для решения сложных задач. К примеру, ИИ можно использовать для технической поддержки клиентов в контекстно-зависимых вопросах, для организации различных рабочих процессов и не только.
Но куда интереснее, что новая модель способна обойти по точности ответов даже передовую на текущий момент ChatGPT-4o. Если посмотреть на результаты тестирования, представленные разработчиками Anthropic, то можно заметить, что Claude 3.5 Sonnet решает 59,4% вопросов, связанных со знаниями уровня выпускников высших учебных заведений, тогда как детище OpenAI справляется только с 53,6% вопросов. В случае с написанием кода Claude 3.5 тоже оказалась точнее — 92,0% против 90,2%. И хотя может показаться, что пара процентов не настолько уж и важна, но на самом деле ради этих нескольких процентов разницы в точности ответов компании тратят огромные ресурсы.
Отдельно хотелось бы обратить внимание на точность модели при решении математических задач школьного уровня — 96,4%. Это очень высокий показатель точности, который через два-три поколения вполне может добраться до 99% или даже 100%. А ведь далеко не каждый человек способен на подобные результаты. Кроме того, авторы ИИ существенно прокачали машинное зрение — оно лучше справляется с диаграммами, графиками, точнее расшифровывает текст с изображений и многое другое. Это можно использовать в торговле, логистике, секторе финансовых услуг, программировании. И, что самое приятное, теперь на официальном сайте, где ИИ доступен абсолютно бесплатно, появилось динамическое рабочее пространство.