Gemini 3 Pro набрала 130 баллов в IQ-тесте: это больше, чем у 98% людей
Несколько дней назад, 18 ноября, компания Google официально представила новую большую языковую модель Gemini 3, назвав свежую LLM «самой интеллектуальной моделью на текущий момент». И хотя данное заявление звучит весьма помпезно, независимые тесты показывают, что ИИ поискового гиганта действительно демонстрирует впечатляющие результаты. Например, исследователь под ником Haider в социальной сети заявил, что версия модели Gemini 3 Pro набрала в оффлайн-режиме (без подключения к интернету для поиска ответов) IQ-теста целых 130 баллов. Это впечатляющий результат — лишь 2% людей на планете могут набрать в том же тесте столько же или больше баллов.
Для понимания ситуации — среднестатистический человек способен набрать в данном тесте около 100 баллов, тогда как кандидаты наук демонстрируют в IQ-тесте в среднем 120-130 баллов. То есть далеко не каждый кандидат наук способен показать тот же балл, что и Gemini 3 Pro. И лишь единицы на планете могут перешагнуть за отметку в 130 баллов — пока что искусственный интеллект не смог превзойти этих гениев, но, учитывая темпы развития модели Google, это лишь вопрос времени. Впрочем, это ещё не все достижения представленной LLM — в другом тесте Gemini 3 Pro показала ещё более впечатляющий результат.
По данным исследователя, в IQ-тесте Mensa Norway, специализированной версии классического IQ-теста, большая языковая модель нового поколения набрала 142 балла. В мире всего 0,3% людей, которые способны продемонстрировать столь высокий результат. И хотя многие специалисты отмечают, что это впечатляющий прогресс по сравнению с предыдущим поколением (Gemini 2.5 Pro набирала 94 и 110 баллов соответственно), некоторые исследователи считают подобные тесты не совсем правильным подходом для оценки интеллекта моделей.
«IQ-тесты измеряют лишь способность обрабатывать шаблоны, а не реальный интеллект. ИИ с результатом 140+ баллов просто показывает, что он отлично справляется с решением головоломок на время, но это не значит, что он понимает, рассуждает или творит, как люди», — написал Priyal Rathore, ИИ-энтузиаст.
Кроме того, в комментариях под постом исследователя Haider многие пользователи отмечают, что хотя ИИ действительно стал умнее, он всё ещё делает банальные ошибки, которые непозволительны системе с таким высоким уровнем IQ.
А что думаете вы — можно ли считать подобные IQ-тесты подходящим бенчмарком для оценки возможностей ИИ?
