Специалисты из американской компании Vicarious, специализирующейся на работе с искусственным интеллектом, создали новый механизм машинного обучения — рекурсивную корковую сеть (Recursive Cortical Network, RCN). Она использует иной принцип распознавания объектов, нежели прочие современные алгоритмы обучения ИИ, что позволило обойти текстовую капчу различных сервисов с успехом до 66,6%.
Изначальной целью ученых из Vicarious являлось создание искусственного интеллекта, который сможет рассуждать подобно человеку.
«Прохождение капчи стало главным испытанием для нашего искусственного интеллекта, потому что лишь этот тест показывает, способен ли компьютер рассуждать так же, как человеческий мозг, — говорит Дилип Джордж (Dileep George), соучредитель компании Vicarious.
Современные алгоритмы распознавания объектов на изображениях учатся по технике, называемой глубоким обучением. Искусственному интеллекту многократно (сотни тысяч раз) показывают один и тот же объект, слегка видоизменяя его от примера к примеру. Во время работы по поиску предметов на изображении «цифровой мозг» ищет на картинке объекты, похожие на те, что ему показывали ранее. Такой метод обучения годится для распознавания текста на чистом листе бумаги, но для прохождения текстовой капчи (где специально добавлены различные отвлекающие объекты в виде полупрозрачных полос и прочих шумов) он непригоден.
«Глубокое обучение лишь отчасти имитирует работу человеческого мозга, — заявляет Дилип Джордж. — Разумеется, человек может учиться на примерах. Но ребенку не нужно видеть огромное количество раз какого-либо персонажа, чтобы запомнить и суметь распознать его в дальнейшем».
Человек способен создавать в уме модель того или иного объекта, после чего сравнивать свое представление о данном объекте с тем, что видит. Именно это и использует разработанная учеными рекурсивная корковая сеть. Искусственный интеллект нового типа имеет собственное представление о том, как должен выглядеть определенный символ (в контексте решения капчи). И когда он решает компьютерный тест, его алгоритм идентифицирует все контуры изображенных букв, их глубину, фон и тому подобное. Далее ИИ пытается объяснить сам себе, что он увидел, сравнивая с уже имеющимися моделями всех символов. Такая техника позволяет распознавать буквы и цифры даже тогда, когда они расположены слишком близко и перекрывают части друг друга.
Ниже указаны сервисы и процент успеха, с которым искусственный интеллект распознал используемые ими капчи:
- reCAPTCHA — 66,6%.
- BotDetect — 64,4%.
- Yahoo — 57,4%.
- PayPal — 57,1%.
Капча считается неэффективной, если компьютерная программа может пройти ее более чем в 1% случаях.
Как заявил Дилип Джордж, ученые научили искусственный интеллект проходить капчи лишь в благих намерениях. Вероятнее всего, их работа не попадет в руки злоумышленников. К тому же, помимо легкой для ИИ текстовой капчи есть и другие виды защиты: составление простой мозаики, разгадывание несложной загадки, аудиокапча и прочие.
Исследование подробно описано в журнале Science.