adblock check

Продвинутый ИИ OpenAI обманули при помощи ручки и бумаги

Продвинутая система, способная распознать почти любой объект на фото, ломается из-за стикеров с надписями

Современные технологии вывели так называемый искусственный интеллект на совершенно новый уровень — OpenAI легко обыгрывает гроссмейстеров в шахматы и Го, побеждает киберспортсменов в Dota 2, умеет с лёгкостью распознавать объекты на фотографиях. Например, можно показать OpenAI фотографию яблока, и ИИ сможет не только распознать фрукт, но и при определённых условиях назвать сорт яблока. Но, с другой стороны, машинное зрение можно легко обмануть при помощи листа бумаги и ручки — этого предостаточно, чтобы все труды ведущих инженеров мира по распознаванию объектов на изображении пошли прахом.

Очень простой пример с яблоком — сначала OpenAI показывают фотографию яблока на подставке, и ИИ с точностью в 85,6% определяет на изображении именно яблоко. Но стоит приклеить на то же яблоко стикер с надписью «iPod», чтобы машинное зрение распознало на изображении именно iPod, а не яблоко со стикером. Аналогичным образом поступили с изображением собаки — на оригинальном фото OpenAI определяет пуделя, но стоит добавить поверх фото изображения знака доллара, как машинное зрение путается, определяя свинку-копилку. Связано это, естественно, с умением искусственного интеллекта распознавать текст.

Данный тип ошибки называется «типографическим» — из-за того, что ИИ отлично распознаёт текст, даже рукописный, отдавая предпочтение данной информации, сбить механизм определения объектов очень легко. Машина просто не может понять, что перед ней именно яблоко с надписью, а не сама надпись. И, если верить создателям OpenAI, решить данную проблему куда сложнее, чем ошибку, связанную с распознаванием объектов с шумами на изображении. Видимо, при всей продвинутости искусственного интеллекта и развитости машинного зрения, технология ещё требует множества доработок.

columbus columbus
Администратор ⭑
3 комментария по лайкам по дате
Оставьте комментарий...
Оставьте комментарий...
Cash-in-sky 3 года
Пишешь на лбу, например, «КОТ» и все камеры в метро и улицах города тебя распознают, как кота)))
columbus 3 года
Автор
Попробуй, потом напишешь статью)))
Cash-in-sky 3 года
Не смогу проверить, у меня нет доступа к системе распознавания, и результат будет неизвестен. Хотя разработчикам проверить стоит.