adblock check

Новый робот находит Уолли за пару секунд

Разработчики используют технологии Google для распознавания лиц персонажа. Механизм уже отлично работает и справляется с задачей

Когда-то давно серия детских журналов «Где Уолли?» (Where’s Waldo?) пользовалась неимоверной популярностью — подрастающему поколению в интересной и доступной форме рассказывали о странах и их достопримечательностях. Неотъемлемым элементом каждого выпуска был разворот с игрой «Где же Уолли?», где вам нужно было среди сотен лиц найти главно героя. Были ещё варианты, где помимо Уолли участвовали ещё и его друзья. Игра получилась довольно трудной — нужно иметь неплохую концентрацию и внимательность, чтобы найти всех персонажей. Благо, теперь есть робот, который может за вас отыскать всех пропавших без вести.

Творческое агенство Redpepper построило робота по имени Уолли (Waldo), который определяет лица персонажей в игре с невероятной точностью. За основу проекта взяли контроллер Raspberry Pi uArm Swift Pro со сканером Vision Camera Kit, установленным на конце механической руки и отвечающим за распознавание лиц. Камера робота фотографирует страницу с игрой, после чего задействуется библиотека алгоритмов компьютерного зрения OpenCV. Технология определяет все возможные варианты лиц, после чего базу отправляют для анализа в Google AutoML Vision. Данный сервис уже «обучили» всеми возможными вариантами фотографий Уолли.

Новый робот находит Уолли за пару секунд

Робот сравнивает фотографию игры и варианты портретов Уолли. Если механизм выдаёт совпадение на 95% или выше, то «железная рука» указывает на необходимого персонажа. Разработчики проекта сообщают, что для «тренировки» робота они использовали лишь информацию, находящуюся в открытом доступе.

Я получил все изображения Уолли через форму поиска Google. Там было 62 фотографии головы персонажа и 45 вариантов с телом. Сначала я решил, что для создания точной модели у меня слишком мало данных, но результаты оказались очень точными. Я был вдохновлён технологией Amazon Rekognition, которая умеет определять лица знаменитостей, и решил попробовать свои силы в любимой игре, — сообщил Мэтт Рид (Matt Reed), сотрудник Redpepper и разработчик робота.

Создатель робота «Уолли» уверяет, что проектировал продукт не для того, чтобы портить впечатления детей от изучения игры. У него была идея продемонстрировать возможности Google AutoML Vision и результат получился весьма достойным. Машине нужно всего 4,45 с для поиска всех Уолли на рисунке, тогда как даже самому внимательному взрослому на это потребуется около десяти-двадцати минут.

columbus columbus
Администратор ⭑
AMD Ryzen 5 1600 AF / RTX 3060 Ti
3 комментария по лайкам по дате
Оставьте комментарий...
Оставьте комментарий...
десяти-двадцати минут? :D