11 сентября 2021, 08:08

Компьютерное зрение против человеческого: чем отличаются и когда одно лучше другого

И человеческое, и компьютерное зрение нужны для идентификации объектов. Но на этом их сходства, по большому счёту, заканчиваются

Статьи / ИИ

Компьютерное зрение против человеческого: чем отличаются и когда одно лучше другого

Что собой представляет компьютерное зрение? Это — направление в развитии технологий, которые могут самостоятельно обнаруживать объекты окружающего мира, а также определять их тип и классифицировать по категориям. Чтобы всё это стало реальностью, создаются нейронные сети, которые обучают для конкретных целей. Сценариев для использования компьютерного зрения масса. Это, к примеру, и промышленные роботы, которые выполняют задачи на производстве. Оно также применяется в видеонаблюдении, дополненной реальности и даже современных смартфонах — в системах вычислительной фотографии.

Telegram-канал создателя Трешбокса про технологии

В тему: Почему смартфоны снимают на уровне фотоаппаратов, или что такое вычислительная фотография

Как и человеческое, компьютерное зрение, в первую очередь, предназначено для идентификации объектов. Вот только на этом сходство двух этих систем фактически заканчивается. Чтобы лучше понять, как работают обе, нужно разобраться во всём многообразии их различий — максимально простым языком.

Содержание

Как устроено человеческое зрение

Как устроено компьютерное зрение

Чем компьютерное зрение отличается от человеческого

Как устроено человеческое зрение

Строение каждого из человеческих глаз

Человеческое зрение — стандартная функция любого из представителей нашего биологического вида. Чтобы видеть, этому не нужно долго и упорно учиться. Его работа основана на взаимодействии со светом. Сначала он отталкивается от объекта и попадает в каждый из глаз через роговицу. Далее она направляет его на зрачки и радужную оболочку, которые совместно контролируют ширину и интенсивность потока. После этого свет перемещается к сетчатке, которая состоит из конусов и стержней, которые участвуют в определении цвета и формировании изображения. Этот длинный путь — только начало.

Когда картинка получена, её необходимо обработать. Для этого человек использует отдельную зону своего мозга, которая определяет цвет, форму, движение, а также множество дополнительных деталей и даже такие относительно абстрактные понятия, как красота. Мозг может сравнивать объекты и даже переиначивать полученную картинку, додумывая определённые детали. Более того, за счёт того, что человек использует сразу два глаза, мозг работает с парой базовых изображений, что, в том числе, нужно для понимания перспективы и определения отдалённости объектов, которые анализируются.

Как устроено компьютерное зрение

Компьютерное зрение использует схожие алгоритмы для получения картинки, но абсолютно другие для её обработки | Exponenta

Компьютерное зрение — нестандартная функция в машинах, которая реализуется с помощью как простых для понимания процессов, так и достаточно сложных для неподготовленных умов. Сначала, по аналогии с человеческим зрением, компьютерному нужно получить изображение. Делается это обычно за счёт системы из камер и других дополнительных датчиков. Сквозь объектив, который, в том числе, содержит диафрагму, контролирующую ширину светового потока, свет попадает на матрицу, которая содержит огромное количество светочувствительных элементов, фиксирующих изображение. Очень похоже на работу глаза, не так ли?

Да, технологии уже научились в определённой степени копировать работу человеческого глаза, но весь зрительный процесс в целом состоит не только из них. Картинка получена, и далее её необходимо обработать. Для этого в случае компьютерного зрения используется искусственный интеллект. Речь про нейронные сети, которые тренируют под конкретные задачи. После длительного обучения они могут определять увиденное, проводить классификацию объектов по конкретным типам. Получается, что за всё это первоначально отвечает человек. Более того, одной нейронной сети для определения всего и вся пока не существует.

Чем компьютерное зрение отличается от человеческого

Система компьютерного зрения в автопилоте авто, которая распознаёт объекты, расположенные на дороге | Medium

◉ Устройство

Человеческое зрение — результат многих лет эволюции, который отлично работает. Нет смысла придумывать что-то новое, поэтому устройство у компьютерного достаточно сильно похоже. Впрочем, нельзя забывать, что для получения и анализа изображения организм использует биологические системы с сетчаткой и клетками коры головного мозга, а машина — чувствительные элементы, а также многочисленные транзисторы. У специалистов, которые занимаются компьютерным зрением, две задачи: приблизить качество машинного получения картинки к человеческому, а также придумать систему её эффективного анализа.

◉ Угол обзора

Несмотря на то, что человеческое зрение кажется куда более сложной и совершенной системой, чем компьютерные аналоги, у последних всё же есть очевидные преимущества. Это, к примеру, касается относительного угла обзора. Хорошо известно, что человек видит не более чем на 220 градусов по горизонтали — то, что находится прямо перед ним и немного по бокам. Системы, использующие технологии компьютерного зрения, могут различаться, но никто не мешает им использовать размах на все 360 градусов. При этом даже пропадает необходимость определения понятий «спереди» и «сзади», которые всегда есть у человека.

Компьютерное зрение против человеческого: чем отличаются и когда одно лучше другого — Чем компьютерное зрение отличается от человеческого. 2

Компьютерное зрение может быть основано на камерах, в объективы которых попадают все 360 градусов пространства по горизонтали | Xiaomi

◉ Качество восприятия

Когда идёт речь про поле зрения, появляется ещё одно важное различие, которое связано с качеством восприятия информации во всём угле. У технологий компьютерного зрения в данном плане нет ровным счётом никаких значимых ограничений — машина видит всё в одинаковом качестве на заданном угле вне зависимости от его ширины. Человек лучше всего различает цвет объектов, которые находится в непосредственном центре поля зрения. Впрочем, когда речь заходит про низкое освещение, разобрать очертания объектов в данном случае получается лучше именно на периферии. Более того, здесь же лучше всего определяются любые движения.

◉ Специализация

Для получения картинки в зрительной системе человека используются не один, а сразу два типа «датчиков» с конкретной специализацией. Речь про стержни и конусы, про которые уже шла речь выше по тексту. Первых приблизительно в 20 раз больше, чем вторых, — они сконцентрированы на периферии и обеспечивают лучшее определение объектов в темноте. Конусы, в свою очередь, предназначены для определения цветов и увеличения разрешения картинки в светлое время суток. У компьютерного зрения масса датчиков, которые фиксируют картинку, но конкретной специализации у них нет.

Компьютерное зрение против человеческого: чем отличаются и когда одно лучше другого — Чем компьютерное зрение отличается от человеческого. 3

У отдельных датчиков на матрице условной камеры нет конкретной специализации

◉ Интеграция

Странно, что за годы длительной эволюции человеческое зрение имеет определённые ограничения, в сравнении с искусственным аналогом. Тем не менее у компьютерного зрения нет глубокой интеграции с другими системами внутри машины — судя по всему, в этом один из его главных минусов. Человек не только видит, но и слышит, а также ощущает прикосновения и чувствует запахи. Получается, если конкретно зрительная система не справляется с определением объекта, мозг ориентируется на целый ряд других сигналов, чтобы проанализировать всю эту информацию скопом. Ничего подобного в машинах сегодня попросту нет.

◉ Архитектура

Архитектура системы зрения определяет, каким именно образом происходит распознавание объектов. В данном случае скопировать человеческую систему мозга на текущем уровне развития технологий практически невозможно. Анализируя активность его коры, учёным удалось создать нейронные сети, которые примитивно имитируют его деятельность. Сначала они учились определять простые объекты вроде геометрических фигур, а потом и более сложные — вроде лиц и автомобилей. Впрочем, мозг не нужно учить понимать формы конкретных объектов. Да и как именно он это делает, умам всего мира ещё только предстоит понять.

Компьютерное зрение против человеческого: чем отличаются и когда одно лучше другого — Чем компьютерное зрение отличается от человеческого. 4

Схема работы нейросети, которая кажется очень запутанной, — процессы в мозге куда сложнее | Study

◉ Предназначение

Актуальные системы компьютерного зрения в массе предназначены для решения одной конкретной задачи. Они могут классифицировать объекты по типу, выделять их из общей картинки, сегментировать одно изображение на несколько отдельных, генерировать визуал и так далее — случаи, когда одна и та же нейронная сеть может закрыть сразу несколько подобных вопросов, единичные. У человеческого зрения всё иначе. Оно может подстраивать свою чувствительность под цели, которые перед ним ставит мозг. Более того, один и тот же организм может справляться с идентификацией тысяч объектов в один и тот же момент.

◉ Возможность обмана

Чтобы обмануть компьютерное зрение, нужно взаимодействовать с системой, которая даёт картинку, — с условной камерой. Если она выдала некорректную картинку, нейронная сеть не сможет её правильно обработать. Когда речь заходит про человеческое, то нужно работать с мозгом, а не глазами. Так как он сравнивает информацию из разных источников, а также пытается доосмыслить определённые нюансы, появляются моменты, когда он даже неверно понимает цвет объектов, находящихся рядом. Собственно, поэтому есть масса классических обманов, которые называются иллюзиями. Машины к ним нечувствительны.

Компьютерное зрение против человеческого: чем отличаются и когда одно лучше другого — Чем компьютерное зрение отличается от человеческого. 5

Удивительно, но у отмеченных на изображении квадратов одинаковый цвет — человеческое зрение этого не улавливает, но у машины с этим не возникло бы проблем | KeyShot

Telegram-канал создателя Трешбокса про технологии

···

Последнее изменение:
11 сентября 2021, 08:08

https://tbx.su/cjG