Виктор Чеканов, генеральный директор Megogo, сообщил информационному изданию «Ведомости» о том, что онлайн-кинотеатр придумал способ оперативного распознавания запрещённого контента. Для этой цели видеосервис в течение ближайшего месяца создаст специальную программу на основе многозадачной нейросети, которая будет в автоматическом режиме распознавать матерные слова и производные от них — данные будут взяты из списка нецензурных слов и выражений Роскомнадзора. Впрочем, лишь на определении запрещённых слов специалисты онлайн-кинотеатра останавливаться не планируют.
Также Чеканов заявил, что созданный компанией софт будет распознавать сцены курения в кадре, а также употребление алкогольных напитков и сцены сексуального характера. Теоретически, как сказали в компании, в обозримом будущем софт сможет определять даже сцены насилия, но эта опция, видимо, будет реализована позже. Программа-робот Megogo будет построена на нейронной сети, которая в свою очередь основана на специальном инструменте по распознаванию речи Vock (решение с открытым исходным кодом) и новейшей системе визуального распознавания объектов в кадре. Правда, полагаться исключительно на автоматику онлайн-кинотеатр пока что не планирует.
Например, система может определить словосочетание «не психуй» как нецензурное, хотя это, очевидно, не так. Соответственно, при фильтрации контента видеосервис всё же будет задействовать специалистов-людей, которые будут просматривать действия нейросети перед вынесением окончательного вердикта. Но примерно через год технология будет работать в полностью автономном режиме уже без участия человека — на это рассчитывают в компании. Сейчас же софту предстоит проанализировать более 700 тысяч фильмов и серий сериалов — матерные слова будут «запиканы», тогда как остальной контент получит соответствующую маркировку «18+». А ещё Виктор Чеканов заявил, что если технология будет выполнять задачу достаточно эффективно, то её, скорее всего, будут продавать другим онлайн-кинотеатрам, которые тоже столкнулись с необходимостью цензурировать контент.