adblock check

ВКонтакте тестирует прослушку голосовых сообщений для преобразования речи в текст

Пока что социальная сеть использует решение сторонних разработчиков, но вскоре начнёт тестировать собственную технологию

Разработчики «ВКонтакте» сообщили в официальном пресс-релизе, что социальная сеть начала тестирование новой функции — распознавание голосовых сообщений для их преобразования в текст. Когда нововведение пройдёт все необходимые проверки, каждый пользователь сможет нажимать на соответствующую кнопку в окошке голосового сообщения и читать то, что собеседник сказал (по крайней мере, сейчас реализация новой функции именно такая).

На данный момент проходит первый этап тестирования, в ходе которого применяется стороннее решение по распознаванию речи. В его рамках нововведение оценивают участники VK Testers, владеющие устройствами под управлением iOS. Судя по всему, сейчас разработчики не столько тестируют технологию, сколько изучают, как люди используют новую функцию, и собирают отзывы об её удобстве с пожеланиями и предложениями.

На втором этапе тестирования «ВКонтакте» собирается задействовать собственную разработку по распознаванию речи. Согласно официальным данным, она основана на базе нейронной сети, которая легко масштабируется, гибко настраивается и, что не менее важно, обучается сленгу современного русского языка. Директор по исследованиям в области искусственного интеллекта сервиса Павел Калайдин отметил, что последняя из вышеописанных функций нейронной сети является ключевой для разработчиков, поскольку люди редко общаются подобно персонажам из классической литературы, но часто используют сленг и слова из других языков — именно с распознаванием такой лексики наблюдаются проблемы у всех готовых решений сторонних разработчиков.

Если результаты тестирования буду положительными, фирменная технология «ВКонтакте» станет основой для нового инструмента, позволяющего выполнять поиск по словам в диалогах не только среди обычных сообщений, но и среди голосовых.

BoobyBoo85
Без вести проспавший
10 комментариев по лайкам по дате
Оставьте комментарий...
Оставьте комментарий...
Автор
Одно из немногих нововведений, которое во ВКонтакте появилось раньше, чем в других сервисах, включая Телеграм. Очень хочется такого же в Телеграм, но там его скорее всего не будет — долго/трудно разрабатывать, для большего числа языков, ну и непонятно, как в таком случае телеграм будет доказывать сохранение конфиденциальности
А какой смысл и польза вообще в такой функции. Идеально она всё равно не будет работать, распознавание, будь то текста или речи всегда происходит с ошибками и неточностями, а речи так тем более вызывает больше трудностей, поскольку это вообще вещь субъективная — надо чётко произносить фразы без каких-либо акцентов, плюс фактор посторонних звуков, паразитных шумов. Есть отдельные приложения, которые используют эту функцию, зачем она нужна в мессенджере?
Автор
Видимо тебе почти никто не отсылает голосовухи. Я очень хочу увидеть подобную функцию в Телеграм — мне довольно часто присылают голосовые сообщения, которые я не могу прослушать в конкретный момент — расшифровка очень пригодилась бы
Ты пользовался хоть раз голосовыми заметками? Теми, которые именно текст пишут по речи? Они, естественно, делают ошибки, но с задачей справляются. Здесь задача тоже не роман писать, а дать пользователю представление о том, что говорят в аудиосообщении, которое он не может прослушать сейчас по каким-то причинам. И если там будет пара неточностей — не страшно.
Нет, ошибаешься. ВК как всегда ворует всё с телеги.
В Телеграме давно есть бот — @voicybot.Который преобразовывает голосовые сообщения, которые ты ему скидываешь — в текст. Довольно удобно, кстати. Русский язык также поддерживается!

Ссылка на бот https://voicybot.com/
На деле субтитры в реальном времени из андроид 10 с этим справляются, только вот только на английском