1,

Google научила нейросеть говорить с человеческой интонацией

Машины уже почти научились разговаривать как люди. Новая система от Google умеет синтезировать речь с правильной интонацией
Роботы и компьютеры, «говорящие» человеческим языком, до недавнего времени были фантастикой. Теперь технология преобразование речи используется повсеместно. Единственная проблема — это то, что компьютерная программа не может в точности повторить интонацию человека. Однако компании Google удалось разработать систему преобразования текста в речь, которая полностью имитирует человеческий голос.
Система получила название Tacotron 2. Это уже второе поколение программы, состоящее из двух нейронных сетей. Первая преобразует текст в спектрограмму (визуальное представление звуковых частот), которая затем передаётся в WaveNet — алгоритм генерации речи. WaveNet считывает визуальные изображения и создаёт соответствующие звуковые элементы.

Примеры того, как работает система Tacorton 2, выложены на этой странице. Здесь можно прослушать фразу, сказанную программой и человеком. Разницу заметить практически невозможно. При этом Google не уточняет, какая запись была сгенерирована нейросетью. В компании отмечают, что Tacorton 2 отлично справляется с произношением имён, учитывает знаки пунктуации и другие моменты, например, выделяет слова с большой буквы. Но есть и некоторые трудности в произношении сложных слов. Кроме того, разработчики пока не могут заставить систему генерировать речь в реальном времени.

Tacorton 2, вероятнее всего, станет мощным дополнением к Google Assistant, в котором используется алгоритм WaveNet. Пока программа может говорить только одним женским голосом. Чтобы заставить её подражать другому голосу, придётся заново обучить систему.

Материалы по теме:
Последнее изменение:
 
BP1
BP11, 27 декабря 2017 - 16:27   (...)
Система получила название Tacotron 2.
Примеры того, как работает система Tacorton 2, выложены на этой странице.
Исправьте, пожалуйста.
Ответить
Fazylbekovich_
Fazylbekovich_ , 27 декабря 2017 - 21:40   (...)
Круто. Но пока внедрят, пройдет год. Потом еще год дл какого-то крупного обновления, а до этого одну и ту же надпись будут писать в «что нового?» (Типа minor bug fixesи т.д.). А русский язык добавят через лет 5-6, а до это они вас обнадежат со словами «soon...».
Ответить
ars_klas
ars_klas3, 28 декабря 2017 - 19:09   (...)
Разве Алиса от яндекса не имеей интонации ?
Ответить

Добавить комментарий
Если нужно ответить кому-то конкретно,
лучше нажать на «Ответить» под его комментарием