Некоторое время назад сотрудники компании «Сбер» официально представили миру свою собственную технологию синтеза и распознавания речи SaluteSpeech. Правда, тогда платформа была доступна исключительно корпоративному сектору и бизнесам, которые решили на основе новейшей разработки автоматизировать некоторые свои процессы. К счастью, сегодня, 29 ноября, ситуация изменилась — теперь платформа SaluteSpeech доступна всем желающим, но, конечно, есть важное уточнение. Дело в том, что технологию для синтеза и распознавания речи можно использовать исключительно для создания некоммерческих проектов.
И сценариев использования SaluteSpeech на самом деле огромное множество. Например, если малый и средний бизнесы могут без помощи профессионального диктора озвучивать презентации или транскрибировать записи интервью в текст, то обычные пользователи могут использовать технологию буквально в повседневной жизни. Студенты, к примеру, могут удобно и достаточно быстро трансформировать аудиодорожку видеоролика в текст, чтобы затем его отредактировать для рефератов, научных работ или чего-то в таком духе. Кроме того, можно удобно «озвучивать» различные материалы или лекционную документацию.
Естественно, при использовании платформы на некоммерческой основе действуют определённые ограничения, которые нужно учитывать конечному пользователю. В компании заявили, что распознавание речи для физических лиц ограничено 100 минутами в месяц. Этого вполне хватит научному сотруднику, преподавателю или студенту для упрощения определённых моментов в образовательном процессе. Также есть ограничения по синтезу текста — всего можно «озвучить» 200 000 символов в месяц. В компании заявили, что этого достаточно, чтобы создать небольшую аудиокнигу примерно на сто страниц, чего тоже должно быть предостаточно обычному человеку.
Конечно, бизнесы, которые создают свои проекты на основе данной платформы, ничем не ограничены, так как она за технологию платят.
«Доступ к SaluteSpeech для реализации коммерческих проектов исключает эти ограничения. При работе с облачной версией платформы клиент платит по количеству секунд для распознавания речи и по числу символов для её генерации», — заявили сотрудники «Сбера».
Очень приятно, что теперь платформа SaluteSpeech доступна не только представителям коммерческого сектора и частным предпринимателям. И, конечно, стоит отметить, что функциями синтеза речи и распознавания текста можно пользоваться и вместе, и по отдельности.