VK открыла доступ к распознаванию речи сторонним разработчикам Теперь они могут переводить речь в голос

Как сообщает пресс-служба VK, технический директор «ВКонтакте» Александр Тоболь на конференции Saint HighLoad++ рассказал, что разработчики отныне могут бесплатно использовать в своих проектах фирменную технологию, считывающую голос и переводящую его в текст. Им доступны две модели: нейтральная подходит для распознавания четкой и разборчивой речи, которая фигурирует в интервью или телешоу.
Спонтанная модель предназначена для обычной речи, содержащей много сленговых выражений, сокращений и ненормативной лексики. Функцию распознавания речи можно подключить через веб-интерфейс или использовать ее при помощи публичного API. На информационной странице компания подготовила подробные инструкции по интеграции технологии.
Распознавание речи можно использовать как для разработки мини-приложений «ВКонтакте», так и для сторонних сервисов. Если проект обрабатывает до 100 минут аудио в сутки, то эту функцию можно применять для любых целей. Для безлимитного использования необходимо отправить заявку на электронную почту.
«Яндекс» тем временем научил распознавать нейросеть 10 языков одновременно:
Использованные источники:
