VK открыла доступ к распознаванию речи сторонним разработчикам. Теперь они могут переводить речь в голос

VK открыла доступ к распознаванию речи сторонним разработчикам Теперь они могут переводить речь в голос

Текст Александр Пономарёв

Разработчики отмечают, что нейросеть обрабатывает речь за несколько секунд, хорошо справляется со сленгом, сокращениями и даже фильтрует шумы

Как сообщает пресс-служба VK, технический директор «ВКонтакте» Александр Тоболь на конференции Saint HighLoad++ рассказал, что разработчики отныне могут бесплатно использовать в своих проектах фирменную технологию, считывающую голос и переводящую его в текст. Им доступны две модели: нейтральная подходит для распознавания четкой и разборчивой речи, которая фигурирует в интервью или телешоу.

Спонтанная модель предназначена для обычной речи, содержащей много сленговых выражений, сокращений и ненормативной лексики. Функцию распознавания речи можно подключить через веб-интерфейс или использовать ее при помощи публичного API. На информационной странице компания подготовила подробные инструкции по интеграции технологии.

Распознавание речи можно использовать как для разработки мини-приложений «ВКонтакте», так и для сторонних сервисов. Если проект обрабатывает до 100 минут аудио в сутки, то эту функцию можно применять для любых целей. Для безлимитного использования необходимо отправить заявку на электронную почту.

«Яндекс» тем временем научил распознавать нейросеть 10 языков одновременно: