Александр Пономарёв

Текст

Разработчики отмечают, что нейросеть обрабатывает речь за несколько секунд, хорошо справляется со сленгом, сокращениями и даже фильтрует шумы

Как сообщает пресс-служба VK, технический директор «ВКонтакте» Александр Тоболь на конференции Saint HighLoad++ рассказал, что разработчики отныне могут бесплатно использовать в своих проектах фирменную технологию, считывающую голос и переводящую его в текст. Им доступны две модели: нейтральная подходит для распознавания четкой и разборчивой речи, которая фигурирует в интервью или телешоу.

Спонтанная модель предназначена для обычной речи, содержащей много сленговых выражений, сокращений и ненормативной лексики. Функцию распознавания речи можно подключить через веб-интерфейс или использовать ее при помощи публичного API. На информационной странице компания подготовила подробные инструкции по интеграции технологии.

Распознавание речи можно использовать как для разработки мини-приложений «ВКонтакте», так и для сторонних сервисов. Если проект обрабатывает до 100 минут аудио в сутки, то эту функцию можно применять для любых целей. Для безлимитного использования необходимо отправить заявку на электронную почту.

«Яндекс» тем временем научил распознавать нейросеть 10 языков одновременно:

Читать на ЦО.РФ

«Яндекс» научил нейросеть распознавать 10 языков одновременно Она понимает речь в любых форматах

При помощи новой нейросети компаниям будет проще создавать многоязычных голосовых помощников и мультиязычных голосовых роботов для колл-центров с большим потоком клиентов

Использованные источники: