Александр Пономарёв

Текст

При помощи новой нейросети компаниям будет проще создавать многоязычных голосовых помощников и мультиязычных голосовых роботов для колл-центров с большим потоком клиентов

Как сообщает пресс-служба «Яндекса», нейросеть-полиглот способна работать как с популярными языками, такими как английский и французский, так и с более редкими — датским, финским, турецким и другими. Модель распознает речь на любую тему, в коротких и длинных фразах, а также имена, адреса, даты и числа. Она способна распознавать язык автоматически в одном потоке: нейросеть может в любой момент переключаться между языками.

При этом у пользователя есть возможность давать ей определенные подсказки, чтобы улучшить качество распознавания. Новая мультиязычная модель работает на базе архитектуры Transformer. «Трансформеры» обрабатывают входящие слова параллельно и независимо друг от друга, благодаря чему они довольно быстро обучаются.

Чтобы при переходе на другой язык текст получался связным и грамматически правильным, нейросеть обучали на десятках терабайтов данных из профессиональных датасетов и массивах данных из сервисов и приложений «Яндекса». Новое мультиязычное распознавание уже доступно для пользователей Yandex SpeechKit и настраивается стандартными средствами в API.

Нейросеть недавно написала сценарий для российского сериала:

Использованные источники: