Павел Иевлев

Текст

«VK Видео» улучшает распознавание речи: точность выросла на 25%

Компания VK (ранее Mail.ru Group) анонсировала обновление платформы «VK Видео», внедрив новые алгоритмы искусственного интеллекта для автоматического распознавания речи и создания субтитров в различных видеороликах. Точность анализа и расшифровки речи увеличилась на 25%, благодаря новым технологиям нейросетей, которые теперь распознают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.

Нейросети проходят несколько этапов обработки аудиопотока: они фильтруют сторонние шумы, распознают речь и преобразуют ее в текст. Далее подключаются модели, расставляющие знаки препинания и обеспечивающие читаемость текста. Затем текст синхронизируется с аудиодорожкой, что делает субтитры более удобными для восприятия.

В ближайшем обновлении нейросети будут разделять речь разных спикеров на отдельные реплики, что упростит восприятие субтитров.

Что такое искусственный интеллект:

Читать на ЦО.РФ

Искусственный интеллект  Что это такое и где он используется?

Почему искусственный интеллект (ИИ) никогда не сможет мыслить как человек, в чем различия между искусственным и естественным интеллектами, а также где ИИ сегодня находит себе применение? Ответы на эти и другие вопросы в нашем материале

Использованные источники: