В «VK Видео» внедрили ИИ Он распознает речь и пишет субтитры
Компания VK (ранее Mail.ru Group) анонсировала обновление платформы «VK Видео», внедрив новые алгоритмы искусственного интеллекта для автоматического распознавания речи и создания субтитров в различных видеороликах. Точность анализа и расшифровки речи увеличилась на 25%, благодаря новым технологиям нейросетей, которые теперь распознают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.
Нейросети проходят несколько этапов обработки аудиопотока: они фильтруют сторонние шумы, распознают речь и преобразуют ее в текст. Далее подключаются модели, расставляющие знаки препинания и обеспечивающие читаемость текста. Затем текст синхронизируется с аудиодорожкой, что делает субтитры более удобными для восприятия.
В ближайшем обновлении нейросети будут разделять речь разных спикеров на отдельные реплики, что упростит восприятие субтитров.
Что такое искусственный интеллект:
Использованные источники: