Nvidia создала нейромодель выразительной речи Это позволит существенно улучшить преобразование текста в речь
Новая модель диалогового ИИ позволит генерировать голоса для игровых персонажей. В отличие от обычных текстово-речевых преобразователей с их монотонным бубнежом, он будет говорить как человек – со сложным ритмом, интонацией и тембром
Озвучка при помощи ИИ до сих пор никуда не годилась – она не вызвала у пользователя эмоционального сопереживания. Человек в этом отношении выигрывал за счет естественного интонирования. Однако возможности ИИ растут, алгоритмы совершенствуются, и приведенные Nvidia звуковые ролики звучат очень убедительно.
Разумеется, кроме игр, такие технологии могут использоваться и в других областях синтеза речи – виртуальные помощники, личные онлайн-аватары, переозвучка фильмов и начитка аудиокниг. Учитывая, что актеры дубляжа и профессиональные озвучивальщики стоят дорого, им придется заняться чем-то другим.
В общем, еще одна профессия, причем из числа «творческих», готовится к замещению людей роботами.
Использованные источники: