OpenAI научила ИИ клонировать голос Для этого достаточно 15 секунд
Модель способна на основе 15-секундного образца речи озвучивать введенный текст, стараясь максимально точно передать голос и другие фонетические особенности говорящего. По результатам испытаний Voice Engine тестировщики отметили, что модель отлично подойдет для озвучки контента, а также — совместно с GPT-4 — персонализированных ответов в реальном времени.
Перевод видеороликов и подкастов позволит авторам контента расширить аудиторию буквально на весь мир. Кроме того, Voice Engine пригодится для поддержки людей с проблемами речи, терапевтических и образовательных приложений. Модель можно применять в восстановлении голоса при нарушениях речи — например, людям с онкологическими или неврологическими заболеваниями.
Все тестировавшие Voice Engine испытуемые согласились с тем, что данную технологию необходимо запретить использовать для того, чтобы выдавать себя за других людей. Вероятность потенциальных злоупотреблений со стороны мошенников, все чаще использующих нейросетевые технологии в преступных целях, остается довольно высокой.
Здесь мы рассказываем, что такое дипфейки и как их делают:
Использованные источники: Freepik