02.04.2024

OpenAI научила ИИ клонировать голос Для этого достаточно 15 секунд

<i>OpenAI </i>научила ИИ клонировать голос

Текст Александр Пономарёв

Компания OpenAI представила результаты тестирования модели искусственного интеллекта Voice Engine, которая реалистично имитирует заданный голос

Модель способна на основе 15-секундного образца речи озвучивать введенный текст, стараясь максимально точно передать голос и другие фонетические особенности говорящего. По результатам испытаний Voice Engine тестировщики отметили, что модель отлично подойдет для озвучки контента, а также — совместно с GPT-4 — персонализированных ответов в реальном времени.

Перевод видеороликов и подкастов позволит авторам контента расширить аудиторию буквально на весь мир. Кроме того, Voice Engine пригодится для поддержки людей с проблемами речи, терапевтических и образовательных приложений. Модель можно применять в восстановлении голоса при нарушениях речи — например, людям с онкологическими или неврологическими заболеваниями.

Все тестировавшие Voice Engine испытуемые согласились с тем, что данную технологию необходимо запретить использовать для того, чтобы выдавать себя за других людей. Вероятность потенциальных злоупотреблений со стороны мошенников, все чаще использующих нейросетевые технологии в преступных целях, остается довольно высокой.

Здесь мы рассказываем, что такое дипфейки и как их делают: