Александр Пономарёв

Текст

Компания OpenAI представила результаты тестирования модели искусственного интеллекта Voice Engine, которая реалистично имитирует заданный голос

Модель способна на основе 15-секундного образца речи озвучивать введенный текст, стараясь максимально точно передать голос и другие фонетические особенности говорящего. По результатам испытаний Voice Engine тестировщики отметили, что модель отлично подойдет для озвучки контента, а также — совместно с GPT-4 — персонализированных ответов в реальном времени.

Перевод видеороликов и подкастов позволит авторам контента расширить аудиторию буквально на весь мир. Кроме того, Voice Engine пригодится для поддержки людей с проблемами речи, терапевтических и образовательных приложений. Модель можно применять в восстановлении голоса при нарушениях речи — например, людям с онкологическими или неврологическими заболеваниями.

Все тестировавшие Voice Engine испытуемые согласились с тем, что данную технологию необходимо запретить использовать для того, чтобы выдавать себя за других людей. Вероятность потенциальных злоупотреблений со стороны мошенников, все чаще использующих нейросетевые технологии в преступных целях, остается довольно высокой.

Здесь мы рассказываем, что такое дипфейки и как их делают:

Читать на ЦО.РФ

Что такое дипфейки И как они устроены

Миллионы лет эволюции приучили людей доверять зрению, и восклицание «глазам своим не верю!» еще недавно воспринималось как ироническое. Однако дипфейки учат нас критически относиться к увиденному. И по темпам обучения человечеству стоит постараться обогнать нейросети

Использованные источники: Freepik