25.11.2021

**Самообучающаяся модель распознает речь на 128 языках** Ее код выложен в открытый доступ

/

Самообучающаяся модель распознает речь на <i>128 </i>языках

Текст Павел Иевлев

FAIR (подразделение Meta AI) выложила в открытый доступ код XLS-R – самообучающейся модели, выполняющей распознавание речи

Эта мультиязыковая самообучающаяся модель поддерживает 128 языков и показывает результаты, превосходящие все существующие системы. Она обучена более чем на 436 000 часах общедоступных записей речи разного жанра, таких, как записи судебных заседаний и аудиокниги. Анализ речи XLS-R включает более 2-х миллиардов параметров.

Помимо простого распознавания речи, модель также может быть задействована для перевода – XLS-R может переводить с английского на 21 другой язык. Автоматические переводы этой системы в большей степени совпадают с переводами, выполняемыми человеком, выполняющим ту же задачу, чем конкурирующие модели.

В процессе обучения выяснилось, что чем больше языков обучения, тем выше этого обучения эффективность (ранее такое наблюдалось при обучении иностранным языкам у людей).

Код модели доступен на Github.

Использованные источники:

15.12.2023

7 причин подписаться на телеграм-канал «Цифрового океана» Плюс одна причина не подписываться

29.09.2024

Телевизоры Samsung и LG делают скриншоты контента несколько раз в секунду Это можно отключить

Телевизоры Samsung и LG делают скриншоты контента несколько раз в секунду Это можно отключить

29.09.2024

ИИ обходит 100% изображений в капчах Быстрее, чем средний человек

ИИ обходит 100% изображений в капчах Быстрее, чем средний человек

Журнал

свежий номер: ГУМАНОИДНЫЕ РОБОТЫ

Изображение статьи

16.09.2024

Двойной агент Как устроен проект мониторинга и очистки воздуха от «Норникеля»

Двойной агент Как устроен проект мониторинга и очистки воздуха от «Норникеля»

29.09.2024

Сэм Альтман предложил вложить $7 трлн в новые заводы В TSMC сочли его предложение нереалистичным

29.09.2024

Клиенты Сбера теперь могут оплачивать покупки с карт любого банка По биометрии

29.09.2024

Беспилотные грузовики пустят по М-12 «Восток» и М-4 «Дон» До конца года их станет 18

29.09.2024

Процессоры Intel сбоят из-за ошибок на уровне кремния и микрокода Почти все ломаются непоправимо

Процессоры Intel сбоят из-за ошибок на уровне кремния и микрокода Почти все ломаются непоправимо

30.09.2024

Razer выпустила вибросидушку Для настоящих геймеров

Razer выпустила вибросидушку Для настоящих геймеров

30.09.2024

Intel все таки не продалась Arm И заявила, что никому продаваться не планирует

27.08.2024

Глубокоуважаемый вагоноуважатый Как ИИ управляет питерскими трамваями

Глубокоуважаемый вагоноуважатый Как ИИ управляет питерскими трамваями

29.09.2024

Разработаны «умные» теплицы Они сами делают удобрения

29.09.2024

Миллионы автомобилей Kia можно взломать Достаточно отсканировать номерной знак

27.09.2024

Discord могут заблокировать в России Уже в ближайшие дни

27.09.2024

Ученые разработали многорецепторную кожу Вдохновленную утконосами

27.09.2024

Марк Цукерберг пообщался с цифровой копией Оригинал стоял рядом

27.09.2024

Google ограничил создание новых аккаунтов Для пользователей с российскими номерами

Google ограничил создание новых аккаунтов Для пользователей с российскими номерами

27.09.2024

«Бюро 1440» разрабатывает терминал спутниковой связи Для поездов РЖД

«Бюро 1440» разрабатывает терминал спутниковой связи Для поездов РЖД