10.04.2024

SberDevices представили новый инструмент распознавания речи Его назвали GigaAM

<i>SberDevices </i>представили новый инструмент распознавания речи

Текст Павел Иевлев

SberDevices разработали GigaAM, новую акустическую модель с открытым кодом

SberDevices представили GigaAM, новое семейство акустических моделей для распознавания речи и эмоций в русскоязычном контенте. GigaAM — Audio Foundation Model — была предварительно обучена на огромной коллекции русскоязычной речи и может быть адаптирована под широкий спектр задач обработки звука.

В состав GigaAM входит несколько моделей, включая GigaAM-CTC для распознавания русскоязычных запросов и GigaAM-Emo для определения эмоций. Оценка качества GigaAM-CTC показала, что модель допускает на 20–35% меньше ошибок в словах в коротких запросах по сравнению с другими популярными решениями. GigaAM-Emo, в свою очередь, продемонстрировала лучшие результаты на крупнейшем датасете Dusha среди всех известных моделей.

Модели GigaAM доступны в открытом доступе под некоммерческой лицензией, так что их можно смело использовать в дипломных работах и научных статьях. Для бизнеса улучшенные версии моделей доступны на платформе SaluteSpeech API, а физические лица могут использовать их в приложении SaluteSpeech App.

Как работают нейросети:

Использованные источники:

15.12.2023

7 причин подписаться на телеграм-канал «Цифрового океана» Плюс одна причина не подписываться

29.09.2024

Телевизоры Samsung и LG делают скриншоты контента несколько раз в секунду Это можно отключить

Телевизоры Samsung и LG делают скриншоты контента несколько раз в секунду Это можно отключить

29.09.2024

ИИ обходит 100% изображений в капчах Быстрее, чем средний человек

ИИ обходит 100% изображений в капчах Быстрее, чем средний человек

Журнал

свежий номер: ГУМАНОИДНЫЕ РОБОТЫ

Изображение статьи

16.09.2024

Двойной агент Как устроен проект мониторинга и очистки воздуха от «Норникеля»

Двойной агент Как устроен проект мониторинга и очистки воздуха от «Норникеля»

29.09.2024

Сэм Альтман предложил вложить $7 трлн в новые заводы В TSMC сочли его предложение нереалистичным

29.09.2024

Клиенты Сбера теперь могут оплачивать покупки с карт любого банка По биометрии

29.09.2024

Беспилотные грузовики пустят по М-12 «Восток» и М-4 «Дон» До конца года их станет 18

29.09.2024

Процессоры Intel сбоят из-за ошибок на уровне кремния и микрокода Почти все ломаются непоправимо

Процессоры Intel сбоят из-за ошибок на уровне кремния и микрокода Почти все ломаются непоправимо

30.09.2024

Razer выпустила вибросидушку Для настоящих геймеров

Razer выпустила вибросидушку Для настоящих геймеров

30.09.2024

Intel все таки не продалась Arm И заявила, что никому продаваться не планирует

27.08.2024

Глубокоуважаемый вагоноуважатый Как ИИ управляет питерскими трамваями

Глубокоуважаемый вагоноуважатый Как ИИ управляет питерскими трамваями

29.09.2024

Разработаны «умные» теплицы Они сами делают удобрения

29.09.2024

Миллионы автомобилей Kia можно взломать Достаточно отсканировать номерной знак

27.09.2024

Discord могут заблокировать в России Уже в ближайшие дни

27.09.2024

Ученые разработали многорецепторную кожу Вдохновленную утконосами

27.09.2024

Марк Цукерберг пообщался с цифровой копией Оригинал стоял рядом

27.09.2024

Google ограничил создание новых аккаунтов Для пользователей с российскими номерами

Google ограничил создание новых аккаунтов Для пользователей с российскими номерами

27.09.2024

«Бюро 1440» разрабатывает терминал спутниковой связи Для поездов РЖД

«Бюро 1440» разрабатывает терминал спутниковой связи Для поездов РЖД