Александр Пономарёв

Текст

Ученые из НИУ ВШЭ разработали алгоритм, который позволяет точно и быстро измерять частоту основного тона речи даже при высоком уровне фонового шума

Как сообщает ТАСС со ссылкой на пресс-службу НИУ ВШЭ, новый алгоритм поможет нейросетям лучше распознавать эмоции и речь человека. Частота основного тона речи является важным параметром для распознавания эмоций и диагностики заболеваний, а предложенный подход работает даже в условиях шума и без задержки во времени.

При этом алгоритм задействует меньше вычислительных ресурсов, чем известные аналоги, подчеркивают разработчики. Он построен на базе доработанных классических математических методов, в том числе преобразования Фурье, которые применяются при обработке звука компьютерными программами. Классические подходы значительно теряют в точности работы, если сигнал записан при высоком уровне фонового шума или с помощью некачественного микрофона.

Ученые выяснили, что обрабатываемый сигнал можно очистить от помех при помощи созданной ими простой однослойной нейросети, способной отделять звуки речи от белого шума. Алгоритм может применяться во множестве областей — при разработке голосовых помощников, способных распознавать речь и эмоции владельца, а также в области психологии и медицины.

Здесь мы рассказываем, как работают нейросети:

Читать на ЦО.РФ

Как работают нейросети Простое объяснение в картинках

Принцип работы нейронной сети пришел в программирование из биологии. Пионерами нейросетей были не столько программисты, сколько нейрофизиологи и психологи. «Цифровой океан» разобрался, как работают нейросети — и в каком-то смысле человеческий мозг.

Использованные источники: Freepik