Павел Иевлев

Текст

Компания «Теком» представила решение по обнаружению нецензурных слов в медиаконтенте

«Теком» – отечественный разработчик программного обеспечения для рынков телерадиовещания и телекоммуникаций, так что его решение Profanity Finder работает на русском. То есть находит не слова на букву «f», а слова на букву «Х». Это первое русскоязычное решение, которое может «запикивать» мат в прямом эфире. Пока оно предлагается только для проверки медиафайлов: MP4, M4A, 3GP, – но анализирует видео на наличие запрещенных слов в три раза быстрее реального времени, так что ничто не мешает пропускать через него реальный видеопоток.

В словарь для обучения вошли основные корни нецензурных слов из списка Роскомнадзора и образованные от них лексические единицы. Анализ нецензурных слов ведется вместе с речевым контекстом, точность обнаружения составляет 94%. В основе работы программы лежит нейросеть, предварительно обученная на определенном языковом материале.

В общем, еще немного автоматической нейросетевой цензуры для человека.

Использованные источники: