Теком: Profanity Finder

Продукт
Разработчики: Теком
Дата премьеры системы: 2022/05/19

Основная статья: Распознавание речи (технологии, рынок)

2022: Представление Profanity Finder

19 мая 2022 года компания «Теком» представила решение по обнаружению бранных слов в медиаконтенте. В основе работы программы лежит нейросеть, предварительно обученная на определенном языковом материале. В словарь для обучения вошли основные корни нецензурных слов из списка Роскомнадзора и образованные от них лексические единицы. В качестве результата проверки пользователь получает размеченный txt-файл с конкретными словами и соответствующими им таймкодами. Также доступна расширенная версия отчета, в котором нецензурное слово дано вместе с речевым контекстом. Помимо обнаружения запрещенной лексики Profanity Finder может маскировать мат, заменяя его на звуковой сигнал.

На май 2022 года точность обнаружения слов из базового лексического набора с помощью Profanity Finder составляет 94%. Кроме предустановленного словаря в решении реализован пользовательский словарь. Данная функция позволяет добавлять актуальные для пользователя лексические единицы, которые необходимо детектировать дополнительно.

Profanity Finder поддерживает проверку видеофайлов в форматах MP4, M4A, 3GP. Предусматривается дальнейшее увеличение числа доступных для анализа форматов контента. Решение от компании «Теком» анализирует видео на наличие запрещенных слов в три раза быстрее реального времени.

«Теком» также начал активную работу над поиском звуковых упоминаний и визуальных образов сервисов Meta, поскольку с марта 2022 года деятельность холдинга на территории России считается незаконной. Это поможет медиакомпаниям обнаружить и скрыть из контента логотипы социальных сетей Facebook и Instagram (признанными экстремистскими организациями и запрещены в России).