Акустическая система блокировки микрофонов

Продукт
Разработчики: Колумбийская школа инженерных и прикладных наук
Дата премьеры системы: апрель 2022 г
Отрасли: Информационные технологии
Технологии: Речевые технологии

Содержание

История

2022: Анонс системы

В середине апреля 2022 года ученые Колумбийского инженерного института разработали систему, генерирующую тихие звуки, которые можно включить в любой комнате для того, чтобы заблокировать умные устройства от слежки за пользователями. Технологию легко внедрить в аппаратные средства, такие как компьютеры и смартфоны, предоставляя людям возможность самостоятельно защищать конфиденциальность своего голоса.

Несмотря на то, что теоретически результаты, полученные командой в области искажения систем автоматического распознавания речи, уже были известны, их достижения достаточно быстро для использования в практических приложениях оставалось основным узким местом. Проблема заключалась в том, что звук, который прерывает речь человека до апреля 2022 года, не являлся звуком, который прервет речь секундой позже. Когда пользователи говорят, их голоса постоянно меняются, поскольку они произносят разные слова с различной скоростью и тональностью. Эти изменения делают практически невозможным для машины поспевать за быстрым темпом речи человека.

Выпущена система, которая мешает смартфонам «подслушивать» разговоры
«
Ключевой технической задачей для достижения этой цели было заставить все это работать достаточно быстро! Наш алгоритм, которому удается блокировать неавторизованный микрофон от правильного восприятия ваших слов в 80% случаев, является самым быстрым и самым точным на нашей тестовой площадке. Он работает даже тогда, когда мы ничего не знаем о неавторизованном микрофоне, например, о его местонахождении или даже о компьютерном программном обеспечении, работающем на нем. По сути, алгоритм маскирует голос человека в эфире, скрывая его от этих прослушивающих систем и не мешая разговору между людьми в комнате, - сказал доцент кафедры информатики Карл Вондрик (Carl Vondrick).

»

Исследователям необходимо было разработать алгоритм, который мог бы разрушать нейронные сети в реальном времени, который мог бы генерироваться непрерывно по мере произнесения речи и был бы применим к большинству словарных слов в языке. Хотя предыдущие работы успешно справлялись хотя бы с одним из этих трех требований, ни одна из них не достигла всех трех. Ведущий автор исследования и аспирант в лаборатории Миа Вондрика рассказала, что алгоритм использует то, что она называет предиктивными атаками – это сигнал, который может нарушить любое слово, транскрибировать которое обучены модели автоматического распознавания речи. Кроме того, когда звуки атаки воспроизводятся в эфире, они должны быть достаточно громкими, чтобы нарушить работу любого несанкционированного микрофона, который может находиться на большом расстоянии. Звук атаки должен передаваться на то же расстояние, что и голос.Догнать и перегнать: Российские ВКС прирастают новыми функциями 8.4 т

Подход исследователей достигает производительности в реальном времени, прогнозируя атаку на будущий сигнал или слово на основе двух секунд входной речи. Группа оптимизировала атаку таким образом, чтобы она имела громкость, схожую с обычным фоновым шумом, что позволяет людям в комнате вести беседу естественно и без успешного мониторинга автоматической системой распознавания речи. Группа успешно продемонстрировала, что их метод работает в реальных помещениях с естественным окружающим шумом и сложной геометрией сцены.[1]

Примечания



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (43)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (27)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (24)
  Naumen (Наумен консалтинг) (14)
  Voice Systems Robotics (VSR, VS Robotics) (9)
  Другие (145)

  Группа компаний ЦРТ (Центр речевых технологий) (5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  3iTech (ранее 3i Technologies) (2)
  Naumen (Наумен консалтинг) (2)
  Neuro.net (Нейро) (2)
  Другие (15)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
  Naumen (Наумен консалтинг) (3)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (2)
  Другие (11)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  Naumen (Наумен консалтинг) (4)
  Unlimited Production (Анлимитед Продакшен) (4)
  Другие (17)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2)
  AllSee (АЛЛ СИИ) (1)
  Naumen (Наумен консалтинг) (1)
  Voice Systems Robotics (VSR, VS Robotics) (1)
  Другие (5)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (16, 46)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 28)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (11, 24)
  Яндекс (Yandex) (9, 14)
  Avaya (4, 13)
  Другие (298, 140)

  Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  3iTech (ранее 3i Technologies) (1, 2)
  Naumen (Наумен консалтинг) (1, 2)
  Другие (7, 9)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Naumen (Наумен консалтинг) (1, 3)
  Voice Systems Robotics (VSR, VS Robotics) (1, 3)
  Voximplant (Фастком) (2, 2)
  Другие (9, 11)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 8)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  Unlimited Production (Анлимитед Продакшен) (1, 6)
  Naumen (Наумен консалтинг) (2, 4)
  Другие (11, 12)

  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 1)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 1)
  Наносемантика (Nanosemantics Lab) (1, 1)
  Naumen (Наумен консалтинг) (1, 1)
  Другие (3, 3)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  МТТ VoiceBox - 24
  BSS Digital2Speech - 19
  Voice2Med Система распознавания речи в медицине - 14
  SmartLogger II - 12
  Naumen Erudite - 12
  Другие 155

  BSS Digital2Speech - 5
  Voice2Med Система распознавания речи в медицине - 4
  3i TouchPoint Analytics - 2
  Naumen Erudite - 2
  МТТ VoiceBox - 2
  Другие 9

  МТТ VoiceBox - 11
  BSS Digital2Speech - 6
  VS Robotics: VS Робот-оператор - 3
  Naumen Erudite - 3
  VoxImplant - 2
  Другие 12

  МТТ VoiceBox - 9
  BSS Digital2Speech - 7
  EXpress Защищенный корпоративный мессенджер - 6
  SmartLogger II - 4
  Naumen Erudite - 3
  Другие 16

  VS Robotics Речевая аналитика - 1
  NLab Speech TTS - 1
  BSS Digital2Speech - 1
  МТТ Голосовой бот - 1
  Сбер Салют Виртуальные ассистенты - 1
  Другие 4