Сирко: автоматическое распознавание речи

Продукт
Разработчики: Системы речевых коммуникаций (Сирко)
Дата последнего релиза: апрель 2011 года
Технологии: Речевые технологии

Инновационное предприятие "Системы речевых коммуникаций объявило в апреле 2011 года о коммерческой доступности новейшей технологии автоматизированного распознавания речи. Это итог многолетней работы коллектива ученых Нижегородского государственного лингвистического университета.

В основе технологии лежит новый метод фонетического декодирования слов, позволивший добиться значительных преимуществ по сравнению с существующими решениями в области распознавания речи. Вот некоторые из ключевых особенностей новой разработки:

  • Работа в режиме реального времени со словарем в несколько тысяч слов.
  • Минимальная потребность в вычислительных ресурсах. Для словаря объемом в 1000 слов выигрыш составляет более 200 раз по сравнению с аналогами.
  • Автоматическая процедура формирования и обновления рабочего фонетического словаря из тематического письменного текста произвольного объема. Для пополнения словаря на 1000 слов достаточно всего 3 минут!
  • Возможность выбора национального языка из широкого списка.
  • Независимость распознавания речи от индивидуальных особенностей и возраста диктора.

Наибольшей проблемой для всех известных технологий автоматического распознавания речи является формирования рабочего словаря. Добавление или изменение в рабочем словаре даже одной позиции превращается в сложную и трудоемкую процедуру. Технология, разработанная нижегородскими учеными обеспечивает рост эффективности на несколько порядков.Догнать и перегнать: Российские ВКС прирастают новыми функциями 8.9 т

"Покажите характеристики нашей технологии любому специалисту в области распознавания речи, и он вам скажет, что это невозможно." – говорит руководитель коллектива разработчиков, доктор технических наук, профессор Владимир Савченко. – "Никто до нас не реализовал процедуру автоматического формирования звукового рабочего словаря из письменного текста, поскольку хорошо известно, что устная и письменная речь - это, по сути, два разных языка. Мы в своем проекте достигли невозможного, и этим все сказано!"

Представленная технология может быть использована в широком спектре приложений. Вот некоторые примеры:

  • Голосовой поиск информации в тематических базах данных через Интернет и телефонные сети
  • Системы голосового управления
  • Информационно-справочные службы с автоматической обработкой запросов по телефону
  • Системы автоматических секретарей и системы автоматического речевого перевода
  • Интернет-магазины и торговые системы заказов по телефону.

Благодаря процедурам автоматического формирования и обновления рабочего словаря, новая технология открывает широкие перспективы работы с любыми базами данных с постоянно изменяющимся содержанием. Это могут быть, например, каталоги Интернет-магазинов, информационные базы контакт-центров, проведение социологических опросов и многое другое. Независимость распознавания речи от индивидуальных особенностей и возраста диктора позволяет применять новую технологию в различных решениях для массовой аудитории.



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (43)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (27)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (24)
  Naumen (Наумен консалтинг) (14)
  Voice Systems Robotics (VSR, VS Robotics) (9)
  Другие (147)

  Группа компаний ЦРТ (Центр речевых технологий) (5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  3iTech (ранее 3i Technologies) (2)
  Naumen (Наумен консалтинг) (2)
  Neuro.net (Нейро) (2)
  Другие (15)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
  Naumen (Наумен консалтинг) (3)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (2)
  Другие (11)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  Naumen (Наумен консалтинг) (4)
  Unlimited Production (Анлимитед Продакшен) (4)
  Другие (18)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2)
  AllSee (АЛЛ СИИ) (1)
  Napoleon IT (Наполеон Айти) (1)
  Naumen (Наумен консалтинг) (1)
  Другие (6)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (16, 46)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 28)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (11, 25)
  Яндекс (Yandex) (9, 14)
  Avaya (4, 13)
  Другие (300, 143)

  Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 2)
  Neuro.net (Нейро) (1, 2)
  Другие (7, 9)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Voice Systems Robotics (VSR, VS Robotics) (1, 3)
  Naumen (Наумен консалтинг) (1, 3)
  Voximplant (Фастком) (2, 2)
  Другие (9, 11)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 8)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  Unlimited Production (Анлимитед Продакшен) (1, 6)
  Naumen (Наумен консалтинг) (2, 4)
  Другие (12, 13)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 2)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  Сбер Бизнес Софт (1, 1)
  Naumen (Наумен консалтинг) (1, 1)
  Voice Systems Robotics (VSR, VS Robotics) (1, 1)
  Другие (5, 5)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  МТТ VoiceBox - 24
  BSS Digital2Speech - 19
  Voice2Med Система распознавания речи в медицине - 14
  SmartLogger II - 12
  Naumen Erudite - 12
  Другие 158

  BSS Digital2Speech - 5
  Voice2Med Система распознавания речи в медицине - 4
  МТТ VoiceBox - 2
  Neuro.net Голосовой робот - 2
  3i TouchPoint Analytics - 2
  Другие 9

  МТТ VoiceBox - 11
  BSS Digital2Speech - 6
  VS Robotics: VS Робот-оператор - 3
  Naumen Erudite - 3
  VoxImplant - 2
  Другие 12

  МТТ VoiceBox - 9
  BSS Digital2Speech - 7
  EXpress Защищенный корпоративный мессенджер - 6
  SmartLogger II - 4
  Naumen Erudite - 3
  Другие 17

  YandexGPT (YaLM 2.0) - 1
  SmartLogger II - 1
  Naumen Erudite - 1
  BSS Digital2Speech - 1
  Сбер SaluteSpeech (SmartSpeech) - 1
  Другие 6