Baum AI

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Baum Inform (Баум-Информ)
Технологии: Big Data,  Data Mining

Основные статьи:

Как работают российские AI-решения для разных отраслей. Обзор комплекса BAUM AI

Любой информационный след, который оставляет оборудование, человек или система, можно фиксировать и сохранять. Эта информация представляет ценность, т.к. чаще всего искусственный интеллект обучается на исторических данных. Чем длиннее «хвост» данных, тем больше точность ИИ при решении задач. Компания «Баум-Информ» разработала программно-технический комплекс BAUM AI, который может стать основой для быстрых вычислений и инструментом для решения сложных задач заказчика.

Комплекс BAUM AI может стать основой для быстрых вычислений и инструментом для решения сложных задач заказчика

Что собой представляет BAUM AI

Это симбиоз систем хранения данных, вычислительных процессоров Nvidia (в планах — совместимость с процессорами «Модуль» и IVA) и софта собственной разработки. Комплекс позволяет создавать, обучать или использовать предобученные модели искусственного интеллекта без необходимости прямого кодирования по принципу drag n drop. BAUM AI оснащен интуитивно-понятным графическим интерфейсов (GUI).Метавселенная ВДНХ 4.5 т

Наталия Софронова, руководитель направления импортозамещения оборудования ИТ-компании Крок:

«
Особенность решения в том, что его аппаратная часть может размещаться на ИТ-оборудовании российского производства. А это значит, что программно-аппаратный комплекс будет полностью удовлетворять требованиям регуляторов в области импортозамещения электроники, и его можно использовать в ходе модернизации инфраструктуры как отечественный продукт. По кодам классификации решение полностью закрывает потребности как в аппаратной части из реестра Минпромторга, так и в программном обеспечении из реестра Минцифры.
»

Какие задачи решает BAUM AI

Многие крупные корпоративные заказчики работают с двумя источниками данных — открытыми и закрытыми. К первым относится информация из интернета, полученная с помощью краулинга и парсинга. Например, научные публикации, патентная система, корпоративные сайты компаний и т.д. Закрытые данные находятся внутри доверенного периметра (корпоративная переписка, архивные чертежи, технологические карты и т.д.).

Благодаря BAUM AI заказчик может в пару кликов обратиться к данным и собрать свою модель искусственного интеллекта, провести ее обучение, верификацию и тестирование. Контроль версионности MLops поможет в навигации по моделям или в их доработке. Сбор блок-схем моделей и процессов происходит в нотации BPMN 2.0.

Андрей Гантимуров, CTO (Chief technology officer) «Баум-Информ»:

«
Должен констатировать, что технологии искусственного интеллекта уже стали обыденностью. Они позволяют анализировать любые типы данных, помогая принимать решения даже в ситуации неопределенности. Их применяют в бизнес-процессах любой сложности и любого уровня: от проектирования и производства до логистики и продвижения. Запросы на решения различных задач поступают от моторостроителей и металлургов до патентоведов и архивистов.
»

Как BAUM AI помогает промышленным предприятиям

На предприятиях теплосетей, чтобы исключить внеплановую остановку в случае подозрения на неисправность оборудования (турбин, компрессоров, генераторов, котлов и др), нужна система мониторинга. Она предоставляет предиктивную аналитику для точной оценки фактического и прогнозируемого состояния оборудования. Это необходимо, чтобы минимизировать издержки и возможные риски. Ведь, согласно исследованиям, час простоя в промышленном производстве может стоить предприятию в среднем $100 тысяч.

Система предиктивной аналитики на базе комплекса BAUM AI позволяет выполнять интеллектуальный мониторинг, сравнивать фактические показатели оборудования с математической цифровой или эталонной моделью, находить аномалии и определять вероятность выхода из строя.

Разработка системы включает в себя общение со специалистами, создание многомерной модели базы данных (логи оборудования, информация о плановых и внеплановых работах, выходе из строя и т.д.), формирование математических и цифровых эталонных моделей работы оборудования. Затем идет разработка модуля интеллектуальной обработки данных и моделей предиктивной аналитики, настройка протоколов обмена данными между всеми единицами системы.

Все модели упаковываются в блок-схемы BPMN 2.0, для пользователей настраиваются динамические Dashboard (рабочие пространства). Профильные инженеры получают доступ к логам оборудования, они могут использовать готовые модели машинного обучения и прогнозировать внештатные ситуации, принимать взвешенные решения при внеплановых остановках.

Помощь научно-производственным компаниям

Крупные научно-производственные предприятия должны быть в курсе последних трендов, знать новые перспективные материалы. Также необходимо хранить архивные документы, чертежи, технологические карты, корпоративную переписку. В этом случае компаниям требуется база знаний, которая включает в себя структурированные и неструктурированные данные из открытых и закрытых источников.

All-in-one решение BAUM AI помогает обрабатывать большие данные. Комплекс устанавливается на территории заказчика. Решение интегрируется с корпоративной поисковой системой elasticsearch, чтобы после запроса к базе знаний пользователь сразу получал доступ к продвинутой аналитике.

Как реализуется проект: готовятся модели машинного обучения и обучаются нейронные сети для определения устойчивых научных кластеров, трендов, лидеров исследований, вероятностей получения патентов, окупаемости изобретения, анализа источников информации и авторов, сравнения текущих технологических процессов и вновь создаваемых и т.д.

Как итог: пользователи BAUM AI могут работать в трех плоскостях — интеллектуальная научная «разведка», продвинутая аналитика данных, решение узкоспециализированных задач, связанных с подбором и анализом материалов и их актуальности.

Помощь телекому

Производители систем хранения данных часто сталкиваются с поломкой дисков. Нужно решение, которое на ранней стадии спрогнозирует выход из строя или критическое состояние элементов системы.

BAUM AI способна определять сценарии, которые предшествуют выходу из строя, а также прогнозировать ключевые параметры. При этом могут быть сформированы рекомендации по профилактическим работам.

Для начала специалисты «Баум-Информ» вместе с инженерами формируют перечень анализируемых данных. Затем организуют дополнительный учет планового и внепланового обслуживания с созданием временных меток для каждого события.

Учет всех показателей системы хранения у заказчика ведется в PostgreSQL. «Баум-Информ» разрабатывает и настраивает буферную зону, получающую основной пакет анализируемых показателей.

Логика работы системы предиктивной аналитики выглядит следующим образом:

  • Данные из Zabbix (public.history_log) отправляются в модуль подкачки данных. В последнем хранится необходимое количество данных для работоспособности моделей ИИ. Данные разделяются на кластеры (Hardware, Configuration, Capacity, Performance).
  • Информация отправляется в модуль обработки входных данных. Она проходит нормализацию и стандартизацию (при необходимости).
  • Модуль содержит сохраненные натренированные модели. Все они были созданы с использованием блок-схем BPMN 2.0, по принципу drag n drop. В предиктиве участвуют обученные авторегрессионные модели, рекуррентные и свёрточные нейронные сети.
  • Нормализованные данные проходят через натренированные модели (в соответствии с кластерами).
  • В случае срабатывания какого-либо сценария создается подпись, отправляется в статистику, и запускается сценарий (замена диска, рекомендация обновления и т.д).

При работе с GUI пользователь видит основную информацию о работе предиктивной системы:

  • Статистика отображает количество отработанных часов, сработавших сценариев, новых подписей и т.д. (можно подобрать наиболее важные параметры).
  • Текущее состояние дублирует основные показатели с Zabbix в части анализируемых атрибутов.
  • Прогноз отражает необходимость замены оборудования, риск выхода из строя элементов, рекомендации по установке обновления

В результате система функционирует в штатном режиме, как отдельно приложение к общей системе мониторинга СХД. Благодаря искусственному интеллекту, инженеры могут на ранней стадии приступить к минимизации рисков ущерба или выхода из строя оборудования, а также своевременно выполнить работы, связанные с безопасностью системы в целом.

Помощь финтеху

Крупные платежные системы сталкиваются с трудностями в определении мошеннических операций в транзакциях. Решение — применение модели машинного обучения, позволяющей с высокой точностью находить мошеннические транзакции.

«Баум-Информ» использует подход, связанный с созданием новых синтетических агрегированных признаков. Они позволяют увидеть мошеннические операции в гипертрофированном виде.

Специалисты компании находят главные признаки, которые характеризуют мошеннические операции, и подбирают алгоритмы машинного обучения. При разработке учитывается как обучение с учителем, когда алгоритму показывают, какие операции являются мошенническими, так и обучение без учителя, когда алгоритм обучается, не зная, как выглядят мошеннические транзакции.

В BAUM AI размещается датасет, разворачивается кластер, настраиваются spark-сессии, позволяющие выполнять распределенные вычисления. Данные проходят нормализацию, выполняется интеллектуальное заполнение пропущенных значений в транзакциях.

Для создания моделей разрабатываются блок-схемы BPMN 2.0. Далее они drag n drop методом помещаются в конструктор ИИ, обучаются, потом снимаются метрики. Совместно с представителями заказчика проводится валидация и A/B тестирование обученных моделей.

В итоге модель обеспечивает точность до 98% при определении мошеннических операций.

Андрей Гантимуров, CTO (Chief technology officer) «Баум-Информ»:

«
Мы очень прагматично смотрим на применение искусственного интеллекта в любой области. Прежде чем приступить к реализации проекта, нужно обсудить все детали, включая ожидания заказчика, чтобы понять, действительно ли для решения бизнес-задач нужен искусственный интеллект. Далее следует выдвинуть гипотезу и договориться о том, как ее проверять, и уже потом проектировать решение. И еще важно подчеркнуть: я бы не рекомендовал планировать применение конкретных концепций на перспективу более одного-двух лет. Технологии развиваются очень быстро, и быть всегда в тренде позволяет только agile-подход.
»


Наталия Софронова, руководитель направления импортозамещения оборудования ИТ-компании КРОК:

«
На внедрение полноценного решения потребуется от полугода до года, в ряде случаев чуть больше. Все, безусловно, зависит от задач, которые сильно сказываются на объемах работы. Если говорить поэтапно, то на проверку гипотезы, как правило требуется от пары недель до месяца, на разработку пилота и запуск минимально жизнеспособного продукта (MVP) - от трех месяцев до полугода.
»



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (125)
  БизнесАвтоматика НПЦ (118)
  Инфосистемы Джет (13)
  Сбербанк (10)
  Полиматика (Polymatica) (9)
  Другие (623)

  Ростелеком (3)
  БизнесАвтоматика НПЦ (3)
  NLogic (2)
  Сапиенс солюшнс (Sapiens solutions) (2)
  Сбербанк (2)
  Другие (48)

  БизнесАвтоматика НПЦ (13)
  OneFactor (Уанфактор) ЕдиныйФактор (3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (2)
  Яндекс (Yandex) (2)
  Московский центр инновационных технологий в здравоохранении (2)
  Другие (57)

  БизнесАвтоматика НПЦ (7)
  Полиматика (Polymatica) (2)
  Яндекс.Облако (Yandex Cloud) (2)
  Группа компаний ЦРТ (Центр речевых технологий) (2)
  Департамент информационных технологий Москвы (ДИТ) (2)
  Другие (62)

  БизнесАвтоматика НПЦ (3)
  SL Soft (СЛ Софт) (2)
  Полиматика (Polymatica) (2)
  Сбер Бизнес Софт (2)
  Синимекс (Cinimex) (2)
  Другие (56)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (2, 236)
  БизнесАвтоматика НПЦ (2, 117)
  SL Soft (СЛ Софт) (4, 15)
  Полиматика (Polymatica) (4, 15)
  Oracle (12, 14)
  Другие (307, 171)

  БизнесАвтоматика НПЦ (1, 3)
  Полиматика (Polymatica) (1, 2)
  SL Soft (СЛ Софт) (1, 2)
  Dell EMC (1, 2)
  IBM (1, 1)
  Другие (6, 6)

  БизнесАвтоматика НПЦ (1, 13)
  Сбербанк (2, 2)
  К-Скай (K-SkAI) (1, 2)
  Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (1, 2)
  Другие (14, 16)

  БизнесАвтоматика НПЦ (1, 7)
  Сбербанк (2, 2)
  Ситроникс КТ (ранее Кронштадт Технологии) (2, 2)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 2)
  Полиматика (Polymatica) (1, 2)
  Другие (15, 18)

  SL Soft (СЛ Софт) (3, 4)
  Полиматика (Polymatica) (3, 4)
  БизнесАвтоматика НПЦ (1, 2)
  Rubbles (Раблз) (1, 2)
  Правительство Москвы (1, 1)
  Другие (8, 8)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Deductor - 226
  Visary BI Платформа бизнес-аналитики - 117
  Polymatica Analytics Аналитическая платформа - 13
  IBM SPSS Decision Management - 10
  Loginom Аналитическая платформа - 10
  Другие 160

  Visary BI Платформа бизнес-аналитики - 3
  Polymatica Analytics Аналитическая платформа - 2
  EMC Greenplum Data Computing Appliance - 2
  Minit Система класса Process Mining - 1
  Informatica Axon Data Governance - 1
  Другие 5

  Visary BI Платформа бизнес-аналитики - 13
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2
  Loginom Аналитическая платформа - 2
  Platforma и HFLabs: Технология безопасного метчинга данных - 2
  Webiomed - Платформа предиктивной аналитики и управления рисками в здравоохранении на основе машинного обучения - 2
  Другие 11

  Visary BI Платформа бизнес-аналитики - 7
  PIX Process Management (PIX Процессы) - 2
  ЦРТ: Speech Analytics Lab - 2
  CM.Expert Data Mining платформа - 2
  Polymatica Analytics Аналитическая платформа - 2
  Другие 14

  Polymatica Analytics Аналитическая платформа - 2
  Rubbles Customer Insight - 2
  Visary BI Платформа бизнес-аналитики - 2
  Систематика: Optimining (ранее СвойРМ) - 1
  МТС DataOps Platform - 1
  Другие 5

Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  БизнесАвтоматика НПЦ (120)
  Большая Тройка (46)
  Сбербанк (14)
  Умная Логистика (14)
  Доверенная среда (13)
  Другие (467)

  Доверенная среда (5)
  Большая Тройка (4)
  Цифра (4)
  БизнесАвтоматика НПЦ (3)
  Ростелеком (3)
  Другие (54)

  БизнесАвтоматика НПЦ (12)
  OneFactor (Уанфактор) ЕдиныйФактор (3)
  РИР (Росатом Инфраструктурные решения) (3)
  Яндекс (Yandex) (2)
  Мегапьютер Интелидженс (Megaputer Intelligence) (2)
  Другие (44)

  БизнесАвтоматика НПЦ (5)
  РИР (Росатом Инфраструктурные решения) (3)
  Яндекс.Облако (Yandex Cloud) (2)
  Axenix (ранее Аксенчер Россия) Аксеникс (2)
  CM.Expert (АвтоЭксперт) (2)
  Другие (63)

  БизнесАвтоматика НПЦ (8)
  Сбер Бизнес Софт (2)
  Сбербанк (2)
  Синимекс (Cinimex) (2)
  Университет Иннополис (2)
  Другие (61)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  БизнесАвтоматика НПЦ (2, 117)
  Большая Тройка (2, 46)
  Умная Логистика (2, 14)
  Доверенная среда (1, 13)
  Цифра (2, 10)
  Другие (259, 127)

  Доверенная среда (1, 5)
  Большая Тройка (2, 4)
  Цифра (1, 4)
  БизнесАвтоматика НПЦ (1, 3)
  Умная Логистика (2, 2)
  Другие (6, 8)

  БизнесАвтоматика НПЦ (1, 13)
  РИР (Росатом Инфраструктурные решения) (2, 3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
  МегаФон (2, 1)
  Netrika (Нетрика) (1, 1)
  Другие (7, 7)

  БизнесАвтоматика НПЦ (1, 7)
  РИР (Росатом Инфраструктурные решения) (3, 4)
  Цифра (1, 2)
  CM.Expert (АвтоЭксперт) (1, 2)
  Датакаталог (1, 2)
  Другие (14, 14)

  Сбербанк (2, 2)
  Датакаталог (1, 2)
  СПбГУ ИТМО (Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики) (1, 2)
  Цифра (1, 2)
  Rocket Group (Рокет Групп) (1, 2)
  Другие (14, 15)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Visary BI Платформа бизнес-аналитики - 117
  Большая Тройка: АИС Редактор территориальных схем - 39
  Доверенная среда: Триафлай BI-платформа - 13
  ZIIoT Платформа для работы с промышленными данными - 10
  Luxms BI - 8
  Другие 128

  Доверенная среда: Триафлай BI-платформа - 5
  ZIIoT Платформа для работы с промышленными данными - 4
  Visary BI Платформа бизнес-аналитики - 3
  EMC Greenplum Data Computing Appliance - 2
  Большая Тройка: АСУ Управление отходами - 2
  Другие 10

  Visary BI Платформа бизнес-аналитики - 13
  Росатом Цифровое теплоснабжение - 2
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2
  N3.Аналитика - 1
  МегаФон: Аналитика городской среды - 1
  Другие 6

  Visary BI Платформа бизнес-аналитики - 7
  Росатом Цифровое теплоснабжение - 2
  Arenadata Catalog - 2
  CM.Expert Data Mining платформа - 2
  ZIIoT Платформа для работы с промышленными данными - 2
  Другие 15

  Rocket Group: rTIM Платформа генеративного дизайна территорий - 2
  Visary BI Платформа бизнес-аналитики - 2
  ZIIoT Платформа для работы с промышленными данными - 2
  Arenadata Catalog - 2
  Наносемантика NLab Marker - 1
  Другие 11