Антон Фролов, Content AI: Крупные компании регулярно несут убытки из-за потерянных документов
Сегодня сложность и многогранность информационной архитектуры компании считается нормой. СЭД, ERP, wiki-система, корпоративный портал, таск-трекер — это стандартный минимум для крупных организаций. Однако при всех плюсах технологизации бизнес-процессов в таком положении вещей есть и свои минусы. Накопленные в каждой системе данные зачастую существуют в своей отдельной реальности и не всегда эффективно используются. В результате такие казусы, как повторение ранее выполненной работы или невозможность найти актуальную версию документа, становятся регулярными. О том, с какими неприятностями сталкивается бизнес из-за информационного беспорядка, и как можно их избежать, — рассказал руководитель отдела разработки продуктов для интеллектуального поиска компании Content AI Антон Фролов.
Насколько актуальна для российских компаний описанная выше проблема?
Антон Фролов: Наш опыт и практика взаимодействия с компаниями из разных секторов экономики подтверждают наличие такой проблемы. Занимаясь разработкой продуктов для интеллектуальной обработки данных на протяжении многих лет, мы так или иначе изучаем, как в компаниях организован процесс работы с документами: как производится оцифровка бумажных экземпляров, как переведенная в электронный вид информация распределяется между различными подразделениями, каков жизненный цикл тех или иных документов. В результате этого наблюдения и анализа мы сделали вывод, что одним из тонких мест в этом процессе является слабоструктурированное хранение документов и отсутствие эффективного поиска по разным источникам. Причем, несмотря на то, что на смену бумажным архивам уже давно пришли электронные, проблема хранения и использования данных все еще остается актуальной.
Можете рассказать об этом подробнее?
Антон Фролов: Внутри больших компаний с разветвленной структурой сегодня существует большое количество хранилищ и рабочих сред, содержащих гигантский массив информации, однако связь между этими ресурсами зачастую слабая или вовсе отсутствует.
Типичная ситуация выглядит так: в ИТ-архитектуру компании входят СЭД, посредством которой ведется основной документооборот; корпоративная wiki для управления и хранения знаниями; таск-трекер, в котором сотрудники ведут учет выполнения ежедневных задач и следят за статусом проектов. Добавим к этому электронную почту, корпоративный портал и набор сетевых папок.
Зачастую у каждого сотрудника существует своя карта нужных фрагментов корпоративного информационного пространства, внутри которой он ежедневно работает. Обычно она фиксируется в виде набора ярлыков на рабочем столе, закладок в браузере или заметок. Однако бывают ситуации, когда приходится выходить за пределы своего ареала и попадать в информационную terra incognita. Причиной может стать нестандартный запрос от руководства, поиск информации по нештатной ситуации, сбор всех доступных данных для принятия решения о запуске нового проекта, и даже такая банальная ситуация, как отсутствие на месте нужного специалиста.
Перед сотрудником возникает множество вопросов: в какой системе и по каким ключевым словам нужно искать информацию? Насколько эффективно работает поиск на уровне отдельных систем и можно ли доверять его результатам? Ведется ли поиск по отсканированным копиям документов? Актуален ли найденный документ или это устаревшая версия? Допустить ошибку в такой ситуации довольно легко.
Какие риски может спровоцировать такая ситуация?
Антон Фролов: В первую очередь это производственные и финансовые риски, а также связанные с ними риски недополучения прибыли. Известен ряд случаев, когда компании несли те или иные потери из-за не найденного вовремя документа. Например, летом 2000 года в Лондоне был открыт пешеходный мост через Темзу, получивший название Millenium Footbridge. Но уже через несколько дней его пришлось закрыть, так как он сильно раскачивался, когда по нему двигались пешеходы. Оказалось, что подобный эффект был описан еще в 1993 году в одном из технических журналов, но эта статья не была вовремя найдена конструкторами. В результате мост был перестроен и открыт только через два года, а бюджет проекта превышен в 9 раз.
Пример из российской практики: в одном крупном промышленном холдинге на производстве произошла нештатная ситуация из-за того, что испытания оборудования проводились с некорректными настройками. Это было связано с отсутствием на месте специалиста, знавшего правильные настройки, а где их искать — никто не знал. Чекап для искусственного интеллекта: зачем и как тестировать ИИ-решения?
Помимо финансовых, возможны и правовые риски. Например, если вы заключите договор на поставку продукции на основе устаревшей спецификации, а потом окажется, что такого оборудования уже нет на складе, клиент вполне может обратиться в суд.
Как можно исключить эти риски и улучшить процесс поиска нужной информации?
Антон Фролов: Решением проблемы может стать создание единого информационного пространства внутри организации на базе корпоративного поискового портала. Основой может служить наш продукт Content AI Intelligent Search. Он позволяет объединить все источники для обеспечения сквозного поиска и навигации по всем видам информации. Причем система выполняет интеллектуальный поиск, который находит документы не только по точному совпадению с запросом, но и по смыслу. Также за счет встроенной OCR-технологии обеспечивается поиск по PDF-файлам и другим файлам в графических форматах.
Кажется, что по функциональности решение напоминает интернет-поисковик?
Антон Фролов: Совершенно верно, речь идет об аналоге интернет-поисковика, но только в периметре организации. Мы постарались сделать интерфейс продукта и используемые внутри понятия максимально схожими с теми, что используются при поиске в интернете, а также добавили элементы социальной сети. Так, в Intelligent Search источники документов являются аналогами сайтов, а документы — аналогами веб-страниц. Документы можно добавлять в закладки и подписываться на их изменения. Аналогом социальной сети является каталог пользователей, используя который сотрудники могут подписаться на документы отдела, группы или конкретного автора. Для оперативной навигации к актуальным источникам информации в текст документов добавляются гиперссылки на упоминания ключевых продуктов и технологий. В результате пользователи сразу попадают в правильный раздел wiki, описывающий данный продукт, в каком бы документе он не упоминался. Кроме того, у нашего решения есть мобильная версия с полной функциональностью.
Какие дополнительные возможности появились в вышедшей в декабре версии продукта?
Антон Фролов: Мы продолжаем расширять список источников, по которым обеспечивается поиск и навигация. В новой версии к ним добавились трекер задач Jira, каталог пользователей на базе Active Directory и СУБД. Теперь продукт обеспечивает поиск по содержимому MS SQL Server, MySQL и PostgreSQL.
Благодаря информации из каталога пользователей стала возможна фильтрация найденных документов не только по имени автора, но и по его должности или отделу.
Если раньше в фильтре можно было выбрать только тип источника, то теперь мы поддерживаем иерархические фильтры, которые можно раскрывать последовательно. В результате пользователь может оперативно перейти на нужный уровень выбранного источника вне зависимости от его типа.
Построенное единое информационное пространство теперь можно использовать не только для поиска и навигации, но и для анализа. Например, на основе данных из каталога пользователей можно построить графический отчет для выявления отделов с максимальной текучкой кадров. Имея на входе только название проекта, можно в виде отчета получить информацию о том, кто и когда работал в этом проекте, в каких источниках хранятся результаты этой работы.
Один из важных нюансов при работе с корпоративными документами — учет прав доступа к конфиденциальной информации. Как Intelligent Search решает эту задачу?
Антон Фролов: Результат поиска всегда строится с учетом прав доступа пользователя, который его выполняет. Если к каким-то документам у пользователя прав нет, в результатах их просто не будет. Это достигается за счет учета прав для каждого документа при обходе источников и учета прав текущего пользователя.
Возможно ли использование устройства на отечественных операционных системах?
Антон Фролов: Да, весной 2022 года мы выпустили версию, которая поддерживает операционные системы на базе Linux. Продукт адаптирован под основные отечественные ОС, в том числе Alt Linux, Astra Linux и Ред ОС. Добавлю, что Intelligent Search входит в реестр российского ПО.
Кроме нивелирования рисков, какие еще выгоды для организации предлагает продукт?
Антон Фролов: Во-первых, более эффективное использование информационных ресурсов помогает принимать стратегические решения на основе актуальных данных и сокращать затраты на непрофильные процессы. Во-вторых, упорядочив базу знаний компании, можно ускорить внедрение инноваций, так как сотрудники смогут оперативно найти информацию по определенной задаче, путям ее решения и достигнутым результатам. В-третьих, объединение всех источников в единое пространство повышает прозрачность бизнес-процессов, снижает вероятность повторного выполнения работ и улучшает кооперацию между изолированными группами сотрудников.
Какие конкретные результаты показывает внедрение Intelligent Search?
Антон Фролов: В ведущей российской горно-металлургической компании с помощью нашего продукта в едином пространстве были объединены 400 тыс. документов, включая отчеты о научно-технической деятельности, патенты, диссертации. Источниками документов были портал MS Sharepoint, wiki-система Confluence и сетевые папки. Благодаря реализации поиска по ключевым источникам информации компания смогла оптимизировать процесс разработки продуктов.
Еще пример: в крупной ракетостроительной корпорации мы помогли упростить поиск полезной информации в документах прошлых лет для конструкторов и инженеров, а также унифицировать стандарты между головным и дочерними предприятиями. В единое пространство были объединены 7 источников информации, включающие СЭД, ERP, PLM системы и несколько внутренних решений на базе СУБД, индексировано более 1 млн файлов, включая исследовательские работы, конструкторские чертежи, результаты испытаний, бухгалтерские документы. По итогу сотрудники получили удобный доступ к огромному массиву знаний, накопленному за несколько десятилетий работы.
В настоящее время мы реализуем проект по внедрению интеллектуального поиска по базе резюме для кадрового агентства и поиска по почтовым архивам для крупного ритейлера. В результате клиенты смогут перейти с узкоспециализированного западного ПО на отечественное решение, применимое к гораздо большему числу источников, в развитии которого будут учитываться их пожелания.