Разработчики: | Abbyy Россия |
Дата последнего релиза: | 2019/01/11 |
Технологии: | СЭД - Системы потокового распознавания |
Содержание |
По оценке компании ABBYY (данные октября 2014 года), ее технологии потокового ввода документов и данных используют в своей работе 80 из ТОП-100 российских банков (согласно рейтингу портала Banki.ru). Несмотря на нестабильную экономическую обстановку, организации, в том числе из банковской отрасли, продолжают внедрять ИТ-решения, обеспечивающие оптимизацию бизнес-процессов. Внедрение систем в области потокового ввода данных – один из способов сократить затраты, повысить общую эффективность работы и быть конкурентоспособными, что особенно актуально для банков.
В среднем, по данным экспертов ABBYY, такие системы позволяют сократить затраты на обработку документов более чем на 50%. При этом возврат инвестиций от их внедрения в среднем составляет от 3 месяцев до 1 года. Решения ABBYY позволяют увеличить скорость ввода данных до 10 раз, и сократить ошибки при вводе как минимум в 3 раза.
2019
Анонс ID.Abonent с применением технологий ABBYY и VisionLabs
20 июня 2019 компания ABBYY сообщила о разработанном компанией GoldenSIM в партнерстве с ABBYY и VisionLabs мобильном приложении ID.Abonent, которое позволяет удаленно регистрировать SIM-карты в сети операторов связи. Решение с применением технологий ABBYY и VisionLabs на лету распознает паспортные данные, подтверждает личность пользователя и отправляет информацию о новом клиенте оператору. Через несколько минут новый номер зарегистрирован в сети, и им уже можно пользоваться. Подробнее здесь.
В ABBYY FlexiCapture появилась технология обработки естественного языка
11 января 2019 года ABBYY сообщила, что дополнила платформу ABBYY FlexiCapture технологиями обработки естественного языка (Natural language proccessing, NLP). Теперь решение может извлекать данные из неструктурированных документов, таких как договоры, уставы, доверенности, письма или тексты новостей. Кроме того, в решении появилась функциональность для оценки и улучшения качества изображений, а также мобильный клиент. Эти возможности делают ABBYY FlexiCapture универсальной платформой для интеллектуальной обработки любой информации из различных источников, включая смартфоны.
Благодаря технологиям NLP, платформа умеет находить в текстах документов важные сущности, такие как имена, названия организаций и адреса, а также выявлять значимые факты и связи между ними. С дополнительными функциональными модулями NLP ABBYY FlexiCapture юристы смогут в разы быстрее анализировать многостраничные договоры, выявлять значимые условия сделки и создавать карточки документов в корпоративной системе.Витрина данных НОТА ВИЗОР для налогового мониторинга
ABBYY FlexiCapture эффективно извлекает информацию даже из изображений низкого качества – например, размытых снимков или деформированных документов. Платформа может обрабатывать изображения со сложным фоном, печатями, водяными знаками, голограммами или исправлениями ручкой. Решение обрезает скан или фотографию по границам документа, выравнивает фон, повышает резкость текста и удаляет ненужные элементы, такие как подписи и печати. Если система понимает, что качественно распознать данные не удастся, то отправляет пользователю уведомление о необходимости сделать еще одну фотографию или скан. Это помогает снизить нагрузку на сотрудников компании, заранее исключив изображения, не пригодные для обработки.
Теперь платформа ABBYY FlexiCapture поддерживает и мобильный ввод данных. С помощью ABBYY FlexiCapture Mobile Client пользователь может сфотографировать документ на телефон и отправить его на сервер ABBYY FlexiCapture. Приложение будет полезно для выездных менеджеров – к примеру, чтобы быстро обрабатывать клиентские документы при удаленном оформлении счета, страхового полиса или карты лояльности.
Один из признаков цифровой организации – это умение качественно работать с большим объемом данных. Это дает возможность создавать востребованные продукты, вовремя оценивать риски, нанимать лучших специалистов и менять финансовую стратегию. ABBYY FlexiCapture выводит обработку информации на другой уровень, позволяя быстро извлекать данные из договоров, резюме, писем и любых других документов. Решение легко встроить в большинство бизнес-процессов, в том числе с применением RPA. С платформой ABBYY программные роботы и другие системы-потребители в ИТ-ландшафте предприятия становятся умнее и производительнее: они не просто переносят данные, а полноценно работают с бизнес-информацией. Дмитрий Шушкин, генеральный директор ABBYY Россия
|
Появившиеся возможности и модули ABBYY FlexiCapture:
- Технологии NLP для обработки данных из неструктурированных документов;
- Автоматическое улучшение изображений для эффективной работы с документами любого качества;
- ABBYY FlexiCapture Mobile Client – приложение на iOS или Android для быстрой и удобной передачи данных из документов, сфотографированных на мобильные устройства;
- Готовые коннекторы к RPA-системам ведущих производителей. ABBYY FlexiCapture расширяет функциональность сторонних решений с помощью технологий интеллектуальной обработки информации.
2017: FlexiCapture теперь использует технологии машинного обучения
13 июля компания ABBYY объявила об обновлении системы ABBYY FlexiCapture. В обновлённом решении используются технологии машинного обучения и свёрточных нейронных сетей, которые позволяют крупным организациям гибко управлять всей информацией в едином потоке.
«Во время цифровой трансформации бизнеса компаниям необходимо быстро запускать новые сервисы и выходить на новые рынки. Огромное количество ценной и важной информации поступает в организации в виде разрозненных документов из множества источников. ABBYY FlexiCapture даёт возможность автоматически обрабатывать и применять эти данные для развития бизнеса, а в результате — мгновенно реагировать на рыночные изменения и повышать качество обслуживания клиентов», — рассказал Дмитрий Шушкин, генеральный директор ABBYY Россия.
Единое решение для всех типов документов
Обновленная FlexiCapture способна стать ключевым элементом корпоративной инфраструктуры в крупных организациях, которые управляют множеством бизнес-процессов и обрабатывают большой поток информации, утверждают разработчики. Платформа классифицирует и извлекает данные из входящих электронных писем и вложений, бумажных документов, электронных документов в офисных форматах, фотографий с камер и мобильных устройств. Решение легко масштабируется и подходит для обработки любого объёма документации.
Автообучение
На результатах работы верификаторов система сама учится извлекать данные из ряда документов, что позволяет быстро настраивать шаблоны для новых типов документов. По мнению разработчиков, это особенно важно при реализации масштабных проектов с необходимостью обрабатывать большое количество данных.
«Технологии машинного обучения дают возможность гибко настраивать и изменять шаблоны для обработки новых видов документов. Таким образом, ABBYY FlexiCapture позволяет добавлять новые данные в информационные системы без значительных финансовых и временных затрат на доработку. Это особенно важно для компаний при выходе на новые рынки, изменении бизнес-процессов или запуске новых продуктов», — подчеркнули в компании.
Интеллектуальная классификация
Решение автоматически сортирует документы по типам и пользовательским категориям исходя из внешнего вида документа, с помощью свёрточных нейронных сетей, статистического и семантического анализа текста.
Обработка комплектов
Платформа может обрабатывать комплекты документов со сложной иерархической структурой, сравнивать информацию внутри комплектов и проводить междокументные проверки.
Мультитенантность
Теперь несколько групп пользователей могут работать с платформой независимо друг от друга, не имея доступа к данным и настройкам других подразделений. Систему могут одновременно использовать разные отделы, департаменты или филиалы в рамках одной организации. Это позволяет применять ABBYY FlexiCapture как единую корпоративную платформу для множества бизнес-процессов, таких как управление взаимоотношениями с клиентами, производственная, закупочная и юридическая деятельность компании, отметили в ABBYY.
Мониторинг SLA
Появилась возможность контролировать производительность системы, задавая время обработки и уровень важности для различных пакетов документов.
2015
ABBYY FlexiCapture 11
5 февраля 2015 года ABBYY представила FlexiCapture 11, версию системы потокового ввода, которая автоматически извлекает данные из бумажных документов и сохраняет их в информационную систему предприятия. Используя это решение, компании сокращают издержки благодаря увеличению скорости обработки документов и улучшают качество вводимых данных.
ABBYY FlexiCapture востребована в организациях различных отраслей: банковской, страховой, энергетической, нефтегазовой, телекоммуникационной и других, а также в государственном секторе.
С 11й версией стало быстрее и удобнее верифицировать документы, из которых нужно извлечь большое количество данных, – многостраничные накладные, счета-фактуры, документы валютного контроля и т.д. Такая возможность особенно важна для компаний финансового, промышленного секторов и ритейла. Чтобы оператору было удобно ориентироваться в документе, добавлены возможности логической группировки или сворачивания полей, что увеличивает скорость обработки данных.
ABBYY FlexiCapture позволяет лучше распознавать документы плохого качества, даже те, где значения некоторых полей плохо читаются из-за помарок или низкого качества печати. Это упростит документооборот в территориально-распределенных компаниях, которые работают с большим количеством контрагентов. Решение может только по одному найденному полю, например, названию компании или БИК, подставить все остальные значения из базы поставщиков. Повысить качество данных помогает стандартизация: вне зависимости от того, в каком формате указаны сумма и дата во входящем документе, ABBYY FlexiCapture внесет данные в целевую систему в заданном компанией формате. Все это помогает минимизировать ошибки при обработке документов.
Также в новой версии добавлены возможности интеллектуальной обработки документов на основе их содержания. Теперь ABBYY FlexiCapture позволяет гибко настраивать этапы и логику обработки документов на основе любых данных из документа: имени отправителя, региону, дате, теме письма и т.д. Например, если компания работает с большим количеством поставщиков, можно настроить автоматическую маршрутизацию документов по названию компании.
Кроме того, реализованы новые возможности экспорта, улучшена архитектура и удобство администрирования системы. А сокращение времени на внедрение и настройку проекта стало возможным благодаря поддержке универсального языка разработки (.NET скриптов).
Тестирование ABBYY FlexiCapture на серверах Huawei
В конце 2015 года Huawei и ABBYY стали стратегическими партнерами. Среди первых результатов – настройка конфигурации системы потокового ввода данных и документов ABBYY FlexiCapture на серверах Huawei. С этим совместным решением корпоративные клиенты могут обрабатывать более 1,5 млн. страниц документов в сутки.
Тестовые испытания ABBYY FlexiCapture на серверах Huawei завершились в ноябре прошлого года. Благодаря специальной настройке конфигурации ABBYY FlexiCapture на серверах Huawei FusionCube E9000 и Huawei RH1288 v3 удалось достичь высокой производительности системы потокового ввода данных.
Такая производительность требуется крупным компаниям и государственным учреждениям для обработки большого объема документов в короткие сроки. Так банкам необходимо проводить валютный контроль в срок от 3 до 10 дней, и автоматическая обработка клиентских документов значительно ускоряет этот процесс. В энергораспределительных компаниях поток финансовых документов необходимо обработать в течение последних 10 дней месяца. Максимальная нагрузка на систему приходится на этот период и требует высокой производительности. В ФНС России объемы обработки документов во время налоговой отчетности составляют свыше 1 млн. страниц в день.
«Количество документов в крупных компаниях и государственных структурах достигает колоссальных объемов. Обработка этих документов отнимает много времени и человеческих ресурсов. В таком случае технологии интеллектуальной обработки информации – незаменимы. В связке с мощным серверным решением они позволяют в ограниченный срок вводить и обрабатывать сотни тысяч страниц, что дает важные конкурентные преимущества. При этом компаниям не нужно перестраивать ИТ-инфраструктуру, решение встраивается в уже существующую информационную систему», — отмечает Дмитрий Шушкин, заместитель генерального директора ABBYY Россия.
2014: ABBYY FlexiCapture 10
Продукт автоматизирует извлечение информации из бумажных документов и сохраняет данные в информационной системе предприятия, говорится в сообщении компании. ABBYY FlexiCapture позволяет обрабатывать разные виды документов: как с фиксированной структурой (анкеты, экзаменационные листы, страховые формы, налоговые декларации), так и слабоструктурированные (счета, транспортные накладные) и неструктурированные документы (договоры и письма).
Среди особенностей ABBYY FlexiCapture 10 – повышенная отказоустойчивость, основанная на поддержке кластерной технологии Microsoft Cluster Server. Кластер или набор независимых компьютеров обеспечивает непрерывность рабочего процесса, доступность и сохранность важной информации даже при серьезных отказах оборудования и ПО. Как полагают в компании, реализация повышенной отказоустойчивости может быть востребована в государственных структурах, транспортных компаниях, банках, операторах мобильной связи и в других компаниях, в чьей деятельности критичной является непрерывность процесса обработки документов.
В проектах, связанных с потоковым вводом и извлечением данных, одним из ключевых является этап создания описаний документов. По ним система потокового ввода данных определяет, что это за документ и какую информацию из него предстоит извлечь. Реализованные в ABBYY FlexiCapture 10 технологии самообучения системы позволяют не только автоматизировать процесс создания описаний документов, но и дают возможность специалистам редактировать такие описания сразу после их создания — для улучшения результата работы системы в дальнейшем. Это, в свою очередь, сокращает и упрощает выполнение этапа настройки системы. Создание классификатора документов и его настройка в новой версии продукта также могут производиться автоматически, путем обучения системы на 3-5 примерах документов каждого типа.
В дополнение к ранее поддерживаемому режиму работы в локальной сети в ABBYY FlexiCapture 10 реализовано взаимодействие рабочих мест операторов с сервером системы через интернет. Веб-интерфейс станции верификации позволяет производить удаленную проверку данных. Таким образом, компании теперь могут нанимать персонал в других регионах или странах и снижать расходы за счет возможности использования удаленных рабочих мест.
Для станции сканирования в новой версии ABBYY FlexiCapture также поддерживается дистанционная установка через интернет. При этом настройки сканирования могут быть заданы оператором на месте или загружены с сервера. Данная технология позволяет создать централизованный электронный архив документов в компаниях с широкой территориальной сетью.
Оптимзированная масштабируемость не только обеспечивает простой переход системы с локального типа установки на сетевой, но и позволяет увеличивать количество обрабатываемых страниц, утверждают разработчики. Это делает ABBYY FlexiCapture 10 востребованной как для предприятий малого и среднего бизнеса, так и в крупных организациях и проектах.
ABBYY FlexiCapture 10 автоматически обрабатывает большие объемы разных типов документов в одном потоке. Программа выделяет из потока отдельные документы, извлекает из них необходимые данные и отправляет результаты вместе с изображением оригинального документа в базы данных, архивы и любые приложения. С решением ABBYY различные организации, в том числе страховые компании и банки, крупные корпорации, правительственные структуры и образовательные учреждения, могут автоматизировать процесс ввода документов и данных в информационные системы, снизить затраты и повысить качество обслуживания клиентов.
Появление в программе новых функций, позволяющих еще шире использовать возможности веб-станций, обусловлено потребностями рынка. Среди клиентов ABBYY множество крупных, территориально распределенных компаний, для которых подобная функциональность высоко востребована. Так, например, в удаленном офисе обслуживания клиентов не всегда есть возможность оперативно установить и настроить необходимое программное обеспечение на рабочем месте сотрудника. При этом веб-интерфейс позволяет в окне браузера открывать всегда обновленную версию программного обеспечения. Это актуально, в частности, для страховых компаний с обширной филиальной сетью.
Использование веб-приложений в ходе автоматизации обработки документов будет эффективно для ряда организаций:
- В компаниях, которые под конкретные проекты привлекают сотрудников, работающих на дому. Например, в исследовательских агентствах, набирающих студентов для проведения массовых исследований;
- В организациях, где используют бизнес-модель «партнерских продаж», с привлечением сотрудников сторонних организаций. Например, в банках с точками выдачи кредитов в торговых сетях;
- В компаниях, где стремятся сократить операционные издержки и выносят трудоемкие операции верификации документов в бэк-офис, в региональные отделения, тем самым оптимизируя затраты по ФОТ (фонд оплаты труда), а также по аренде и содержанию офисов.
2013: ABBYY FlexiCapture 9.0
ABBYY FlexiCapture 9.0 — это решение для потокового ввода данных и обработки документов. Автоматически извлекает информацию из бумажных документов и форм и сохраняет ее для различных информационных систем предприятия.
Продукт представляет собой единый центр ввода документов и способен обрабатывать любые типы документов вне зависимости от структуры:
- Формы с жесткой структурой/структурированные документы: анкеты, экзаменационные тесты, бланки, страховые формы, запросы на выплату медицинской страховки, налоговые декларации и т.п.
- Слабоструктурированные документы: счета, заказы на покупку, транспортные накладные и т.п.
- Неструктурированные документы: письма, контракты, статьи и т.п.
Структура и составляющие
- Серверная архитектура. Архитектура ABBYY FlexiCapture 9.0 включает в себя несколько серверов: сервер обработки, сервер приложений, сервер лицензий и сервер данных.
- Специальные выделенные станции. Для распределения функциональности системы в рамках организации имеются специальные выделенные станции: станция настройки, станция сканирования, станция верификации, станция верификации данных и станция администрирования и мониторинга.
- Удаленная станция сканирования. Данная станция позволяет отправлять отсканированные документы на обработку через HTTP-протокол.
- Удаленная станция верификации данных. Позволяет сделать процесс верификации гибким и снизить затраты на обработку документов.
- Консоль удаленного администрирования и мониторинга. Позволяет управлять системой из любого места через Web-протокол.
Инструментарий для разработчика (SDK — software developer kit)
Продукт предназначен для встраивания технологий интеллектуальной обработки документов и потокового ввода данных в программные решения. В основе инструментария — технология ABBYY FlexiCapture, которая используется для обработки разного типа документов: с фиксированной структурой (анкеты, экзаменационные листы, страховые формы, налоговые декларации), слабоструктурированные (счета, транспортные накладные) и неструктурированные (контракты, письма), говорится в сообщении ABBYY.
Инструментарий 9.0 отличается оптимизированной, по сравнению с предыдущей версией, работой в многопоточных серверных решениях, а также поддержкой как 32-, так и 64-разрядных архитектур. Создавать собственные приложения с применением ABBYY FlexiCapture Engine верси 9.0 стало намного быстрее и проще, утверждают в компании. Для удобства разработчиков в SDK полностью обновлены и расширены возможности API (application programming interface — интерфейс прикладного программирования).
Так, API — FlexiCaptureProcessor — теперь обеспечивает прямой доступ к технологиям FlexiCapture, что дает возможность разработчику через код (а не визуальную среду, как было в прошлой версии) управлять процессом обработки: загружать изображения, накладывать параметры обработки, формировать список накладываемых шаблонов и осуществлять выгрузку данных. При этом оптимизированное руководство разработчика позволяет быстро и легко находить необходимую информацию, а обширная библиотека исходных кодов поделена на разделы и содержит пошаговую инструкцию по работе с ними. Используя примеры кодов в создаваемом приложении, можно значительно ускорить разработку и сократить процесс обучения, подчеркнули в ABBYY.
Благодаря новому сценарию Mobile Data Capture (MDC) можно получить более качественные результаты распознавания изображений, сделанных камерой мобильного телефона — процесс обработки осуществляется на сервере. Технология MDC позволяет исправлять характерные для фотографий искажения, в том числе трапециевидные искажения, шумы и нечеткость.
В свою очередь, новый многоуровневый классификатор документов при работе с большим количеством шаблонов позволяет предварительно идентифицировать отдельные страницы и отнести их к определенному типу документа. Благодаря этому сокращается время поиска необходимых шаблонов документов.
Технология «черного маркера» защищает конфиденциальную информацию на изображениях и PDF-файлах. При использовании этой технологии на документе остаются видимыми только те поля, которые нужны, конфиденциальная же информация скрывается, закрашиваясь «черным маркером», пояснили в ABBYY.
Кроме того, ABBYY FlexiCapture Engine 9.0 позволяет создавать PDF-файлы с ультравысоким сжатием MRC (Mixed Raster Content). С помощью этой технологии размер файла может уменьшиться до 10 раз, по сравнению с JPEG-сжатием.
Подрядчики-лидеры по количеству проектов
ЭЛАР (Электронный архив, НПО Опыт) (242)
Directum (Директум) (132)
Smart Engines (Смарт Энджинс) (123)
Cognitive Technologies (Когнитивные технологии) (91)
Синтеллект (Syntellect) (78)
Другие (746)
Синтеллект (Syntellect) (52)
Smart Engines (Смарт Энджинс) (14)
ЭЛАР (Электронный архив, НПО Опыт) (10)
Directum (Директум) (5)
Abbyy Россия (4)
Другие (32)
ЭЛАР (Электронный архив, НПО Опыт) (10)
Beorg (Биорг) (8)
Smart Engines (Смарт Энджинс) (7)
NVI Solutions (Норд Вижен Интелледженс Солюшенс) (3)
Digital Design (Диджитал Дизайн) (2)
Другие (19)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
ЭЛАР (Электронный архив, НПО Опыт) (11, 243)
Directum (Директум) (6, 161)
Smart Engines (Смарт Энджинс) (17, 130)
Abbyy Россия (16, 111)
Cognitive Technologies (Когнитивные технологии) (5, 96)
Другие (171, 622)
Синтеллект (Syntellect) (2, 52)
Smart Engines (Смарт Энджинс) (2, 14)
ЭЛАР (Электронный архив, НПО Опыт) (3, 8)
Abbyy Россия (2, 7)
Directum (Директум) (3, 6)
Другие (16, 19)
Smart Engines (Смарт Энджинс) (3, 11)
ЭЛАР (Электронный архив, НПО Опыт) (3, 10)
Beorg (Биорг) (1, 8)
Directum (Директум) (3, 4)
Digital Design (Диджитал Дизайн) (3, 2)
Другие (10, 11)
Smart Engines (Смарт Энджинс) (2, 22)
ЭЛАР (Электронный архив, НПО Опыт) (4, 13)
Синтеллект (Syntellect) (2, 5)
Digital Design (Диджитал Дизайн) (2, 4)
Beorg (Биорг) (1, 4)
Другие (8, 10)
Smart Engines (Смарт Энджинс) (3, 16)
ЭЛАР (Электронный архив, НПО Опыт) (4, 9)
Digital Design (Диджитал Дизайн) (2, 2)
Beorg (Биорг) (1, 2)
Content AI (Контент ИИ) (1, 2)
Другие (5, 5)
Распределение систем по количеству проектов, не включая партнерские решения
ЭЛАР ПланСкан - 151
Synerdocs - 130
Smart ID Engine (ранее Smart IDReader) - 113
ABBYY FlexiCapture - 90
Е1 Евфрат - 87
Другие 777
Syntellect Tessa Мобильное согласование - 30
Syntellect Tessa Графический визуализатор процессов - 28
Smart ID Engine (ранее Smart IDReader) - 12
ABBYY FlexiCapture - 6
ЭЛАР ПланСкан - 6
Другие 28
Smart ID Engine (ранее Smart IDReader) - 10
ЭЛАР ПланСкан - 9
Beorg Smart Vision - 8
Directum Jazz - 2
EasyData: EasySeparate - 2
Другие 16