2021/08/26 15:25:45

Data Fabric (ткань данных)

.

Понятие Data Fabric и основные элементы этой концепции

Введение в понятие Data Fabric для TAdviser подготовила Светлана Вронская, автор телеграм-канала Analytics Now.

Data Fabric, которую почему-то часто неправильно переводят как «фабрику данных», никакого отношения к заводу не имеет. Data Fabric – это ткань данных, и представляет она собой цельную архитектуру управления информацией с полным и гибким доступом для работы с ней.

Это автономная экосистема, которая используется для максимально эффективного доступа к корпоративным данным. При помощи Data Fabric информацию легче искать, обрабатывать, структурировать и интегрировать с другими информационными системами.

Из чего же состоит Data Fabric? Во-первых, на каждом шаге обработки информации используется машинное обучение - от анализа получаемых данных до оптимизации алгоритмов их обработки. Кроме того, все потребители данных, все источники данных связаны сквозной интеграцией (в том числе с помощью баз и хранилищ данных и прочих Data Lake) через API. Вместо единого блока программного решения используется микро-сервисная архитектура. Основное предпочтение в ИТ-инфраструктуре отдается облачным решениям, информационные потоки оркестрируются, а качество информации повышается после унификации и виртуализации. Дополнительно, к данным легко получить доступ и обеспечивается безопасность этого доступа для каждой из групп пользователей.

Архитектура Data Fabric работает в концепции DataOps. Быстро организуется реагирование на любые изменения в данных, повышается уровень прогнозирования, оптимизируются процессы хранения, обработки и обслуживания ресурсов.TAdviser выпустил новую Карту «Цифровизация ритейла»: 280 разработчиков и поставщиков услуг 15.5 т

Отличительная характеристика Data Fabric – это активное применение технологий Больших данных и искусственного интеллекта, в частности, машинного обучения для построения и оптимизации алгоритмов управления и практического использования данных. Кроме того, концепция Data Fabric дополнена семантическими графами, которые позволяют определять, стандартизировать и согласовывать значение всех входящих данных в бизнес-терминах, понятных для конечных пользователей.

Говоря просто, ткань данных – это система на уровне всей вашей организации, где всё подчиненно данным и выводам на их основе.