Специалисты «Сеченовского университета» создали облачную платформу медицинских данных для изучения с помощью ИИ новых методик лечения
Заказчики: Первый московский государственный медицинский университет имени И. М. Сеченова (Первый МГМУ) Москва; Фармацевтика, медицина, здравоохранение Подрядчики: Beltel Datanomics Продукт: Yandex Cloud Услуги виртуальной вычислительной инфраструктурыДата проекта: 2023/07 — 2023/12
|
Технология: IaaS - Инфраструктура как услуга
|
2023: Создание облачной платформы медицинских данных
Специалисты Сеченовского Университета, Yandex Cloud и Beltel Datanomics завершили создание платформы медицинских данных. На платформу загружены 18 млн медицинских документов. Решение поможет исследователям, врачам, студентам и аспирантам Сеченовского Университета Минздрава РФ проводить научные исследования, оценивать эффективность методов лечения на разных группах пациентов, а IT-командам – создавать сервисы искусственного интеллекта в области здравоохранения. Более 1000 специалистов смогут быстро собирать наборы "живых" клинических данных с возможностью фильтрации по 150 параметрам: полу, возрасту, симптомам пациентов и другим характеристикам. Об этом 19 декабря 2023 года сообщили представители Yandex Cloud.
По информации компании, платформа представляет собой веб-интерфейс с поисковыми ячейками, в котором можно искать документы и наборы данных по ключевым словам, а также применять различные фильтры. К примеру, можно найти все зафиксированные случаи сахарного диабета у людей в возрасте от 20 до 50 лет, собрать примеры пациентов с повышенным креатинином в заданном диапазоне значений, сделать выгрузку всех известных орфанных заболеваний, и многое другое. Система автоматически отбирает релевантные документы со ссылками на рентгеновские снимки, результаты лабораторных анализов, КТ, МРТ и других исследований. Данные можно сохранить, выгрузить в табличном виде и использовать для разработки ИИ.
В 2024 году доступ к платформе получат более 1000 специалистов – сотрудников университета. В планах организации – постепенно подключать новые источники данных, настроить визуализацию данных с помощью технологии DataLens и добавить возможность работать с запросами на естественном языке, используя генеративную нейросеть YandexGPT.
Благодаря данной платформе мы сможем на несколько порядков быстрее собирать данные для научной деятельности, образовательной работы, написания статей. То, на что раньше уходили месяцы кропотливой работы в архивах, теперь можно сделать меньше, чем за минуту, если задать правильные параметры поиска. Мы рассчитываем, что в будущем другие медицинские организации смогут подключаться к платформе, чтобы обмениваться данными и делать научные открытия. Мы также готовы делиться датасетами с научным сообществом и разработчиками сервисов искусственного интеллекта, в том числе на коммерческой основе. комментирует Константин Бражников, заместитель директора департамента развития клинических и образовательных проектов Первого МГМУ им. И.М. Сеченова Минздрава РФ |
Это мультиформатная платформа, с возможностью искать в едином окне тексты медицинских заключений, результаты КТ, МРТ, рентгеновские снимки, результаты лабораторных анализов и многие другие данные, необходимые для работы медицинских специалистов. Обработаны более 18 миллионов медицинских документов. Это большие объемы данных, которые упорядочили и привели в единый формат, чтобы обеспечить возможность полнотекстового поиска. Ещё одной задачей было организовать постоянное обновление данных, в чем, конечно, помогла облачная архитектура решения. поведала Анна Лемякина, директор по национальным стратегическим проектам Yandex Cloud |
С самого начала мы увидели вовлеченность команды Сеченовского университета, ощутили востребованность и потенциальную полезность аналитической платформы для медицинского учреждения. Безусловно, это помогло выполнить проект в достаточно сжатые сроки – девять этапов, начиная с разработки макета веб-портала до запуска платформы, были реализованы фактически за семь месяцев. В команду с нашей стороны вошли все необходимые специалисты – бэкенд и фронтенд разработчики, дата инженеры, облачные архитекторы, дизайнер и технический писатель, но также помогло наличие сетевой и ИБ-экспертизы у системного интегратора «Белтел», частью которого является подразделение Beltel Datanomics. Мы также благодарны компании «Первый Бит» за помощь в проектировании системы выгрузки первичных данных из МИС 1С. рассказала Анна Племяшова, директор Beltel Datanomics |
Решение разработала и внедрила компания Beltel Datanomics, эксперт в области аналитики Big Data и искусственного интеллекта. Платформа университета использует более 10 сервисов Yandex Cloud: виртуальные машины развернуты с помощью Compute Cloud. На декабрь 2023 года данных не так много, хранилище данных построено на управляемом сервисе Managed PostgreSQL, по мере роста нагрузки возможна миграция на Managed Service for Greenplum. Система поиска использует технологию Managed OpenSearch. Важным условием было сохранение "сырых" данных в неизмененном виде, чтобы в последующем можно было повторно их обработать, поэтому первичные данные и логи поступают в объектное хранилище S3 Object Storage. Система защиты информации выстроена в соответствии с политикой информационной безопасности университета.