В одном из крупнейших медицинских комплексов Америки — центре Горы Синай (Нью-Йорк) — в дополнение к имеющемуся суперкомпьютеру стоимостью три миллиона долларов устанавливают новый кластер. Его архитектуру разрабатывали при участии Джеффа Хаммербакера, в прошлом приложившего руку к созданию рекламной системы Facebook, а затем основавшего компанию Cloudera. Он предложил использовать для сокращения расходов на здравоохранение те же подходы к обработке больших массивов данных, которые успешно применяет Facebook при анализе пользовательских профилей для подбора персонализированной рекламы.
США ежегодно тратят на здравоохранение более трёх триллионов долларов. Комплекс Горы Синай вместе с аффилированной медицинской школой ежегодно госпитализирует около полумиллиона человек. Число медицинских записей в электронной картотеке превысило 120 миллионов. Недавно к ним добавилась база данных биобанка, насчитывающая 26 735 образцов ДНК. Обработка возрастающего количества разнородных данных — один из ярких примеров современных проблем ИТ-инфраструктуры и одна из типичных задач в области Big Data.
Суперкомпьютер в Медицинском центре Горы Синай (фото: Patricia Kovatch).Ранее оперативно учесть сотни показателей работы медицинских учреждений было технически невозможно, поэтому на банковский счёт госпиталей поступали средства, пропорциональные общему числу койко-дней и количеству выполненных манипуляций. Из-за этого сформировалась порочная система, в которой выгодно было проводить избыточную диагностику, назначать лишние консультации и затягивать лечение.
Текущая реформа здравоохранения США использует возможности более тонкой работы с данными. Её авторы придерживаются концепции «подотчётной помощи», в рамках которой будет оцениваться прежде всего эффективность проведённого лечения. Таким образом, благодаря технологиям «больших данных» платить будут не столько за процесс лечения, сколько за способность быстро излечивать и поддерживать здоровье пациентов.
Гора Синай — обсуждение роли Big Data в реформе здравоохранения (фото: mountsinai.org).Один из привлечённых экспертов — сотрудник института геномики и биолог компании Pacific Biosciences Эрик Шадт (Eric Schadt) так прокомментировал ситуацию изданию MIT Technology Review:
Это чудовищно огромная ставка на обработку больших объёмов данных. Новые экономические стимулы объясняют, почему госпитали вдруг стали испытывать такую высокую потребность в специалистах по вопросам Big Data. Только из нашего института в прошлом году было нанято сто пятьдесят человек.
Другим важным направлением стало прогнозирование расходов. Оно базируется на многофакторном анализе таких статистических данных, как число повторных обращений, процент жалоб на конкретных врачей и подразделения, распространённость различных патологий, количество пациентов с хроническими заболеваниями, а также на эпидемиологических показателях. Все эти данные будут обрабатываться на новом кластере в свободно распространяемой системе распределённых вычислений Hadoop.