Когда апологеты «больших данных» рассуждают об информационном взрыве, в пример обычно приводят эксабайты информации, накопленной в интернете. Это не совсем верно. Топливом для взрыва будут не только и не столько посты в социальных сетях и статистика посещений, перерабатываемая рекламными сетями.
Следующие эксабайты будут генерировать уже не люди, а машины. Бесчисленные датчики, встроенные в промышленное оборудование, транспорт, бытовую технику и мобильные устройства, справятся с этой задачей куда быстрее, чем пользователи соцсетей.
Согласно прогнозу аналитической компании Analysys Mason, к 2021 году около 2,1 миллиардов подключений к интернету будут инициировать не люди, а устройства, собирающие информацию при помощи встроенных датчиков. Для сравнения: в 2011 году количество таких соединений не превышало 100 миллионов.
Нужно понимать, что эти 2,1 миллиарда — скорее всего, лишь верхушка айсберга. Значительная доля создаваемого ими трафика будет изолирована в сетях компаний. По оценке Oracle, общее количество «умных машин» к 2020 году достигнет 50 миллиардов. Их будет во много раз больше, чем жителей на Земле, включая младенцев и аборигенов в джунглях Амазонки.
Совокупность машин, следящих за реальным миром при помощи датчиков, часто обозначают выражением «интернет вещей». Специалисты используют сухой термин «межмашинное взаимодействие», или M2M. В отличие от гипотетического «интернета вещей», межмашинное взаимодействие — это не будущее, а реальность.
Приёмники GPS, постоянно передающие координаты грузового автомобиля, такси или автобуса диспетчеру, давно перестали считаться экзотикой. На производстве датчики распространились одновременно со станками с числовым программным управлением. И то и другое — это примеры межмашинного взаимодействия.
До недавних пор данные, собранные таким образом, редко подвергались анализу. Не потому, что не было желания: скорее отсутствовали технические возможности. Теперь они есть, и ситуация быстро меняется.
За следующие пять лет рынок аналитических средств, предназначенных для работы с технологиями межмашинного взаимодействия, вырастет в семь с половиной раз и достигнет объёма, равного $14,3 млрд. Такую оценку даёт фирма ABI Research в исследовании, опубликованном около месяца назад.
«Физические объекты, которые в прошлом были совершенно “непрозрачными”, станут частью вселенной цифровых данных», — говорит ведущий аналитик ABI Research Аапо Марконен. Это значит, что их можно будет изучать, оценивать и оптимизировать с помощью тех же методов, которые сейчас успешно применяют для автоматического выявления мошеннических транзакций, предсказания спроса или улучшения показателей сайтов.
Излюбленный пример специалистов по «большим данным» — это, как ни странно, авиалайнеры. Буквально каждая деталь современного самолёта содержит датчики — начиная с закрылков и заканчивая двигателями. За полчаса набегает около 10 терабайтов телеметрии только с одного двигателя, а их обычно не меньше двух.
Если анализ этих данных позволит сжигать меньше топлива, выгода будет огромной. По оценкам аналитиков, сокращение расхода топлива гражданскими самолётами США всего лишь на один процент за пятнадцать лет выльется в экономию примерно $30 млрд.
Дело, впрочем, не только в экономии. При компьютерном анализе нередко отыскиваются детали, которые невозможно различить невооружённым взглядом. Алгоритмы машинного обучения при достаточном объёме доступных данных начинают отличать особенности нормальной работы техники и немедленно выделяют в них аномалии, которые могут сигнализировать о дефектах и неисправностях, — и делать это задолго до того, как их обнаружат (или, того хуже, НЕ обнаружат) традиционными методами.
Именно с этой целью крупнейшая американская железнодорожная компания Union Pacific Railroad оснастила датчиками каждый вагон, стрелки и даже сами пути. Телеметрическую информацию собирают термометры, акустические и визуальные датчики, установленные под вагонами, а также в тормозах, подшипниках и электромоторах. Перемалывающая её система предиктивной аналитики замечает назревающие проблемы за несколько суток до того, как они превратятся в полноценные неисправности.
То же самое начинают делать на заводах. Иногда смысл измерений понятен и логичен: например, если подшипник в конвейере нагрелся больше обычного или датчики зафиксировали вибрацию, не вписывающуюся в норму, нетрудно догадаться, что происходит что-то не то. Однако анализ данных может выявить и менее очевидные закономерности, связывающие неисправности с определёнными показаниями датчиков, которые с точки зрения человека вовсе не кажутся подозрительными.
В статье о том, как анализ данных изменяет города, упоминались датчики, которые следят за состоянием водопроводных труб, — ещё одно приложение той же идеи. Это, впрочем, лишь начало. Что будет дальше, наглядно демонстрирует новая разработка производителя осветительного оборудования Sensity Systems. В конце октября компания представила «умные» фонарные столбы со встроенными датчиками влажности, освещённости, радиации, качества воздуха, ветра, температуры, сейсмической активности, а также микрофонами и камерами.
В Sensity Systems видят массу потенциальных применений для такого необычного устройства. Например, «умные» фонари могут мгновенно докладывать в правоохранительные органы о шуме, напоминающем звук выстрелов. Сопоставление информации, поступающей с разных столбов, позволит аппроксимировать координаты источника звука, а камеры — проверить, что там произошло.
Другая интересная возможность — оповещение об аномальных скоплениях людей. Их можно замечать по изменению количества смартфонов в зоне действия Wi-Fi-фонаря. Наконец, это фактически небывало плотная сеть метеостанций. Настолько подробная климатическая информация без особого труда найдёт не только потребителей, но и покупателей.
Более «домашние» приложения M2M-технологий ещё несколько лет назад оценили покупатели самообучающихся термостатов Nest — нового детища создателя плеера iPod Тони Фэделла. Эти устройства мониторят всё, что происходит в доме, при помощи датчиков температуры и движения, размещённых в разных комнатах, и сверяют их показания с прогнозом погоды, загруженным из интернета, и журналом изменения настроек.
Постепенно они обучаются понимать, когда и что нужно делать, не дожидаясь подсказок от своих пользователей. Например, термостат сам снижает энергопотребление, когда в доме никого не остаётся, но автоматически включается перед тем, когда, по его расчётам, вернутся хозяева, чтобы заранее довести температуру до уровня, который они обычно предпочитают в это время.
То, что устройства становятся «умными», радует далеко не всех. Термостат, который изучает привычки своих пользователей, — это удобно, но в то же время немного пугает. Не слишком ли много он знает? Подобные опасения считаются одним из важных факторов, сдерживающих рост популярности «интернета вещей».
В 2010 году назад немецкая корпорация Siemens призвала к государственному регулированию использования данных, собранных при помощи датчиков. «Мы обладаем технологией, которая позволяет записывать энергопотребление дома каждую минуту, секунду или микросекунду более или менее в реальном времени, — говорил тогда представитель Siemens Energy Мартин Поллок. — На основании этого мы можем определить, сколько в доме человек, чем они заняты, в какой части строения находятся, есть ли у них собака, узнать время, когда они просыпаются и когда принимают душ: это огромное количество информации, которая считается частной». В Siemens надеялись, что государственные гарантии секретности помогут успокоить потенциальных клиентов.
Пока гарантий нет, успех подобных технологий целиком зависит от баланса между выгодой и риском, который видят потребители. Судя по тому, как развиваются события, выгода перевешивает.