Геопространственные данные (ГД) — это информация, так или иначе привязанная к конкретному местоположению объектов. Обычно подобные сведения хранятся в виде географических координат и топологий. Число таких данных растёт ошеломляющими темпами, так как они преимущественно создаются не людьми, а широким спектром устройств. Их генерируют смартфоны, планшеты, спутники, цифровые камеры, а также радары, сенсорные сети и различные виды транспорта. По мере того как тенденции «интернета вещей» и промышленного интернета набирают рост, количество геопространственных данных будет расти еще интенсивнее, чем сейчас.
Такая информация используется в ГИС — географических информационных системах для ввода, хранения, поиска, анализа и вывода географически привязанных данных. Важнейшими элементами ГИС являются атрибуты то есть, дополнительная информация, связанная с ГД. Существует также понятие «слоёв данных» — сочетания атрибутов и координат. К примеру, в роли слоя может выступать карта, на которую нанесены объекты. Анализ геопространственных данных иначе называют пространственной аналитикой. Он используется для получения ответов на вопросы о реальном мире — например, о текущей ситуации в заданной точке, векторе изменений, связанных с различными факторами, с моделированием и прогнозами.
Что дает геопространственный анализ организациям? Например, благодаря ему можно визуализировать активность в социальных сетях во время глобальных событий — скажем, экологического кризиса. Сопоставление твитов, сообщений или блогерской активности с географическим местоположением может помочь спасателям. Очевидно, что просто мониторить подобные источники данных силами операторов нереально: во время любого масштабного происшествия число репостов, сообщений, да и просто ложных новостей зашкаливает. Поэтому для организации спасательных работ необходимы сложные аналитические инструменты — примерно те же, что используют маркетологи в попытках опустошить карманы клиентов. Кстати, помогает подобный анализ и в борьбе с мошенничеством: многие готовы воспользоваться случаем и сообщить, что находились в районе бедствия, тогда как это не соответствует реальности…
Другой пример. Телекомы могут пользоваться геопространственными данными для того, чтобы регулировать отток пользователей. Те же социальные сети дают сведения о том, что клиент переехал в другой район. В этом случае система ведёт наблюдения над доступностью услуг оператора в данной области и успевает предложить новый телефон или даже миниатюрную станцию сотовой связи до того, как рассерженный клиент решит сменить провайдера услуг. Немалую пользу из ГД извлекает энергетика. Выполняя пространственный анализ, компании рассчитывают, каким может быть пик энергопотребления, исходя из географического положения и оборудования того или иного района. А самая развитая область применения геопространственных данных — это, конечно, реклама и маркетинг. Возможность предложить потребителю некие услуги именно тогда, когда он оказывается в непосредственной близости от магазина, — лакомый кусок для маркетологов. Подобную рекламу активно используют уже многие торговые центры. Если, конечно, способны оплатить подобную экзотику: задача все-таки слишком ресурсоёмкая для обычного бутика. Поэтому переживать о том, что ваш смартфон будет трезвонить вам о каждом магазинчике в шаговой доступности, ещё рано.
Таким образом, спрос на обработку «больших геопространственных данных» довольно велик. Предложения услуг в этой области тоже не стоят на месте. Одним из наиболее интересных стартапов, занимающихся сегодня потоками ГД, явлеется SpaceCurve. В компании разработали кардинально новые способы параллельной обработки информации. Это даёт возможность индексировать сложные геопространственные полигоны в режиме реального времени, а также анализировать социальные и семантические графы на больших параллельных системах, что позволяет организациям принимать более обоснованные решения. Теоретически технологии SpaceCurve доступны любому, кто может собирать какие-либо данные о положении мобильных устройств: у клиентов есть возможность создавать свое ПО, интегрируя его с возможностями SpaceCurve.
Еще один стартап, Loqate, разработал программные продукты для парсинга, стандартизации, проверки и очистки адресных данных со всего света. Каждому адресу присваиваются свои значения широты и долготы, что делает возможным его дальнейшее использование в ГИС. Эта возможность предоставляется компанией с 2012 года как облачный сервис, и разработчики также могут интегрировать эти данные в собственные приложения.
Таким образом, аналитические инструменты, отчасти опирающиеся на статистические методы анализа данных ГИС — топологии местности и координат объектов — выросли в сложные алгоритмы, обеспечивающие целый спектр различных применений. На сегодня геоинформационные системы в связке с многочисленными данными от пользовательских устройств представляют собой мощный инструмент для маркетологов, бизнес-аналитиков, технологических компаний и многих других организаций.