Путешествия и большие объёмы информации — вещи, связанные совершенно естественным образом. Даже если речь идёт о поездке в один город, ориентироваться в авиакомпаниях, рейсах, отелях, ресторанах и достопримечательностях — тяжёлая работа. Что уж говорить о поездке по нескольким странам. С точки зрения обслуживающих компаний изучение привычек клиентов при помощи анализа данных — тоже чрезвычайно полезная и выгодная вещь. Иногда в улучшении нуждаются какие-то мелочи, но какие именно? Разобраться в этом бывает непросто.
По заказу компании Amadeus, специализирующейся на бронировании билетов и гостиниц, профессор Томас Дейвенпорт составил доклад, в котором рассмотрел разные случаи использования технологий «больших данных» в туриндустрии и попытался предсказать, какие новые применения окажутся востребованными.
На протяжении многих лет у компаний, предоставляющих услуги путешественникам, был доступ к самым разнообразным источникам информации. Брони билетов и номеров, аренда транспорта и многое другое оставляет «след», из которого при желании можно многое узнать о маршрутах, привычках и предпочтениях. Сотни терабайт или даже петабайты информации до сих пор хранились неструктурированными и непроанализированными. Предстоит большая работа!
Ряд связанных с туризмом компаний — как начинающих, так и более чем солидных — уже получает выгоду от использования «больших данных». Дейвенпорт провёл исследование более двадцати подобных случаев и представил в докладе истории успеха.
Сервис Kayak, позволяющий искать билеты на самолёт и бронировать гостиничные номера, обрабатывает более миллиарда поисковых запросов ежегодно, что дает массу данных для последующего анализа. Когда пользователь что-то ищет при помощи Kayak, за сортировку результатов отвечают хитрые алгоритмы. Это не столь очевидно, когда речь идёт о поиске авиабилетов (их достаточно отсортировать по цене), а вот в случае с гостиницами важно учитывать более продвинутые критерии: удаленность от заданной клиентом точки, предоставляемые услуги и развлечения, а также соотношение цены и качества в сравнении с другими вариантами.
Ещё Kayak использует аналитические модели для того, чтобы обеспечивать соответствие между ценами, которые отображаются на её сайте и на сайтах авиакомпаний. Сбои при синхронизации между источниками данных нередки, и предиктивный алгоритм помогает не допускать ошибок. Не так давно в Kayak представили новую систему прогнозирования стоимости авиабилетов, предсказывающую, упадёт или вырастет цена на определённый рейс за ближайшую неделю.
Kayak работает на кластере Hadoop, с переходом на который временные затраты на вычисления удалось свести к нескольким минутам. Используются также скриптовые языки, популярные у специалистов по «большим данным», и набор статистических утилит с открытыми исходными кодами.
Конкурирующий сервис Hipmunk тоже вовсю использует «большие данные». В этой компании разработали клиентскую систему, которая на основе фирменных алгоритмов позволяет ранжировать авиарейсы и гостиницы по разнообразным критериям. К примеру, для оценки авиакомпаний существует показатель под названием «мучительность», который рассчитывается с учетом продолжительности перелета и количества пересадок. Для оценки гостиниц Hipmunk создала алгоритм для расчета «индекса восторга» — с учётом цены за номер, предоставляемых услуг и оценок клиентов. Возможности сравнения по критериям выделяют Hipmunk на фоне многих других сайтов для путешественников.
Для внутреннего пользования Hipmunk также применяет «большие данные» — в первую очередь для того, чтобы проанализировать поведение посетителей на своем сайте. Записываются каждый клик и вся последовательность страниц, на которые переходил пользователь. По результатам А/Б-тестирования принимаются решения о том, как доработать интерфейс.
Традиционные бизнесы тоже не чужды анализу данных, причём некоторые практикуют это ещё с «доисторических» времён. Сетевой отель «Мариотт» одним из первых принял на вооружение анализ данных для управления потоками прибыли, и эта практика применяется уже около двадцати пяти лет. Гостиницы таким образом определяют оптимальную цену за номер и получают больше денег в том случае, когда удаётся дать такой прогноз, при котором все номера будут распроданы. Предиктивные алгоритмы помогают решить даже такие вопросы, как выбор объектов для ремонта: исследования показывают, что небольшие улучшения окупаются лучше всех.
Анализ данных помогает и авиакомпаниям — например, British Airways. «Они собирают и обобщают всю информацию о пассажирах, хотя эти данные всегда были распределены очень разрозненно», — пишет Дейвенпорт. К той же базе данных имеют доступ и сотрудники British Airways, которые непосредственно работают с пассажирами. Экипажи вооружены планшетами и могут в любой момент узнать или обновить информацию о пассажире.
Многие авиакомпании продвигают управление доходами на новый уровень, подсчитывая, к примеру, издержки на группу пассажиров, пропустивших пересадку из-за задержки рейса, чтобы определить, будет ли выгоднее отложить стыковочный рейс или зарезервировать им места на следующем вылете.
По мнению Дейвенпорта, исследование больших и сложных наборов данных в ближайшее время сможет буквально преобразить индустрию путешествий. То, что раньше вызывало сложности, будет даваться путешественникам без всяких усилий.