Проблема обработки растущего объёма данных затрагивает всё больше отраслей. По оценке аналитиков канадского банка CIBS, количество ежедневно генерируемого в мире объёма информации возрастёт в 50 раз на протяжении следующих десяти лет. Схожую оценку даёт агентство IDC, занимающееся исследованиями рынка. Их специалисты прогнозируют рост объёмов данных в 44 раза к 2020 году. Наибольший вклад в процесс увеличения объёма данных вносят стремительно развивающиеся рынки мобильных устройств и связи.
В недавнем отчёте BI Intelligence была оценена роль взаимовлияния мобильных устройств и проблем обработки больших объёмов данных. Полный текст исследования доступен по этой ссылке. Здесь же ограничимся краткими выводами.
Прогноз изменения количества данных, загружаемых с помощью различных устройств. Синяя область соответствует смартфонам, оранжевая — планшетам, а красная — ноутбукам (изображение: businessinsider.com).Пять лет назад появление iPhone и смартфонов с ОС Android привели к резкому увеличению трафика в беспроводных сетях. Тем временем стандарт Wi-Fi становился всё более популярным, а операторы сотовой связи впервые стали предлагать безлимитные тарифы на мобильный интернет.
Сегодня каждый смартфон оснащён парой камер, поддерживает интеграцию с социальными сетями и облачными хранилищами данных. Все они выполняют синхронизацию, периодически проверяют почту и выполняют фоновые обновления. Даже когда люди не пользуются смартфонами, их устройства продолжает создавать нагрузку на глобальную ИТ-инфраструктуру.
В англоязычной литературе термин «большие данные» определяют через соответствие трём V: volume, variety и velocity. На русский язык эти составляющие можно перевести как «объём», «разнообразие» и «скорость». Вице-президент компании Skyhook считает, что пора добавить четвёртый компонент — значимость (value): «Можно эффективно собирать и хранить любые данные. Однако смысл в этом появится лишь после того, как их проанализируют и сделают значимыми для кого-то».
Обработка накопленных массивов разнородных данных от мобильных устройств должна быть направлена на персонализацию не только рекламы, но и всех услуг, предоставляемых оператором. Их также целесообразно использовать для оптимального распределения нагрузки и составления прогнозов развития сетей связи. Иначе возникнет типичная ситуация, когда оператор пытается обслужить большее число абонентов, чем способен физически на данный момент.