Кто ещё несколько лет назад мог представить, что Twitter станет тем, чем он является сейчас? Сервис коротких сообщений длиной не более 140 знаков превратился в мощное средство, с помощью которого распространяется важная и срочная информация. Но именно из-за размеров сети поведение пользователей Twitter очень сложно анализировать (и тем более отделить зёрна от плевел — в конце-концов сообщений о том, что кто-то удачно сходил в туалет, тоже хватает). Плюс ко всему роботы не могут читать множество закрытых аккаунтов. Но учёные из компании Telefonica Research, похоже, нашли выход из сложившейся ситуации.
Виджай Эрамили и его коллеги разработали виртуальный Twitter, который повторяет все характеристики настоящего с той лишь разницей, что имитация работает без участия живых пользователей. Этот виртуальный мир получил название SONG (Social Network Write Generator). Его задача — составлять на основе большого массива данных прогнозы о том, как та или иная информация, «вброшенная» в соцсеть, отразится на поведении пользователей.
Модель была построена на основе кропотливого изучения данных, собранных в Twitter за период с 25 ноября по 4 декабря 2008 года. Эрамили и его коллеги получили социальный граф с 2 миллионами вершин и 38 миллионами дуг, в котором выявили закономерности. Такие, как, например, дневные колебания активности, распределение активности между пользователями и так далее. Затем они создали виртуальную сеть с виртуальными пользователями, которые действовали согласно полученной модели. И если верить исследователям, то получается, что виртуальный Twitter достаточно точно имитирует процессы, происходящие в настоящем.
Тем, кому всё это нужно, осталось ждать недолго — Эрамили обещает опубликовать код SONG в ближайшем будущем. Всяким маркетологам очень пригодится.