По «Твиттеру» можно отслеживать, что в данный момент делает конкретная группа людей — что происходит в городе, стране, районе… Разумеется, такая информация не может не интересовать учёных, занимающихся статистикой. С помощью этих данных можно предугадать реакцию общественности на выход фильма, музыкального альбома или события. Увы, в таких исследованиях всегда есть проблема: проанализировать то, что пишут все пользователи, просто невозможно. Впрочем, как оказалось, не обязательно отслеживать активность абсолютно всех.
Мануэль Гарсия-Херранс из Автономного университета Мадрида в Испании и его коллеги выяснили, что для мониторинга настроений достаточно использовать группу «сенсоров» — активных пользователей, которые с наибольшей вероятностью быстрее воспринимают или распространяют ту или иную идею.
Для проверки этой идеи они выбрали две разных группы пользователей «Твиттера» и стали следить, в какой момент обе группы начинают использовать новые хэш-тэги относительно каких-либо тем.
Тут надо сделать отступление и сказать, каким образом группы выбирали. Первая, контрольная, была сформирована из обычных пользователей, выбранных случайным образом. После этого они отобрали по одному из фолловеров каждого пользователя и сформировали из них группу «сенсоров».
Можно представить себе, что группы были примерно одинаковыми, но это не так. Фолловеры с большей долей вероятности являлись высокоактивными пользователями, которые также следят за незнакомыми им людьми. Учёные объясняют это так: «У ваших друзей чаще всего больше друзей, чем у вас».
Чтобы проверить свою гипотезу о «сенсорах», исследователи собрали данные об этих пользователях начиная с 2009 года. Была проанализирована информация о 40 миллионах пользователей, которые в сумме сгенерировали 1,5 миллиарда запросов на добавление других пользователей в друзья. Они сделали около миллиарда твитов, среди которых 67 миллионов содержали хэш-тэги.
Именно то, насколько быстро та или иная группа начинала пользоваться свежими хэш-тэгами, интересовало учёных. В среднем контрольная группа отставала на 7 дней.
О чём это говорит? О многом. С помощью выделения группы «сенсоров» можно с высокой степенью вероятности предсказывать политическую обстановку в стране, результаты выборов, а также отслеживать эпидемии. Твиттерные «сенсоры» позволяют узнать исход практически любого крупного события.