Распознавание музыки — приятная игрушка, которой с удовольствием пользуются меломаны со всего мира. Подобный сервис предоставляет несколько известных компаний, и некоторые извлекают из этой бесплатной услуги большую выгоду — огромное количество данных о предпочтениях людей по всему свету. Основными игроками в данной сфере являются Shazam, SoundHound и musiXmatch. Но у Shazam конкурентное преимущество: на основе своей неуклонно растущей базы данных компания предсказывает, что стане популярным в будущем году. Хотя порой в эти списки попадают певцы, которые вовсе не успели заявить о себе всему миру.
С помощью приложения от Shazam можно загрузить часть песни — она может быть фрагментом теле- или радиопередачи, быть записанной на мобильный телефон прямо на улице — и узнать её название. Достаточно 5–15 секунд записи, чтобы определить исполнителя песни, её название, альбом и даже получить ссылки на YouTube или iTunes. Ежедневно пользователи идентифицируют при помощи Shazam около 15 миллионов композиций, а в базе хранится более 5 миллиардов пользовательских тегов. Эти данные и использует компания, чтобы предсказать артистов, которые станут популярными в будущем году. Shazam делает это довольно успешно: прогнозы относительно коллективных музыкальных предпочтений этого и предыдущего года действительно сбывались.
В основе такого прогноза, что не удивительно, лежит анализ данных. Само собой, подобно другим сервисам, Shazam собирает отзывы пользователей о тех или иных треках. Но этим дело не ограничивается. Вместо того чтобы полагаться на положительную или отрицательную оценку потребителя, Shazam комбинирует отзывы с поведением тех пользователей, которые ищут музыку с помощью сервиса. Одна из статей дохода компании — возможность слушателя перейти на iTunes или Amazon, чтобы купить найденную песню. Таким образом, цель компании — не помочь аудитории найти музыку, а помочь музыке найти аудиторию. Но это ещё и ценная информация о музыкальных предпочтениях слушателя: готовность заплатить из собственного кармана — ещё один плюсик к популярности исполнителя.
Как Shazam ищет песню? Говоря простым языком, приложение прослушивает композицию, разлагая её на частоты и амплитуды, вычленяет «интересные» моменты, характеризующие трек, и генерирует уникальную «цифровую подпись».
Затем этот снимок отправляется на сервер и сопоставляется с огромной базой данных. Само собой, хранить миллионы песен «целиком», да ещё и вести поиск по ним — задача на данном технологическом этапе нереальная. Поэтому в базе Shazam также сохранены только картины интенсивных звуков и их частот. Типичная спектрограмма проиллюстрирована на рисунке; горизонтальная ось обозначает время звучания, а вертикальная — его частоту. Интенсивность цвета каждой из точек кодирует амплитуду звука: чем темнее точка, тем громче звук. Поиск по опорным точкам даёт возможность правильно обработать даже записи, на которые накладывается интершум. Кстати, мало кто знает, что на радио порой звучат песни со слегка изменённой длительностью: диджеи вынуждены слегка замедлять или ускорять воспроизведение, чтобы уложиться в заданный интервал. Поэтому вычислить песню, записанную на радио, обычным сравнением довольно проблематично. Но поиск по спектрограммам Shazam решает и эту задачу.
Очень важен в работе Shazam и тот факт, что компания собирает географические метки своей аудитории. Следовательно, можно заранее определить, что будет популярно в данной конкретной области. Третьи лица, которым компания передаёт свою информацию, могут доработать свои предложения с учётом реальной картины, которая куда точнее любых опросов. Рекламодатели, музыкальные промоутеры и СМИ могут использовать данных Shazam, чтобы оценивать успехи своих кампаний и мероприятий.
Shazam использует различные облачные сервисы, дабы обеспечить необходимую масштабируемость, а также интеграцию своих офисов, разбросанных по всему свету. Используются Rackspace и Amazon, а также ряд других облачных провайдеров. Чтобы обеспечить анализ данных в реальном времени, планируется использовать платформу Hadoop, поскольку нарастающий темп роста требует мощных решений. Стоит отметить, что создатели и руководители компании связывают бурное развитие компании именно с активным использованием опенсорсных решений.
Итак, вместо бесплодного умствования журналистов и музыкальных критиков музыкальные тенденции будут предсказываться математическими алгоритмами и «большими данными». Например, результатами активности 400 миллионов меломанов. Самые смелые эксперты уже пророчат в этой связи смерть музыкальной журналистики. Впрочем, вряд ли мнение масс действительно будет столь же ценным и непререкаемым, сколь мнения профессиональных экспертов. Но вот любителям лёгких прогнозов, вероятно, придётся потесниться…