— Когда вы создавали компанию, подобные сервисы уже существовали на рынке. Сейчас их стало ещё больше. Как возникла сама идея?
— Идея давно витала в наших головах. Компания «Медиалогия» делала что-то похожее для больших корпораций. Они сами выполняли анализ новостей, чтобы чётко отвечать на очень точно поставленные бизнес-вопросы. Например, в каких регионах страны наш пиар плохо работает?
В какой-то момент мы начали делать в «Медиалогии» отдельный сервис для генеральных директоров, топ-менеджеров и руководителей государственных органов. У них есть буквально пять минут в день на новости, которые им обычно готовит в виде сводки пресс-секретарь. Мы искали, как использовать эти пять минут с максимальной эффективностью. Какой-то вариант инфопанели, на которую можно смотреть раз в день и не пропускать ничего важного. Ни опасностей для бизнеса, ни возможностей.
Мы начали заниматься этим направлением и вскоре увидели, что это довольно интересная ниша. В ней очень высокая потребность, а конкурентных решений практически нет.
— На первом этапе была ручная настройка?
— Да, только в начале. Мы настраиваем разработанные в «Медиалогии» инструменты для конкретного человека. Сидим вместе с ним и с его помощниками, определяем важнейшие вопросы. Затем обработка ежедневного потока новостей уже происходит автоматически. Никто уже не сидит каждый день и не делает это для него вручную.
— Можете пояснить на примере?
— Допустим, есть некий CEO крупной транспортной компании. Ему нужно оперативно узнавать о задержках. Самолёт вовремя не вылетел, поезд не ушёл и т. п. Пока эта информация доходит до него по обычной внутрикорпоративной цепочке, она устаревает на несколько часов, а иногда — даже дней. В результате он узнаёт о большой проблеме слишком поздно. Если бы он был в курсе сразу, то мог бы гораздо проще решить её и предотвратить появление других.
Потому мы решаем такие задачи при помощи анализа медиаданных. Когда случается какая-то неприятность, руководителю приходит уведомление — например, в виде push-сообщения на телефон.
Это очень интересный процесс. Мы как будто пытаемся проникнуть в голову человека. Руководители, как правило, очень неординарные личности. Когда пытаешься понять, что именно ему нужно, то приходит осознание того, как именно люди потребляют информацию.
В какой-то момент нам захотелось иметь такую же штуку для себя. Ориентированную не на крупных бизнесменов, а на обычных людей. Таким образом и появилась News360.
— Как видится вам будущее этого рынка и какие векторы развития можно в нём выделить?
— Мне кажется, сейчас на этом рынке происходит слияние нескольких потоков. Ещё лет пять назад мы не могли бы этого делать. С одной стороны, наблюдается экспоненциальное увеличение накопленных данных о каждом человеке в облачных сервисах.
Есть общедоступные для анализа вещи, вроде активности людей в соцсетях, но есть и закрытые хранилища данных. Например, история поиска в Google. Впрочем, даже того, что есть в открытом доступе, уже достаточно для хорошего анализа. Количество этой информации увеличивается очень быстро, а вместе с ним растёт и наша способность делать из неё корректные выводы.
С другой стороны, устройства, с которыми люди взаимодействуют ежедневно, становятся более личными. Ещё недавно компания Google проводила исследование, в котором пыталась ответить на вопрос, насколько персональными считают люди свои мобильные гаджеты и компьютерную технику. Тогда оказалось, что большинство людей не считают компьютер чем-то личным: для них важны сервисы, которыми они пользуются, но не само устройство. А телефон — это как раз что-то очень «своё».
Смартфоны сейчас обрастают способностью собирать данные — сенсорами и предиктивными сервисами, которые пытаются понять, что человеку сейчас нужно. Виден уже следующий шаг к более интегрированным устройствам — очкам, часам и даже имплантатам. Такие системы уже не фантастика. Они будут «знать», с кем именно работают, подстраиваться под него и помогать в принятии решений.
— Какие-то другие сервисы будут привязаны к нему?
— Мы пытаемся быть на стыке этих вещей. Сервисом, персонализирующим даже не новостные, а информационные потребности людей.
К примеру, если я ищу билеты на самолёт, то такая система должна учитывать все известные факты: каким классом я обычно летаю, из какого аэропорта, где люблю сидеть в салоне… При команде проложить маршрут поездки она должна «понимать», хочу ли я проехать по живописным районам или мне просто надо добраться как можно быстрее. В какой-то момент система научится довольно точно предсказывать потребности, и мне вообще не надо будет ничего уточнять.
— Новостной сервис использует географическую привязку, но нужно ли это?
— Нужно, если с этим связаны паттерны активности. Например, человек был в командировке и прилетел из Нью-Йорка в Сан-Франциско на конференцию. Если раньше он читал местные новости Нью-Йорка, то автоподстройка новостей позволит ему быстрее сориентироваться и не даст пропустить важные события, связанные с этой конференцией в другом городе.
— По каким критериям отбираются новости?
— Одна и та же новость может попасть или нет в подборку в зависимости от целого ряда причин. Человек может интересоваться разными вещами днём и вечером, дома и на работе. Это всё эвристическая оценка информационных потребностей. Например, известно, что многие люди хотят вечером получать лексически более лёгкие тексты. Они уже устали за день от чтения сложных материалов.
— Как вы формулируете у себя эти параметры попадания контента к человеку?
— Многое оценивается экспериментальным путём. Сначала выясняем, насколько люди задерживаются на странице с новостью и как быстро её прокручивают. Правда, здесь трудно использовать только критерии уделяемого времени. Для оповещения о некоторых событиях бывает достаточно увидеть заголовок и иллюстрацию, и это уже релевантная информация, даже если саму новость не читали. Поэтому мы пытаемся находить и какие-то другие позитивные критерии. Например, сколько людей отметили эту новость у себя и поделились ссылкой с другими. Часто нам прямо сообщают, что вот такие-то новости интересны и хочется видеть больше подобных — или наоборот, что эту тему больше никогда не надо показывать.
— Каков внутренний механизм сервиса в общих чертах?
— Есть подборка так называемых features: это компании, персоны, места, объекты и отдельные темы. Их около миллиона, и они используются для автоматического анализа текста.
Например, где-то в новостях впервые упоминается Google Glass. Система ещё не знакома с этим понятием, но уже может по контексту сделать вывод, что это новый продукт компании Google. Затем выполняется поиск по другим источникам. Так можно составить представление о типе устройства и его свойствах.
Если становится много публикаций про Bitcoin и Litecoin, то выделяется новая актуальная тема — криптовалюта. Кроме того, есть масса скрытых классификаторов. По ним можно определить, например, что текст имеет республиканский или демократический уклон.
Другое важное направление — построение и проверка гипотез. Например, мы предполагаем, что люди из сферы финансов часто играют в гольф. Начинаем показывать каждому из них лучшие новости о гольфе и оцениваем реакцию, подтверждая или опровергая свою гипотезу. Цель — постоянно улучшать знания о пользователе, находить новые интересы и паттерны его поведения.
Это примеры прямой логики или парадигмы Big Data? Последняя ищет неявные, парадоксальные на первый взгляд связи.
Гипотезы как появляются в результате работы технологий машинного обучения, так и создаются руками. При этом многие из них получаются гораздо менее явными, чем в примере с гольфом.
— Что вы думаете о Big Data в целом?
— Это сложный термин. Его все используют, но у всех он означает разные вещи. В классическом понимании Big Data — это любая задача, где размер данных превышает текущие возможность простого анализа, но сама парадигма для всех разная. Сейчас мы не оперируем такими объёмами информации, как Amazon или Google, но наши данные намного более рафинированы. Мы пытаемся постоянно фильтровать огромный поток исходных текстов новостей и сужать их до относительно компактного набора терминов, понятных для систем машинной логики.
Обычно под технологиями Big Data понимают процедуру получения сложные выводов по результатам анализа неструктурированных данных объёмом в петабайты. У нас другой путь. Мы стараемся учесть интересы людей в реальном времени. Каждый сервис самодостаточен и «знает» о человеке всё, что требуется ему для работы, поэтому он может быстро распределить входящий поток новостей по темам и делать персонализированную подборку.
— Что насчёт схемы монетизации? Мне кажется, ваш сервис может предложить гораздо более тонкую рекламную модель, чем поисковые системы.
— История запросов показывает потребности человека в настоящий момент или в недавнем прошлом. У Amazon хранится история покупок людей за многие годы. Это отличные данные для предсказания их потребностей в будущем, особенно возникающих с постоянной периодичностью. Когда есть такая же история просмотренного контента, её гораздо сложнее превратить в деньги. Либо нужно перевести её на другой сценарий (например, на ту же историю покупок), либо найти, как можно монетизировать сам акт чтения новостей.
— Какова ваша стратегия монетизации?
— Я думаю, здесь может работать более тонкая схема. Если человек когда-то искал пластиковые окна, то Google потом продолжает показывать объявления об их продаже, хотя окна бывают нужны примерно раз в двадцать лет. У вас можно получить более детальное представление о человеке, и реклама будет работать гораздо дольше.
Мы ищем новые форматы рекламы. В виде новостей, которые пишут не СМИ, а компании. Любая крупная фирма производит массу новостного контента, с которым потом очень неэффективно работает. Контент консьюмер-брендов по уровню очень похож на журналистский: них есть свои издания и свои блоги, в которых они пишут весьма интересные вещи. Это может быть тур по фабрике, история изобретения, рассказ о программах поддержки развивающихся стран. Так у бренда появляется возможность рассказать о новых продуктах, инициативах. Возникает хороший канал общения с потребителем.
— Расскажите о своей роли в этом процессе.
— Мы придумали для них способ эффективнее работать с контентом. Показывать его не широким массам, а именно тем, кто заинтересуется с высокой долей вероятности. Объёмы обычной дисплейной рекламы падают. На мобильных устройствах её эффективность практически нулевая. Сейчас гораздо эффективнее купить рекламу в Facebook или у нас, поскольку будет видно, кому именно она показывается и кого интересует.
Четыре месяца назад мы запустили новый продукт, который называем News360 Promoted Content. Работаем с Intel, SAP, Xerox, Coca-Cola и целым рядом других крупных компаний, производящих новостной контент. За счёт точного знания интересов наших пользователей мы даём им уровень вовлечения в контент в 5–10 раз более высокий, чем традиционная дисплейная реклама. При этом всегда очень аккуратно относимся к тому, чтобы пользователь точно знал, какие статьи он видит органически, а какие — за деньги.
Сейчас в США наблюдается бум развития такого формата рекламы. Он более эффективен, чем традиционная.
— Какие изменения отмечаются в результате смены парадигмы?
— Обычная реклама никуда не денется, но за персонализированной интернет-рекламой будущее. Такой вариант гораздо удобнее, поскольку он не меняет формат потребления контента для читателя. Человек продолжает смотреть Facebook, Twitter и News360, а параллельно ему показывается что-то рекламное, но действительно полезное. Так достигается гораздо больший процент возврата рекламных инвестиций.
— Рассматриваете ли вы конфликт между предоставлением создателям контента читательской аудитории и перераспределением рекламных бюджетов от них в свою пользу? Каковы стратегии взаимоотношений участников? Читателям ведь не обязательно переходить по ссылкам. Они могут получать контент непосредственно у вас.
— В этой системе три главных действующих лица: читатель, производитель контента и рекламодатель. Если убрать любого из них, система перестанет существовать. Поэтому мы на сто процентов заинтересованы в том, чтобы компании, поставляющие контент, могли зарабатывать деньги и были рады сотрудничать с нами.
Основная идея в том, чтобы давать им возможность монетизировать свой контент через нас. Показывать его в виде связанных материалов. Если на promoted-статью люди переходят из другой статьи, то её создатель получает большую часть вознаграждения за просмотр.
Мы воспринимаем обработанный новостной поток как наш продукт — точно так же, как Google считает своим трудом результат поисковой выдачи. Однако как только человек переходит по ссылке и открывает текст статьи, он перестаёт быть на нашей территории. За рекламу на ней мы готовы отдавать прибыль изданию и автору статьи.
Это не уникальная модель: очень многие новостные компании за последний год начали напрямую продавать места под рекламный контент, и уже есть несколько рекламных сетей, специализирующихся на этом. Самая большая — Outbrain, которая делает что-то похожее на News360 Promoted Content, но не на мобильных устройствах, а в вебе. Например, в конце любого материала CNN есть её секция From the web, и она не отмечена как рекламная. Это способ заработка, поскольку данные статьи оплачены крупными компаниями.
— Самое известное приложение подобного рода — Flipboard. У Flipboard нет никакой технологии персонализации, автоматического подбора статей и тому подобного, но это ничуть ему не мешает. И расходы (на серверы и др.) в пересчёте на одного пользователя у них наверняка меньше. Вопрос: нужны ли в этом случае такие сложные технологии?
— Flipboard — всё-таки немного другой продукт. Его цель в том, чтобы сделать максимально удобное чтение курирующихся кем-то другим журналов; наша — создать для каждого уникальный поток контента подобранный конкретно под него. В нашем видении будущего второе — нужнее и интереснее, но это в принципе разные сценарии, и многие пользователи используют Flipboard и News360 вместе.
Вопрос про масштабы инфраструктуры. N360 загружает и анализирует более ста тысяч статей в день. Это, вероятно, само по себе должно требовать каналов, серверов и т. п., как у маленького поисковика, а ещё и пользователи есть, которые загружают контент.
Масштабы инфраструктуры большие, но не космические: всё-таки мы индексируем пока не весь интернет, а только сотню тысяч источников (примерно 250 тысяч статей в день). Основная нагрузка — это способность в реальном времени применить довольно сложный портрет персонализации пользователя на весь свежий новостной контент — и так, чтобы это происходило за миллисекунды.
— Судя по пресс-релизам, вы открылись в 2011 году. Мобильные приложения редко надолго остаются в топах App Store. Как правило, происходит всплеск интереса, а потом он только падает. За два года вы должны были придумать какой-то способ поддерживать интерес к приложению. Или количество новых скачиваний падает?
— Мы запустились в самом конце 2010 года, хотя с тех пор приложение очень сильно изменилось. Нам удаётся оставаться в топе за счёт тесной работы с Apple и Google, которые часто ставят нас в featured места в App Store и Google Play, и в результате правильного продуктового развития: более шестидесяти процентов наших пользователей рекомендуют News360 своим друзьям. Благодаря этому сарафанному радио мы в основном и растём. Никакой магии здесь нет, просто людям реально очень нравится приложение, оно становится их ежедневной привычкой.
— Как давно вы живёте в США?
— Чуть больше двух лет.
— Чем наш рынок высокотехнологичных разработок принципиально отличается от американского?
— Если говорить о Кремниевой долине, то различия кардинальные. Как в сравнении с остальной Америкой, так и по отношению к России. В первую очередь они касаются уровня вовлечённости программистов в разработки компании.
В Кремниевой долине любая компания независимо от размера (будь то Google или маленький стартап) интересуется мыслями своих программистов о продукте. У них есть живое мнение, которое они будут высказывать. Эти люди не считают свой труд просто работой и могут уйти, если не найдут понимания. Туда приехали конкретно для того, чтобы работать по определённому направлению и воплощать свои идеи. Они верят в то, что делают мир лучше.
Когда большинство имеет такую пассионарность, она становится очень заразительной. Другие тоже начинают радеть за общий успех. Они могут прийти работать на меньшую зарплату ради опциона. Так возникают практически все стартапы.
В России это ещё не принято. Мы пытаемся культивировать внутри коллективов такое отношение, но натурального желания у людей пока нет.
Есть различия и с другой стороны. В США отмечается острый дефицит квалифицированной рабочей силы, и между компаниями идёт постоянная битва за лучшие кадры. Разработчики очень мобильны, а фирмам приходится приплачивать им за лояльность. Ведь если разработчик не будет полностью счастлив, он легко перейдёт работать к конкуренту.
Программирование — творческий процесс. Лучших программистов переманивают на решение более интересных задач, поскольку деньги на этому уровне уже перестают играть первостепенную роль. На хорошо оплачиваемую рутину разработчик всегда успеет перейти.
В остальных областях бизнеса — вне программирования — общая тенденция сохраняется. Не важно, чем именно занимается коллектив, но для успеха ему нужна высокая пассионарность всех сотрудников. У стартапов есть своеобразный культ взаимопомощи предпринимателей. В индустрии менторов, советников и венчурных капиталистов большая часть людей — бывшие предприниматели, которым хочется помогать другим. Они уже чего-то добились и хотят научить других.
В России всё наоборот. Если человек чего-то добился, ему начинают завидовать и плохо отзываться о нём. Считается, что он не мог ничего достичь своим трудом. В крайнем случае говорят, что просто повезло.