Бывший технический директор Facebook Адам д’Анджело (Adam D’Angelo) намерен создать «репозиторий мудрости» на основе алгоритмов машинного обучения и существующего социального сервиса обмена знаниями Quora.
Когда сайт Quora в 2010 году был открыт для свободного доступа, многим казалось, что в наши дни трудно создать новый источник актуальной информации. Интернет и так был разделён между новостными порталами, поисковыми машинами, онлайновыми энциклопедиями, специализированными форумами и универсальными сервисами вопросов-ответов, на которых можно было спросить живых людей. Вдобавок бурное развитие получили социальные сети, и значительную часть сведений люди стали узнавать из них.
Три года спустя Quora нашёл свою нишу и сумел стать уникальным источником знаний. Всё это время на страницах проекта люди обогащали базу данных какими-то фактами, а также прямо выражали своё отношение ко многим вещам. Ещё больше данных удалось получить благодаря анализу эмоциональных реакции и персональных взаимодействий.
Среди примеров информации, которую трудно найти в интернете, разработчики Quora указывают личный опыт, узкоспециализированные профессиональные познания, особенности внутрикорпоративной культуры конкретных компаний, предстартовые ритуалы астронавтов и другие любопытные подробности с ярко выраженными личностными особенностями.
Исполнительный директор и основатель Quora Адам д’Анджело так описал отличительные черты работы алгоритмов разработанного сервиса в интервью изданию MIT Technology Review:
К настоящему времени было предпринято много разных алгоритмических подходов в попытках упорядочить и связать воедино накопленные знания. Среди отдельных решений можно выделить опыт Google и систему искусственного интеллекта IBM Watson. При этом масса ценных сведений всё ещё хранится в неявном виде или вовсе находится только в головах отдельных людей, без отражения её в интернете. Например, в июле произошла катастрофа с самолётом компании Asiana Airlines. До сих пор неизвестны многие факты и детали. Их не найти в интернете, несмотря на подробный отчёт комиссии. Между тем у каждого пилота была своя точка зрения о произошедшем, и мы узнали её. Иногда вы просто хотите быстро получить экспертный совет на простой вопрос — вроде того, как воспитать собаку. Это пример использования опыта не просто определённых людей, а профессионалов своего дела.
Избыточность (если не откровенная бесполезность) обсуждений на форумах уже вошла в юмористический фольклор, а сервисы наподобие Yahoo! Answers, определённо, ждёт та же участь. Порой кажется, что чем проще и конкретнее задают вопрос, тем больше абстрактных рассуждений и лишних уточнений напишут отвечающие. По мнению д’Анджело, принципы и результаты работы Quora выгодно отличаются:
В большинстве случаев мы заранее можем прогнозировать ценность ответов и ранжировать их, отсеяв малоинформативные. У нас, как правило, есть данные об отвечающем, а самое главное — история того, как на его предыдущие ответы реагировали разные люди. Когда вы смотрите на результаты, то видите только лучшую часть Quora, которая стала возможной за счёт сложной фоновой обработки данных.
Говоря об отличиях от других существующих систем, вроде Amazon и Netflix, Адам д’Анджело перечисляет следующее:
У нас есть десятки миллионов единиц контента. Мы используем технологии машинного обучения, чтобы понять, какой вариант ответа вы желаете получить. Для этого используется анализ вашей истории поиска, формируется список интересующих вас тем, отслеживаются вопросы и голосование за ответы других людей. Мы можем выявить экспертов в различных очень узких областях и перенаправить вопросы им, чтобы вы получили наилучший результат.
Сервисы Google тоже активно собирают сведения о действиях пользователя. Нам говорят, что это делается с целью улучшения релевантности выдаваемых результатов. Однако пока данные технологии в большей мере используются для персонализированной рекламы.
Если вы зададите общий поисковый запрос на Google и Yahoo!, то получите результаты из самых разных областей. Например, введя «B-52», вы увидите подборку изображений, на которой будут представлены не только фотографии бомбардировщика и его схема. Среди результатов поиска окажется снимок коктейля с тем же названием, музыкальная группа B-52’s (названная так из-за сленгового обозначения разновидности причёски), мотоблок и зимняя обувь.
В противоположность данному примеру, разработчики Quora стремятся максимально конкретизировать ответы, используя для этого известные факты о формирующем запрос человеке:
Мы уже знаем что-то о человеке, который задал вопрос. Мы также знаем его предыдущие ответы. Знаем тех, кому они понравились, а кому — нет. Если кто-то интересуется вопросами из области квантовой физики, ему мало помогут эксперты даже в смежных разделах. Система учитывает это, перенаправляет его и переобучается сама в течение каждых нескольких минут.
Говоря о перспективах развития, Адам д’Анджело поясняет, что на данный момент компания не имеет конкретных планов по расширению источников доходов и сосредоточена на росте. Впрочем, возможность показа персонализированной рекламы он тоже не отрицает.