Много данных — это всегда интересно. Берёте хороший инструмент, способный крутить числами так и эдак (мне нравится GNU R, но из свободных хвалят ещё GNU Octave), и режете их на слайсы в поисках закономерностей. Плохо одно: концепция того, что вы ищете, к моменту начала поиска уже должна сидеть в вашей голове. Именно это — классический недостаток вычислительной техники: хоть думает она быстрее человека, думать по-настоящему — бог с ним, с сознанием, но хотя бы формировать теории, терпеть отклонения от строгой логики — так вот, думать по-настоящему не умеет. Обработкой большого объёма чисел «на потоке» в лучшем случае занимаются системы с элементами искусственного интеллекта — «натасканные» на конкретный случай, специфику. Настоящий же ИИ — тот самый, свободно переключающийся с темы на тему (его иногда ещё называют «сильным ИИ»: англ. «strong AI») — остаётся мечтой, в лучшем случае лабораторным экспериментом. Хорошая новость: мы, безусловно, достигли момента, когда сильный ИИ необходим. Дальше без него не сможем.
Посмотрите на Facebook (да и вообще любую большую социальную сеть или веб-сервис). Сегодня это если не крупнейший, то один из крупнейших инфоколлекторов, построенных человеком. Каждые сутки 700 миллионов пользователей добавляют (только добавляют!) к протекающей через него цифровой реке полпетабайта, каждый год аудитория вырастает ещё на сотню миллионов голов. Разделить эту информационную артерию на ручейки, отыскать полезные зависимости не в состоянии не только человек, но уже и слабый ИИ — которым нужно руководить, направлять, подстраивать, кормить предварительно подготовленными данными. Объёмы столь велики, что эффективность ручного или автоматизированного слабым ИИ труда в итоге оказывается ничтожной. А представьте на минутку, что «Фейсбук» обзавёлся бы настоящим искусственным интеллектом!
Первое, за что взялся бы сильный ИИ, — это мусорная куча под названием новостная лента. Идея была хороша, да и по сей день считается одной из самых удачных, но размеры сети таковы, что даже пользователь с небольшим количеством друзей быстро оказывается погребён под лавиной информации. В этой колонке разговор о проблеме шёл недавно (см. «Фастфуд для мозгов»). Равно как и о решении: было бы идеально уменьшить количество сообщений и общую смысловую нагрузку до абсолютного минимума (может быть, подстраиваемого по желанию конкретного индивида), но — легко сказать!
«Фейсбук» и так уже тщательно фильтрует попадающее в ленту — с помощью алгоритма, неформально называемого EdgeRank (учитывает социальную значимость корреспондентов, свежесть данных, актуальность и т. п.), а также классических техник машинного обучения (слабого ИИ). Всё это сжимает исходный поток информации почти на два порядка. Но этого недостаточно! Задачу фильтрации должен взвалить на свои плечи сильный ИИ. Только он, действуя подобно живому человеку, способен оставить минимальное количество действительно важных новостей и тем самым удовлетворить среднего пользователя, который всё чаще проверяет свою соцленту на ходу, мельком, с мобильных устройств.
Вторым делом стало бы распознавание объектов, выделение смысловой составляющей, эмоций из снимков и видео, текста. Сильный ИИ даст «Фейсбуку» неисчерпаемый источник осмысленных данных и позволит понять пользователя, буквально залезть в его голову, в отношения с другими людьми. А это, в свою очередь, даёт множество выходов на коммерчески полезные вещи. Представьте, что рекламные объявления можно будет подбирать в соответствии с увиденным на фотографиях. Пользователь замечен в кроссовках X? Покажем новую модель! На снимок попали ползунки? Пора рекламировать товары для молодых мамочек. Тем же инструментом смогут оперировать и сами пользователи, которые, вероятно, получат по-настоящему умный поиск: спросите, кто из друзей за последний год обзавёлся детьми, — и на выходе получите готовый фотосет.
Третьим большим делом сильного ИИ будет прогнозирование пользовательского поведения. Считается, что это не так сложно, как кажется, а уж «мыслящая» машина справится с задачей на раз. В каком порядке юзер поглощает контент, что предпочитает рассмотреть подробней, насколько и как именно активен социально: предвидя всё это хотя бы на несколько секунд/шагов вперёд, Facebook сможет удерживать вас в своих объятиях дольше — а для владельцев любого сайта нет ничего важнее времени, которое мы на него тратим. Шесть лет назад средний клиент проводил на «Фейсбуке» немногим больше двух часов в месяц, год назад — уже семь часов (рекордно много для мира соцсетей), и с тех пор эта цифра выросла ещё вдвое! Но рост, конечно же, не будет бесконечным: пока его питает мобильная революция, но только умная машина, неустанно ищущая новые способы задержать человека, сможет удержать положительную кривизну развития в перспективе.
Скажете, фантазии? Уже нет. Всю минувшую осень Facebook формировала команду из лучших специалистов по ИИ, до которых только удалось дотянуться, а на днях ей достался козырь: руководить созданной наконец собственной лабораторией искусственного интеллекта компания поставила Яна Лекуна, американского профессора, работающего над сильным ИИ. Лекун — личность легендарная: он один из немногих пионеров так называемого глубокого обучения (deep learning, DL) — новаторского подхода к построению и эксплуатации искусственных нейросетей, приближающих их по функциональности к головному мозгу живых существ.
Такая характеристика выглядит жутким обобщением, но нужно понимать, что область DL до сих пор остаётся весьма экспериментальной, неисследованной и даже опасной для имиджа занятых в ней учёных (не все верят, что в DL есть рациональное зерно). Суть в том, чтобы учить многослойную нейросеть особым образом, поэтапно, данными различного сорта (от необработанных до подготовленных, сортированных) — и получить в конце концов машину, способную к распознаванию не только конкретного образа, но и (подобно, скажем, мозгу человека) класса, к которому этот образ принадлежит. Способную мыслить иерархически, категориями.
Если идея кажется вам знакомой, вы не ошиблись: над ней, с разной степенью успеха и различными продуктами на выходе, работают и IBM (вспомните суперкомпьютер Watson, побеждающий человека в телевикторинах), и Google (распознавание речи в Android и знаменитый эксперимент с «кошкой»), и Microsoft. Facebook схватила джек-пот, но и другие не промах: например, в Google уже трудится Джефри Хинтон, который вместе с Лекуном стоял у истоков DL.
Интерес, проявляемый гигантами ИТ-бизнеса к сильному ИИ, обещает вывести это направление за пределы лабораторных стен, где оно десятилетиями обреталось. И надеяться на скорый прорыв: ведь вместо скудных государственных грантов работы теперь финансирует бизнес. Но едва ли не важнее этого обстоятельства — замечательный и, пожалуй, грустный факт: человек более не в состоянии справиться с порождаемым им самим потоком информации. Нам необходим помощник. Сумеем ли построить?