Китайская корпорация «Байду» с каждым годом укрепляла свои позиции на азиатском рынке, используя для этого как технические, так и политические приёмы конкурентной борьбы. Этим летом один из самых влиятельных новаторов Эндрю Ын (Andrew Ng) занял в ней пост ведущего специалиста лаборатории искусственного интеллекта, и для Baidu настали новые времена.
Сейчас Baidu понемногу вытесняет Google из бизнеса за пределами Китая и стремиться активнее предоставлять услуги жителям других стран. После добавления поддержки японского языка её поисковик стал занимать второе место в мире по числу ежедневных обращений, а число фирменных сервисов превысило три десятка. На раннем этапе многие из них были созданы по принципу C2C (copy to China), но теперь руководство компании всячески старается изжить сложившийся стереотип о порочной практике заимствований и делает ставку на инновации.
За пределы Великой Китайской стены
О том, что Baidu становится международной компанией, свидетельствует и недавно открытая ей в Кремниевой Долине лаборатория искусственного интеллекта. Она появилась в дополнение к двум другим исследовательским лабораториям Baidu, уже работающим в Пекине. Компания планирует инвестировать в развитие нового исследовательского комплекса до трехсот миллионов долларов в течение ближайших пяти лет.
«Эти средства будут направлены на целевое развитие фундаментальных технологий», – комментирует директор Пекинской лаборатории Baidu Кай Ю, которого с Эндрю Ыном связывают годы сотрудничества в самых разных проектах со студенческих времён.
Новая лаборатория Baidu находится в Саннивейл – буквально в несколько минутах езды к юго-востоку от штаб-квартиры Google. Её площадь составляет около полутора тысяч квадратных метров. На ней разместятся индивидуальные рабочие места, комнаты для совещаний и релаксации, гимнастический зал и кафетерий. В целом проект лаборатории воссоздаёт кампусную атмосферу, где легко работать именно творческим людям.
Найдите 10 млн отличий
Сам Эндрю Ын намерен нанять в свою команду около семидесяти человек, среди которых будут системные программисты и специалисты широкого профиля в области искусственного интеллекта. Он известен как профессор Стэнфордского университета, соавтор открытого образовательного проекта Coursera и один из ведущих специалистов по технологиям машинного обучения.
Три года назад он принимал участие в проекте Google Brain по симуляции работы головного мозга. Тогда особенности взаимодействия нейронов моделировались для того, чтобы найти способ более эффективно анализировать изображения и звуки: находить на них определённые объекты с любым ракурсом и выделять похожие. В идеале на программном уровне это планировалось сделать примерно с той же эффективностью, какой обладает человеческий мозг.
Основной частью эксперимента Google Brain стала обработка 10 млн видео с YouTube на кластере, состоящим из шестнадцати тысяч процессоров и миллиардом виртуальных соединений, имитирующих нейронную сеть. За счёт алгоритмов машинного обучения программа научилась распознавать отдельные образы (в частности, кошек). Сейчас результаты этой работы используются Google во многих фирменных продуктах. К примеру, когда вы нажимаете «найти похожие изображения» в поисковой выдаче или диктуете текст на смартфоне с Andorid, в программах используются те же подходы.
При всей своей корпоративной мощности Google стоит огромных усилий удерживать статус лидера онлайновых сервисов. Быть лучшим поисковиком давно мало. Конкуренция в сфере интернет-технологий усиливается с каждым годом, поэтому постоянно требуется искать новые направления. Почта, чаты, видеосвязь, навигация, персональные подсказки, документы в облаке, собственный браузер и операционная система, дополненная реальности и другие «проекты Икс». Никто не знает, чем ещё компании смогут привлечь и удержать клиентов в будущем.
Это понимают и в Baidu. Если раньше в ней старались копировать успешные западные сервисы, то в последнее время её руководство тратит основные усилия на поиск новаторских решений и привлечение талантливых людей. Укрепить позиции помогает и большое внимание местной специфике – как языковой, так и культурной.
Рождение легенды
Бывший инженер-программист и соавтор InfoSekk Робин Ли (Robin Li) основал Baidu в 2000 году. Тремя годами раньше (за год до появления Google) у него уже был патент на алгоритм ранжирования сайтов в поисковой выдаче. Спустя четыре года ему удалось привлечь крупные инвестиции, при этом $5 млн поступило от фонда Google. Рост Baidu в этот период был настолько взрывным, что год-полтора спустя Google пыталась выкупить китайского конкурента, предлагая (по данным Bloomberg) до $1,6 млрд. Вместо сделки о поглощении руководство реорганизовало Baidu, превратив её в акционерную компанию в августе 2005 года. В первый же день торгов её акции взлетели на 354%.
Подобные примеры говорят о том, что самая густонаселённая страна в мире постепенно уходит от навязанной роли крупнейшего индустриального центра и переключается на рынок интеллектуальных услуг. Ежедневно доступом в сеть пользуются 632 млн китайцев, а TOP-20 китайских компаний, имеющих представительства в других странах, имеют общую рыночную стоимость порядка $340 млрд. Половина этой суммы приходится на Tencent – ведущего провайдера и оператора одной из крупнейших сетей сети обмена сообщениями QQ, а также и владельца сервиса WeChat, чья аудитория недавно превысила 100 млн. пользователей.
Руководство «Байду» рассчитывает получать к 2020 году до половины всей прибыли от предоставления своих веб-сервисов за пределами Китая. Для этого в ней будут разрабатывать действительно умные приложения с развитой системой анализа поведения и предпочтений пользователя. Например, персонального помощника, который будет гораздо совершеннее Siri от Apple и системы Google Now. Заглядывая в будущее, Эндрю Ын мечтает о том, как технологии машинного обучения преобразят робототехнику, сделают автопилот в машинах привычным, а дроны и бытовых роботов – более самостоятельными и безопасными.
Естественное развитие искусственного интеллекта
Восприятие AI как универсальной сверхсилы сложилось у Эндрю ещё в студенческие годы, когда он вместе с Адамом Коутсом (Adam Coates) пытался написать интеллектуальную систему управления для игрушечных вертолётов. Вскоре они поняли, что машинное обучение – универсальный подход к решению многих проблем. Вместе они разработали алгоритмы для радиоуправляемых игрушек и мультикоптеров, бытовых роботов и систем распознавания изображений.
Сейчас Коутс возглавляет лабораторию Baidu и основное внимание уделяет проблеме анализа аудиовизуальных образов. В прошлом году его команда из Стэнфорда построила нейронную сеть, не уступающую по мощности Google Brain. Её создание обошлось вдвое дешевле за счёт использования графических чипов Nvidia вместо универсальных процессоров архитектуры x86. Однако при более современной аппаратной части осталось множество нерешённых проблем на уровне софта.
Недостаток ранних подходов в алгоритмах машинного обучения заключался в том, что на первом этапе им требовался колоссальный объём ручного труда. Например, чтобы научить Google Brain определять изображение кошки, для него создали базу из пятидесяти тысяч фотографий. В неё вошли все породы и наиболее типичные ракурсы, которые отбирались людьми. Это впечатляло поначалу, но мозг человека работает иначе. Ребёнку не требуется увидеть кошку десятки тысяч раз, чтобы научиться отличать от собаки.
Современная концепция развития AI сильно отличается от натаскивания на составленных вручную шаблонах, поэтому во избежание путаницы вместо «машинного обучения» всё чаще используют термин «глубокое обучение». В нём подчёркивается большая самостоятельность программ. «Мы просто бродим по миру, изучая его, – говорит Коутс. – Есть надежда, что мы сможем создать алгоритмы, которые учатся так же и без существенного влияния человека».
Стремление крупных китайских компаний выйти за пределы своего региона может сильно пошатнуть позиции западных лидеров отрасли. До сих пор они слабо пересекались с азиатскими корпорациями, но теперь вместе будут конкурировать за единственный оставшийся рынок – пользователей из развивающихся стран, большая часть которых пока вовсе не имеет возможности регулярного выхода в интернет.