Дорогие друзья, данным материалом мы хотим открыть на «Компьютерре» серию бесед Дмитрия Завалишина (известного разработчика, старинного друга «Компьютерры» и просто DZ) с известными, успешными и интересными разработчиками России. Именно бесед, а не интервью. Первый собеседник — Давид Ян.
Дмитрий Завалишин. В последнее время меня не покидает ощущение, что большинство молодых людей в России (и я говорю в первую очередь о программистах и «стартаперах») смотрят на все окружающие их вещи как на некое благо, которое было даровано богами Америки — Google, Apple, Microsoft… Кажется, эти компании занимаются «магией», которая выше нашего понимания; а всё, что можем мы, — это просто пользоваться результатами «волшебства» — купить планшет или новую версию лицензионного ПО. Между «я» и тем, «что вокруг меня», появилась огромная дистанция. Нам сложно поверить, что такие вещи, как поисковик Google или новое поколение смартфонов от Apple, сделаны такими же, как и мы, людьми — талантливыми разработчиками, которые хотели изменить мир к лучшему и трудились не покладая рук.
Книги о Стиве Джобсе, конечно, замечательно популяризируют технологическое предпринимательство. Но все же Джобс остается богом — а не студентом, бросившим занятия в Калифорнийском университете в Беркли, чтобы со своим новым коллегой из Hewlett-Packard сделать персональный компьютер и выйти конкурировать с известнейшими софтверными разработчиками.
Возможно, незнание «человеческих» историй основателей крупных ИТ-компаний приводит к тому, что стартапы запускают люди, которые лет двадцать программировали в небольшой фирме и вдруг внезапно осознали себя бизнесменами. Конечно, из таких историй ничего по-настоящему прорывного не вырастет…
Давид, а ты ведь изначально растил ABBYY Lingvo как бизнес — купил один из самых полных на тот момент словарей, отдал основную разработку на аутсорс…
Давид Ян. На самом деле программированием я тоже чуть-чуть занимался. (Смеется.) Это была наша первая в ABBYY программа для внутренней автоматизации на Paradox. Ещё я написал теговую спецификацию к словарю (впоследствии она стала основой нашего языка для разметки словарных статей — DSL, Dictionary Specification Language). Но в целом ты прав, я в разработку никогда не лез. Но аутсорсом разработку Lingvo назвать нельзя ни в коем случае. Это было партнерство — одна компания, одна команда. Мы сразу условились, что моя задача – это нахождение денег, клиентов и подрядчиков по словарным базам, а задачей Александра Москалёва было написать собственно программу, и качество Lingvo — это стопроцентно его заслуга. В более поздних версиях Lingvo и FineReader я участвовал в разработке интерфейсной части, старался смотреть на продукт глазами пользователя. Внутри разработческой компании должны быть люди, которые находятся на стороне клиента больше, чем на стороне разработчика: это важный фактор успешности бизнеса.
Программисты в стартапах берут на себя роль менеджеров, наверное, от неизбежности: хороших управленцев мало, а руководить жизнью бизнеса все-таки кому-то нужно. (Хотя кто тогда будет программировать? 🙂 ) Но в нашем случае всё было несколько иначе. Мне сразу стало понятно, что программированием должен заниматься человек, который это умеет делать лучше меня.
Вначале мы с Сашей хотели просто заработать по пять тысяч рублей на переводе бумажного словаря в электронную форму — и, довольные (при стипендии в 55 рублей такие деньги казались огромными), разойтись. Но оказалось, что даже вдвоем реализовать этот проект крайне сложно. Нужно было не только разработать собственно программу для ПК, но также найти финансирование под создание контента, а затем — людей, которые подготовят этот самый электронный контент по нашей спецификации, исправить все ошибки, выпустить документацию, упаковку… и в конце концов кому-то этот контент продать. Про реализацию такого проекта в одиночку не могло быть и речи… Повторю, даже вдвоём это было предельно сложно. Сегодня я не очень понимаю, как нам удалось всё это сделать за девять месяцев :-).
Д. З. Получается, ваша логика была такая: «Это неподъёмно — значит, мы нанимаем много людей, а я разработкой продукта сам детально не занимаюсь»?
Д. Я. Это сегодня в ABBYY работает 2 000 человек и офисы в 14 странах… А в 1989 году «много людей» — это Саша Москалёв и я. Саша один в первые полтора года заменял десятерых: аналитика, интерфейс-дизайнера, графического дизайнера, архитектора, инженеров по базе данных, оболочке, резидентной программе, инсталятору, системе защиты, тестера, выпускающего QA инженера и пр.
Мы понимали, что нужно писать резидентную программу, которая позволила бы сделать словарь, «всплывающий» поверх окон Word или Excel и показывающий на экране перевод. TSR-программирование, надо сказать, тогда казалось чем-то фантастичным: эта техника толком нигде не была описана, книжек о ней почти не было (помню, первые из них появились в Доме научно-технической книги на Ленинском проспекте), знания передавались фактически из уст в уста.
Когда я спросил у Саши, может ли он написать резидентно сидящую в памяти ПК программу, он сказал только: «Я кое-что об этом знаю» — и вспомнил одного своего знакомого, который вроде бы умел «что-то такое» делать. Саша решил попробовать — и за месяц ему удалось только понять, как перехватить клавиатурное прерывание и что-то показать на экране. Но он был непоколебим — и через год резидентная программа-перехватчик стала занимать 3 кб памяти и адекватно работать. Самая первая её версия весила 35–40 кб: это было «впритык»; а потом Саша написал «стартёр», который в процессе прерывания выгружал часть памяти, загружал себя, обрабатывал — затем снова выгружал — и всё продолжало работать. Вот с такими задачами нам приходилось бороться, так как MS-DOS была однозадачной операционной системой…
Д. З. Резидентное программирование всегда было «на грани фола»: формально ведь этим заниматься было нельзя, по спецификациям MS DOS это было запрещено. Только некоторые инструменты внутри операционной системы позволяли резидентным программам переключать на себя обработку прерываний — и эти механизмы не были нигде задокументированы, их опытным путём обнаруживали отдельные люди. Я лично хорошо помню, что мы, наблюдая за работой таких «гуру», часто слышали просьбу: «А теперь, пожалуйста, отвернитесь». Всё было именно на таком уровне неизвестности. И достичь того, чтобы резидентные программы работали «без запинки», было действительно чем-то из области фантастики.
Д. Я. Сейчас мы продолжаем заниматься «магией» — только теперь в иной плоскости. Теперь эта «ворожба» посвящена поиску способов вычленить факты из естественного языка.
Д. З. Есть мнение, что такой подход, как «интерлингва» (вычленение смысла из фразы на одном языке, а затем перевод этой мысли на другой язык), в принципе неправилен. Как относиться к таким суждениям? Я знаю много людей, которые идеально владеют двумя иностранными языками (или языками программирования): они используют именно технику интерлингвистики. Но ведь семантика — это всегда сумма коммуникации в данный момент и коммуникативного опыта. А у программы такого опыта нет…
Д. Я. В разных культурах существует большая часть пересекающихся языково независимых понятий, которые укладываются в определённую иерархию. Существует множество академических исследований и проектов по этому поводу, а коммерческих попыток свести все понятия языка к универсальному дереву понятий и использовать его совместно с синтаксисом языка и статистикой не было.
В иерархии заложены характеристики, объекты, концепции, действия между объектами. Чтобы соединить все эти понятия в иерархию, в ней должны быть как древесные связи, так и недревесные. И вот, выявляя закономерности, мы приходим к той точке, где иерархия заканчивается как языково независимая структура — и продолжает детализироваться на уровне зависимых от специфики отдельных языков единиц.
Фактически это иерархия с собранными в ней сущностями, между которыми есть отношения близости. Одни из них — родительские, другие — дочерние; это деление образует основную структуру. Если наполнить основную «ёлку» иерархии массой существующих в языке семантических классов, то любой новый класс сможет занять чёткое место в этой системе. Качество «пристраивания» нового элемента при этом определяется минимумом новых связей, которые будут необходимы, чтобы покрыть все возможности применения этого концепта в реальном мире. Скажем, для концепта «зрелость» соседствующими элементами будут «зрелый»/«незрелый», «зелёный»/«перезрелый», «гнилой» и так далее.
То есть в системе заложены главным образом связи между понятиями смысловой близости. Кстати, в нашей команде работают люди, мыслящие на нескольких языках; с ними мы пытаемся анализировать параллельные тексты. При этом мы стараемся вычленить из этой естественной формы языка все наблюдаемые семантические классы, отнести наиболее конкретные из них на более низкие уровни, более общие — на верхние ступени иерархии. Например, семантический класс «средство передвижения» расположен выше классов «наземный транспорт», «воздушный транспорт» и «другой транспорт». Конечно, выстраивание таких цепочек — творческий процесс. Скажем, есть множество возможностей для встраивания в иерархию омонимов: «тополь» — это ведь и растение, и средство вооружения. Собственно говоря, из-за большого числа значений каждого слова в системе семантических категорий так много горизонтальных связей.
Для того чтобы верифицировать семантическое и синтаксическое описание, мы используем статистику. Статистика собирается по моно- и двуязычным корпусам. Именно статистические данные позволяют выстроить наиболее логичную, лаконичную структуру — естественно, снова с огромным количеством дополнительных связей между объектами и большим числом «допустим».
В целом работа системы включает ряд сложных этапов: лексико-морфологический анализ, грубый и точные синтаксический анализ, семантический анализ, синтаксический синтез, синтез линейного порядка и, наконец, морфологический синтез. Не буду вдаваться в подробности, и без того очевидно, что задача очень сложная — и именно потому очень многие считают интерлингвистические подходы невозможными…
Д. З. Но ведь это — как спор математиков и инженеров: первым решение кажется всегда недостижимым, вторые — уверены, что найдут реальное решение, которое выполнит задачу на 99%.
Д. Я. В прикладной лингвистике действительно много «подводных камней». Например, появляются новые семантические концепты; то, какими они будут, никогда нельзя предсказать. Скажем, концепт «социальная сеть»: раньше только на каком-то высочайшем уровне абстракции его можно было сопоставить с концептом «средство общения», сегодня же в этом сочетании — вполне конкретный смысл.
Мы уверены, что, обработав таким способом критическое число параллельных текстов на двух языках, мы «устаканим» иерархии. Сейчас над этим работает команда из трёхсот человек; в общей сложности в такой масштабный проект компания ABBYY вложила уже более $70 млн.
Д. З. ABBYY развивает бизнес в двух направлениях — распознавание документов и перевод текстов. Смерть рынка OCR — наверное, вопрос 5–10 лет, а на глобальном рынке услуг перевода и лингвистических технологий вас ждёт Google. Нет ощущения, что впереди у ABBYY — бетонная стена?
Д. Я. Для нас уже давно вся эта сложная работа по созданию формализованных описаний различных языков — не самоцель; мы видим конкретные перспективы применения продуктов на основе этих технологий на рынке. И «Гугл» на самом деле семантика и лингвистика пока мало интересуют: здесь пока для него не слишком денежный рынок.
Начиная в 1995 году проект, мы поставили цель — создать один из лучших машинных переводчиков, способный помочь специалистам переводить большее количество текстов за счёт редактирования результатов машинного перевода, а не путём перевода всего текста целиком.
Рынок перевода уже сегодня оценивается в $20 млрд, а в ближайшем будущем для группы из 10 языков (в основном агнлоцентричных) он вырастет вдвое.
Но параллельно в процессе работы мы открывали новые направления монетизации нашей технологии, в частности в области понимания, поиска и анализа текстовой информации. Именно эта область для нас коммерчески целесообразна сегодня — и мы планируем активно заниматься ей. Но и о переводе мы не забываем. Здесь важно сказать, что с технологической точки зрения машинный перевод является чуть ли не вершиной искусственного интеллекта; получить очень хороший перевод — действительно сложная задача.
Например, то, что мы научились вычленять факты из текстов и проводить анализ документов, выводит нас на рынок «умного» корпоративного поиска. В качестве иллюстрации: в США огромное количество судебных процессов между крупными компаниями, в рамках которых каждая из сторон должна предоставить всю внутреннюю электронную переписку, всю документацию по бизнесу — в электронном виде. Наша система может производить анализ всего этого массива текстовой информации — и выводить юристам и экспертам лишь конкретные результаты. Только этот рынок уже на сегодняшний момент оценивается в несколько миллиардов долларов.
Д. З. Речь идет о семантическом поиске?
Д. Я. По сути, да. Адвокаты и прокуроры пока ищут в судебной документации важные факты, основываясь на key words search либо на поиске с учётом синонимов. Это неэффективно: с одной стороны, точность результатов поиска низка (основаная причина — многозначность слов) с другой — очень многие действительно важные вещи просто пропускаются.
Мы готовы предложить намного более эффективную альтернативу. Скажем, адвокат берёт текст искового заявления и просит нашу систему найти судебные разбирательства, схожие по предмету иска. То есть мы можем автоматизировать процесс поиска прецедента, на котором базируется вся англосаксонская правовая система. Другая сфера применения — патентный анализ, где количество заявок и выданных свидетельств о правах интеллектуальной собственности растёт бешеными темпами. И тому подобное.
Д. З. Очевидно, что следующий шаг вхождения таких технологий в жизнь — диалог с клиентом в семантических терминах. А для этого нужна публичная поисковая система. Вы хотите двигаться в этом направлении?
Д. Я. Мы всегда развивали ABBYY как технологическую компанию — больше были ориентированы на предоставление рынку базовых платформ, которые уже наши партнёры «упаковывали» бы в конкретные продукты. Такая стратегия открывает перед бизнесом огромные возможности масштабирования. Да, конечно, у нас есть свои продукты, но если появляется кто-то, кто хочет сделать конкурентные решения на основе наших технологий, — мы, скорее всего, «подвинемся». Это модель во многом схожа с тем, как работают дистрибьюторы: ведь вендор не выходит на один рынок со своими реселлерами…
Мы запускаем собственные продукты больше для того, чтобы показать другим, каких результатов можно добиться, используя возможности наших изобретений. Например, множество мобильных приложений сегодня использует наши технологии распознавания текстов — но у нас есть и свой готовый к продаже формат этого продукта. FineReader и Lingvo, сразу оговорюсь, стали исключениями из правила; так получилось: они быстро завоевали огромную популярность среди конечных потребителей. Но во всех других направлениях мы стремимся больше к коллаборации, нежели к соперничеству. Это объясняется тем, что крупному игроку сложнее следить за конкретными потребностями массовой аудитории — а те, кто «сидит в канале», постоянно держат руку на пульсе. Вместе с тем и другая крайность — остаться на рынке no name — тоже чревата опасными последствиями.
Пока от партнерской модели из лидеров рынка отказывается разве что Apple: на данном этапе компания преуспела, но я думаю, что это временно. Если в ближайшие 5–10 лет Apple не станет технологически открытой корпорацией — она просто не сможет сдержать натиск Google, Samsung и Microsoft.
Д. З. Apple сейчас начинает лицензировать технологию Apple AirPlay: разве это не первый шаг к открытости? И, вообще говоря, может быть, модель Apple верна? Ведь Open innovation приводит к тому, что новые технологии начинают «допиливать» множество разработчиков — которые не чувствуют давления со стороны стандарта. В итоге на выходе (и это сейчас видно в ситуации c Android-приложениями) — масса плохих реализаций одной хорошей технологии.
Д. Я. Чтобы уйти от конкретных имен игроков рынка, я скажу, что истина, как всегда, посередине. Это как антагонизм демократического и тоталитарного политических режимов. Закрытый подход Apple очень похож на победу тоталитарного коммунизма в Сингапуре: премьер-министр Сингапура Ли Куан Ю доказал всем, что жесткими авторитарными методами можно вывести нищую страну без природных ресурсов из руин, избавиться от наркомафии и коррупции. Но я не уверен, что такое политическое устройство может быть успешным на очень долгое время. Весь мир ведь понимает, что если сейчас власти Сингапура не переведут страну к одной из форм управляемой демократии – государство может рухнуть.
На другом полюсе — естественное развитие рынка, «дикий» капитализм, где демократические инструменты развиваются стихийно. В каких-то странах это работает, в каких-то народ голосует за популистские реформы, что приводит к бегству капитала и сильных управленцев (почитайте недавнюю историю дефолта города Детройта, а также историю про кризис на юге Европы). Уверен, что истина, как и везде, — в противостоянии этих явлений. Экосистема Apple должна грамотно становиться более открытой, экосистема Android должна грамотно становиться более закрытой.
Еще пример. Цинь Шихуан-ди, китайский император III века до н.э., объединил отдельные провинции Китая, дал отпор кочевникам, построил Великую Китайскую стену и фактически создал единое государство Китая. Но одновременно он казнил тысячи людей, сжёг все книги в государстве, потому что считал: если в них написано то, о чём говорит он сам, — они не нужны, а если они противоречат тому, о чём говорит он, то не нужны тем более. Считать ли Цинь Шихуан-ди (или Ивана Грозного, с которым проводят параллели) однозначно положительными героями мировой истории? Вопрос чрезвычайно сложный. Они создавали великие государства, но убивали миллионы. Слава богу, что «технологические тираны» и «технологические религиозные лидеры», к которым можно отнести Джобса, никого не убивали. И в этом смысле я уверен, что появление Apple и Стива Джобса — огромное счастье для человечества, хотя я сам не причисляю себя к фанатикам Apple. Великие технологические лидеры действительно умеют мобилизовать все доступные ресурсы и «зажечь» своими идеями людей, пусть и навязав им фантастичный миф, — и это, несомненно, приводит к качественному скачку в развитии общества.
Д. З. Чтобы не продолжать дальше политическую дискуссию, верну тебя к ABBY. Все твои задачи, Давид, на уровне постановки кажутся почти фантастическими. Мне кажется, что вот такого желания изменить мир и не хватает сегодняшним стартапам…
Д. Я. Честно говоря, я не думаю, что в нашем мире мало людей, готовых мыслить глобально. Ко мне, например, приезжала команда предпринимателей из Питера, владельцы бара на Крестовском Open bar. Ребята которые хотят полностью изменить привычный для нас формат проведения досуга — и планируют в течение 25 лет не меньше тысячи заведений своего бренда по всему миру. В чем «фишка»? они придумали бар, который открывается только на три месяца в году — зато программа, еда, развлечения лучше в разы, чем во многих петербургских кафе.
Другие мои знакомые развивают стартап в Кремниевой долине — новую модель рекламы в интернете. Это настолько большой размах грядущих перемен, что я пытался их сосватать Ричарду Брэнсону: только он поймет полет их фантазии…
Д. З.. Это всё здорово, но пирамиду Маслоу никто не отменял. Позиция «Я хочу изменить мир» всегда присуща тем, кто более или менее встал на ноги и может позволить себе «креативить», вместо того чтобы думать о куске хлеба…
Д. Я. Это, конечно, правильно; но практика показывает обратное. «Яндекс», ABBYY, Google — все эти компании рождались, чтобы воплотить мечты разработчиков, — а уже потом основатели понимали, что находятся на пороге чего-то большого.
Когда мы начинали Lingvo, то планировали решить все проблемы с компьютерным словарём за одно лето — написать программу и продать первую сотню копий. Как я уже говорил, мы просто хотели заработать по 5 тысяч каждый — на новый костюм и на каике-то личные цели. В итоге первые три копии мы продали только в мае, спустя почти год. Ещё через год мы испытывали смешанные чувства. К тому моменту мы продали всего 15 копий, но при этом каждый третий академический институт уже имел наш словарь нелегально. В каждой третьей организации, куда мы звонили по справочнику Академии наук, говорили, что у них уже есть Lingvo. Мы прикинули: 50 тыс. нелегальных копий с 15 проданных легально! Продавать в такой ситуации было сложно, но гордость нас переполняла: в этот момент мы почувствовали, что коснулись чего-то большого, — и у нас возникло желание сделать мир лучше. Вот тогда мы и основали BIT Software, решили делать переводчик, системы коррекции орфографии, систему распознавания.
Надо сказать, что это желание изменить мир с того момента так и не покидает меня. Я ручаюсь, что мы доведём наши технологии в области лингвистики до того уровня, когда каждый второй холодильник, сходящий с конвейера, будет оснащен нашей системой — и сможет разговаривать с человеком на естественном языке. По нашим прикидкам, это случится через 5–7 лет. Я говорю не о командных системах, которыми оснащены смартфоны или бытовая техника (как сейчас), а об искусственном интеллекте, способном вести вполне разумную беседу — например, подсказать рецепт из продуктов на полках холодильной камеры или поделиться анекдотом. Я уверен, что это изменит парадигму отношений человека и компьютера, к которой мы привыкли сегодня.
Д. З. Американцы любят слово «friction», которым в том числе обозначают степень «сцепления» мечты с реальностью. Проблема проектов, которые меняют мир, — в том, что они слишком оторваны от действительности. Если стартапер находит способ решить проблемы нынешнего дня — да, его бизнес живёт. Если он задумывает что-то более глобальное, не привязанное к спросу в данный момент времени, — компании нужен большой «прыжок» в будущее, а это требует серьёзных денег…
Д. Я. Гай Кавасаки во всех своих пособиях говорит: думайте глобально — действуйте локально. Да, ты действительно должен воодушевлять своих первых сотрудников, подстёгивать мечтами себя самого и людей вокруг — но ты должен видеть, как твоя идея распадается на несколько более мелких, привязанных к сиюминутным потребностям людей. Если стартап начинает сразу решать глобальные задачи — он никогда не доживет до точки безубыточности. По сути, «действовать локально» в мантре Кавасаки означает не бояться решать нишевые проблемы, но делать это безупречно! Перед инвестором ты можешь сколько угодно рассказывать о своей идее завтрашнего дня. Тебя услышат, твоей задумкой и планами будут восхищаться — но чтобы воплотить эту историю, тебе для начала нужно сделать «пробу» на десяти клиентах, которые заплатят тебе сегодня. Почему-то сегодня стартапы не хотят осчастливливать небольшое количество пользователей — хотя на самых первых этапах это абсолютно правильная стратегия. Во-первых, это точка входа на рынок, во-вторых — возможность проверить востребованность будущего продукта. Таким образом, компания получит пул реальных клиентов, на потребности которых стартап сможет ориентироваться в течение всего своего пути. При этом не забывая о своей большой мечте.
Как-то интуитивно правильно шёл этим путём Джобс. Он сделал AppleI, затем Apple II и Apple III — и можно было уже ничего нового не придумывать, а развивать бизнес исключительно на Apple Computer. Но Джобс хотел сделать Apple Lisa и Macintosh: это была его мечта. И ведь он пришёл к небольшой группе разработчиков Macintosh, в старый офис Apple на Стивенс Крик, и сказал им: не думайте о цене, просто сделайте компьютер своей мечты. И так в Apple появился Mac, который впоследствии произвел настоящий прорыв. Собственно, так Джобс и двигался — от продукта к продукту, — и каждая его разработка революционизировала.
Д. З. Раз так, то можно ли воспитать в человеке пассионарность?
Д. Я. Джобс на встрече со студентами Стэнфорда попросил поднять руку вначале тех, кто употреблял LCD, затем — тех, кто до сих пор девственник. Давайте вспомним, как он придерживался принципов дзэн-буддизма и баухауса, постоянно ездил в Индию. Я думаю, что люди, которые толкают науку и бизнес вперед, в определённой степени безумны — в хорошем смысле, конечно. Можно ли этому научить? Вряд ли.
Д. З. Но ведь есть люди, которые разрабатывают продукты, решают небольшие проблемы (и это важно) — и тоже зарабатывают очень хорошие деньги на рынке хайтека. И нужно ли совершать волшебство, чтобы стать долларовым миллионером? Мне кажется, что такой подход не менее верен — при всей своей неамбициозности. По крайней мере это точно лучше, чем пытаться «продать идею», которая в принципе не может быть продана…
Д. Я. Знаете, есть такая известная метафора всей жизни инновационного бизнеса. Молодые люди подходят к краю пропасти, прыгают, а за время полета пытаются сконструировать самолёт, чтобы выжить. Самое страшное, если у них всё получится, но в последний момент они поймут, что сконструировали не самолёт, а паровоз…