В середине апреля случилось интересное, но весьма специфическое событие, о котором я собирался рассказать при первом удобном случае — и собирался почти месяц, пока вчера наконец не стало ясно, что — пора. Событие это состоит в публикации исходных текстов знаменитой и даже легендарной компьютерной игры Prince of Persia (PoP). Джордан Мекнер, её автор, считал исходники утерянными, но благодаря везению и помощи целой команды «спасателей» всё-таки получил искомое.
А случай — даже близко не такой увлекательный, как реанимация PoP, но заставивший меня вспомнить о ней — заключался в лично моей необходимости перенести данные с двух совсем ещё не старых винчестеров на новый компьютер. Внешне две эти истории никак не связаны. Но и там, и там камнем преткновения была слишком короткая жизнь цифровых носителей информации.
Почти всю свою историю человечество хранило информацию на носителях, пригодных для непосредственного восприятия, без применения вспомогательных устройств, либо предполагающих использование несложной техники. Рисунки охрой на стенах пещер, иероглифы Розеттского камня, нотные листы эпохи Ренессанса или печатные книги — всё это вариации одной технологии, главное достоинство которой заключается в долговечности. Наскальная живопись эпохи верхнего палеолита (возраст: десятки тысяч лет) всё ещё пригодна для чтения.
Но всё изменилось с появлением цифровых носителей — или, что правильней, носителей информации, предполагающих запись и чтение с применением электронной техники. Они более удобны, несравнимо более ёмки, и только с долговечностью пришлось распрощаться. Век цифровых носителей фантастически короток и предопределён двумя факторами.
Во-первых, сказывается хрупкость материалов, используемых для хранения информации в цифровом виде. Магнитная лента, дискеты, жёсткие диски сыплются (буквально) и подвержены влиянию кажется всех мыслимых внешних воздействий, от магнитных полей и температуры до влажности и давления. Лишь немногим меньше боятся механических повреждений их оптические наследники: CD, DVD, BD. При правильном хранении, производители обещают сохранение работоспособности оптических дисков на протяжении десятилетий, но практика показывает, что верить таким обещаниям можно только с большой оговоркой.
Увы, записываемые лазерные диски склонны менять цвет, прозрачность, расслаиваться уже через несколько лет. Наконец твердотельные накопители на чипах NAND («флэшки») тоже не вечны. И хоть по прочности они приближаются к носителям начала цифрового века — перфокартам и перфолентам — в перспективе их судьба так же незавидна: вмешивается второй фактор.
Фактор номер два заключается в необходимости использования для чтения цифровых носителей соответствующих устройств. Перфокарты не прочитаешь в дисководе, магнитные дискеты не вставишь в оптический привод, а съём информации с CD не удастся произвести без лазера, к примеру, чисто электрическим USB-интерфейсом, достаточным для флэш-карт. Поэтому тот факт, что перфокарты 70-х годов дожили до наших дней, ещё ничего не гарантирует: кто из вас может похвастаться сегодня наличием устройства для их чтения?
Что ещё хуже, даже если каким-то чудом вам удастся раздобыть и подключить к персоналке ридер перфокарт, этого будет мало. Цифровые данные недостаточно только прочитать, их необходимо осмыслить, расшифровать. А форматы файлов меняются так же быстро, как и сами технологии хранения. В какой кодировке записан текст на носителях тридцатилетней давности? Какими программами эти тексты открывались? А что если вам нужно восстановить не просто текстовый документ, а программу? На какое оборудование она рассчитана, в какой операционной системе запускалась?
Короче говоря, для полноценного восстановления цифрового документа часто необходимо реконструировать и весь программно-аппаратный комплекс, с помощью которого документ когда-то был создан и редактировался. Потеряйте хоть одно звено в этой длинной цепочке — и можете попрощаться с данными навсегда. Prince of Persia — замечательный пример того, сколь сложным может быть реставрационный процесс.
Релиз оригинальной Prince of Persia (для компьютера Apple II) состоялся в 1989 году. Мекнер вспоминает, что вскоре после этого решил завязать с программированием и — на всякий случай — сделал резервные копии всех своих наработок, поступив так же, как тогда делали все: он сохранил архивы на современном носителе, 3.5-дюймовых дискетах, и сунул коробку в шкаф. PoP стала бестселлером, была портирована на все платформы, но когда в начале нулевых возникла нужда заглянуть в исходники оригинальной версии, отыскать заветную коробку не удалось. Десять лет Мекнер провёл в поисках, пока ему не улыбнулась удача (та самая коробка обнаружилась нынче весной в старом хламе), но даже после этого всё только начиналось.
Магнитный носитель, пролежавший двадцать лет на антресолях, подобен столетней давности книге, поднятой с морского дна: одно неосторожное движение — и она рассыплется в прах. Чтобы прочитать содержимое трёх дискет (всего-то по 140 килобайт каждая), Мекнер собрал команду энтузиастов, занимающихся тем, что когда-нибудь получит название цифровой археологии.
С помощью специального оборудования они сделали многосотмегабайтные магнитные «снимки» дискет, подвергли их обработке для преобразования в исходную последовательность байт, расшифровали (дискеты были записаны в особом формате, известном только разработчикам PoP) и только после этого получили собственно текстовые документы, пригодные для чтения на современных компьютерах.
Автору PoP очень повезло — и он охотно это признаёт. Дискеты сохранились, на них не было внешних повреждений, их содержимое оказалось достаточно интересным, чтобы удалось собрать команду специалистов, на голом энтузиазме выполнивших процесс цифровой реставрации. Наконец банально были живы люди, которые знали технические тонкости проекта (в том числе алгоритм защиты данных), и на руках у публики ещё остались рабочие копии Apple II.
Но такое везение — скорее исключение, нежели правило. Когда в конце 90-х американский нейробиолог Джозеф Миллер попытался поднять из архивов NASA записи о четвертьвековой давности экспериментах, проводившихся «Викингами» на поверхности Марса, то получил лишь несколько древних магнитных лент. Форматы файлов на которых были настолько старыми, что даже человек, их придумавший, уже умер. В результате восстановить удалось только часть материалов.
Короткая жизнь цифры — проблема с глобальными последствиями. Чем дальше, тем активней человек использует цифровые технологии, тем меньше остаётся на долю долговечных, но старомодных «аналоговых» носителей. По разным оценкам, в цифровой форме сегодня генерируется свыше девяти десятых всей информации на Земле. Всё реже человека интересует, где конкретно хранится тот или иной документ: глобальная сеть, «облака» освобождают нас от необходимости думать о таких мелочах. И быстрее стирается оставляемый нами информационный след. Сколько миллионов веб-страниц бесследно исчезают каждый день, забытые авторами, ставшие ненужными? Бумага по крайней мере оседала бы в библиотеках.
Противостоять проблеме цифрового старения (англ. digital obsolescence) пытаются как энтузиасты-одиночки, собирающие старое компьютерное железо и поддерживающие его в рабочем состоянии, так и крупные международные организации, создающие архивы цифрового наследия (UNESCO, Международный консорциум веб-наследия, Internet Archive и др.). Но стоит помнить о ней и дома, и в офисе.
Когда последний раз вы проверяли состояние своих резервных копий? Читабельны ли они, можете ли вы вообще получить к ним доступ? Часть моего личного CD-архива (от начала нулевых) уже необратимо испорчена. А вчера мне не удалось подключить к новой персоналке совсем ещё не старые винчестеры: популярный всего-то десять лет назад интерфейс IDE, оказывается, на современных материнских платах просто отсутствует. Увы, цифровые носители стареют намного быстрее, чем данные, на них хранящиеся.