Почему мы так мало знаем о ранней эпохе Интернета.
Потребовалось почти пять лет работы глобальной сети, прежде чем задумались о сохранении его материалов в архивах. Большая часть свидетельств и материалов о ранней работе сети утрачена.
В 2005 году студент Алекс Тью искал идею как заработать миллион долларов.
20-летний студент искал как заработать денег, чтобы заплатить три года учебы в университете на бизнес-специальности; Тью уже беспокоился о том, его расходы сильно превысят сумму банковского кредита. Большими буквами он написал на листе в блокноте: «Как стать миллионером» и стал думать.
Двадцать минут спустя он нашел, как ему казалось, решение.
Тью создал сайт под названием Million Dollar Homepage — «Страница на миллион долларов». Страничка была очень простой, даже примитивной – она состояла из миллиона пикселей рекламного пространства. Пиксели можно было купить в блоках по 100 штук, по цене 1 пиксель – 1 доллар. Они навсегда становились собственностью покупателя. Когда купят миллионный пиксель, Тью станет миллионером. По крайней мере, такой был план.
Веб-сайт запустили 26 августа 2005 года, регистрация доменного имени и оплата хостинга обошлась Тью в 50 евро. Рекламодатели покупали пиксели и размещали ссылку, крошечное изображение и короткий всплывающий текст, когда курсор наводился на изображение.
Прошло чуть больше месяца, и благодаря слухам и постоянно растущему вниманию средств массовой информации, домашняя страница Tью собрала более 250 000 долларов. В январе 2006 года последние 1000 пикселей ушли с молотка на аукционе за 38 100 долларов США; Тью действительно стал миллионером.
Прошло полтора десятилетия. Сайт «Million Dollar Homepage» и сейчас доступен он-лайн. Газета The Times, сервис Cheapflights.com, интернет-портал Yahoo! и рок-группа Tenacious D рекламируются там уже 15 год подряд, сделав когда-то разовый платеж за баннер. Сайт по-прежнему посещают несколько тысяч человек каждый день. Очевидно, это были очень хорошие инвестиции в рекламу.
Тью сейчас занимается приложением для занятий йогой Calm, теперь он состоятельный человек. Но созданная им домашняя страница также стала чем-то другим — это живой музей ранней эпохи Интернета. Пятнадцать лет — не такой уж и большой срок, но для Интернета это целая геологическая эпоха. Около 40% ссылок с сайта «Million Pixels Homepage» теперь ведут на мертвые ресурсы. Еще часть ведет на новые домены, их URL-адрес продан другим владельцам.
Страничка Алекса Тью показывает, что упадок этого раннего периода Интернета почти никому незаметен. В реальной жизни часто говорят о закрытии какой-нибудь газеты или журнала. Но онлайн-сайты обычно закрываются тихо, без лишнего шума, и Вы об этом узнаёте только когда нажимаете на ссылку, и открывается пустая страничка.
***
В конце 2000-х большой популярностью пользовался музыкальный раздел веб-сайта AOL. Эта компания-пионер Интернета сейчас принадлежит американскому телефонному оператору Verizon. Были подготовлены и опубликованы сотни живых обзоров, списков, музыкальных новостей и интервью. Facebook и Twitter уже тогда обеспечивали большую аудиторию посетителей, смартфоны связывали нас с Интернетом между работой и домом; серфинг в Интернете стал круглосуточным занятием.
Вы можете вполне разумно предположить, что если нужно будет почитать обзоры того времени, то в поисковике Google это все найдется. Но Вы ошибаетесь. В апреле 2013 года компания AOL неожиданно закрыла свои музыкальные сайты, все наработки за многие годы — коллективная работа десятков редакторов и сотен авторов — пропали. Мало что осталось, кроме нескольких статей, сохраненных на серверах интернет-архива Web-archive. Этот некоммерческий фонд был создан в конце 1990-х годов в Сан-Франциско IT-инженером Брюстером Кале, и это самая заметная группа организаций по всему миру, пытающаяся сохранять наследие первого десятилетия активности людей в Интернете, прежде чем оно полностью исчезнет.
Профессор Венди Холл, исполнительный директор Института веб-науки в Университете Саутгемптона, высоко оценивает работу архива: «Если бы не они, у нас не было бы ничего из ранних материалов», говорит она. «Если бы Брюстер Кале не настроил Web-archive и не стал бы сохранять сайты — дожидаясь чьего-либо разрешения, — мы бы все потеряли».
Венди Холл говорит, что государственные архивы и национальных библиотеки имеют необходимый опыт хранения книг, газет и периодических изданий, потому что типографская печать существует уже несколько веков. Но появление Интернета — и то, как быстро сеть стала массовой формой общения и самовыражения — застало их врасплох. С тех пор попытки архивировать Интернет во многих областях стали догонять. «В Британскую библиотеку должен поступать экземпляр каждой местной газеты», — говорит Холл. По мере того, как газеты уходят от печати на бумаге в Интернет, наполнение архивов приобретает другую форму. Действительно ли сайты могут считаться значимым и авторитетными источниками, как и газеты?
Газетные архивы также могут быть потеряны, когда публикации закрываются или объединяются с другими статьями. «Я считаю, что у большинства газет будет какой-то вид или архив», — говорит она. «Но все это легко потерять, если оно не уделять внимание ведению архивов».
Одна из основных проблем при попытке архивирования Интернета — он никогда не стоит на месте. Ежеминутно, ежесекундно идет бесконечный поток фотографий, сообщений в блогах, видеороликов, новостей и комментариев. Хотя облачные хранилища сильно подешевели, архивирование всего этого материала все еще стоит денег. «Кто за это заплатит?» — спрашивает госпожа Холл. «Мы производим гораздо больше контента, чем раньше».
В Великобритании задача по ведению цифровых архивов частично легла на Британскую библиотеку. Библиотека управляет Британским веб-архивом, который сохраняет копии веб-сайтов по разрешению с 2004 года. Джейсон Уэббер, менеджер по работе с архивами говорит, что проблема намного больше, чем думает большинство людей.
«Это касается не только старых веб-сайтов. Большая часть интернет-контента не сохраняется», — говорит он.
«Web-archive впервые начал копировать сайты в 1996 году. Это произошло через пять лет после создания первых веб-страниц. От той эпохи не осталось никаких оригинальных материалов, что можно было бы скопировать из сети сейчас». Даже самой первой веб-страницы, созданной в 1991 году, больше не существует; страница, которую можно увидеть на сайте Консорциума World Wide Web, является копией, сделанной годом позже.
Первые пять лет в британском сегменте Интернета публиковались странички с доменными именами .ac.uk. Это были научные статьи, написанные учеными. Только в 1996 году в Интернете стали создаваться сайты для широкого круга пользователей, число коммерческих страниц стало больше научных.
Британская библиотека делает полный дамп британского сегмента Интернета каждый год, сохраняя все, что публикуется в Великобритании. «Мы пытаемся скачать все, но делаем это только раз в год. Но для сайтов установлено ограничение в 500 МБ; это позволяет сохранить большинство небольших сайтов, но с видеороликами этот лимит достигается довольно быстро». Однако новостные сайты, такие как BBC News, архивируются чаще. Библиотека постаралась скачать как можно больше материалов о значимых событиях — Brexit, Олимпийские игры 2012 года в Лондоне и 100-летие начала Первой мировой войны.
«Я думаю, что был очень низкий уровень понимания того, что чего-то не хватает», — говорит Уэббер. «Цифровой мир очень эфемерный, мы смотрим на экраны наших смартфонов, текст и заголовки новостей на нем меняются, и мы не думаем об этом. Но теперь люди все больше понимают, сколько мы можем потерять».
«Но», — говорит Уэббер, — «единственные материалы, которые организация может архивировать – только то, что есть в открытом доступе; много культурных и исторических свидетельств хранится в личных коллекциях и архивах, на жестких дисках. Только немногие из нас хранят их для потомков.
Британская библиотека сохраняет даже корреспонденцию. Письма политиков, любовная переписка – все это может представлять большой интерес для исследователей».
Мы рассматриваем материал, который мы публикуем в социальных сетях, как нечто вечное и всегда доступное по щелчку мыши. Но недавняя потеря двенадцатилетнего собрания музыки и фотографий в социальной сети MySpace – еще недавно самой популярной в США — показывает, что даже материалы в самых крупных соц.сетях не защищены от потерь.
Сервисы Google тоже не отличаются постоянством. 2 апреля закрылась социальная сеть Google+, в свое время созданная как конкурент Facebook. Все ли пользователи создавали резервные копии фотографий и заметок, которые они выкладывали в ней?
«Размещение фотографий в Facebook не может быть хорошим способом хранения потому, что когда-нибудь этой социальной сети не будет», — говорит Уэббер. Если у вас есть какие-либо сомнения по поводу временного характера Интернета, поизучайте несколько минут сайт «Million Dollar Homepage». Это наглядное пример того, как быстро исчезает наше онлайн-прошлое.
Есть и другая сторона потери данных. Профессор Венди отмечает, что архивирование новостных ресурсов поможет в борьбе с избирательной трактовкой истории — например, если новое правительство в какой-нибудь стране решит заняться чисткой архивов или изменит официальную трактовку каких-нибудь событий.
«Как только происходит смена правительства, многие сайты закрываются», — говорит Джейн Уинтерс, профессор цифровых гуманитарных наук в Лондонском университете. «За примером ходить далеко не надо – сайты с предвыборной агитацией по своему характеру создаются временно».
Иногда утраченные веб-ресурсы свидетельствуют и о глобальных изменениях — смерти и рождении целых государств. «Так произошло в Югославии. Домен верхнего уровня .yu принадлежал этой стране. Когда страна распалась, он был ликвидирован. Один исследователь сейчас пытается восстановить то, что там размещалось до распада страны», — говорит она.
Политика постоянно оказывает влияние на технику.
Но не все так страшно. «Историк в своей работе постоянно сталкивается с пробелами в исторических записях. О некоторых событиях мы знаем, а о каких-то неизвестно ничего».
Венди Холл вспоминает и другой случай. Когда ей было 15 лет, в конце 1960-х годов она участвовала в музыкальном шоу BBC «Top of the Pops».
Шоу показали на Рождество. «Телевизор работал, и моя мама сказала: «Вот смотри, ты на экране!» Но я не успела. Потом я обращалась в корпорацию BBC и пыталась разыскать копию этого шоу — они записывали его на пленку. Но пленка так и не нашлась.