Истории текстовых форматов: от ASCII до PDF

В течение многих веков текст служил основным средством передачи информации, претерпевая непрерывное развитие и адаптацию к изменяющимся технологиям и потребностям общества. История письма, папируса и бумаги известна, однако с развитием цифровой эпохи стали популярны электронные документы. Вместе с Code Industry мы погрузились в историю электронных текстовых форматов, которые стали неотъемлемой частью нашей повседневной жизни. В статье разберем популярные для того времени форматы и инструменты работы с ними. 

Документы

Начало 1960-х — Американский стандарт кодов информатики (ASCII)

Американский стандарт кодов информатики (ASCII) является одним из первых и наиболее распространенных текстовых форматов. История ASCII берет свое начало в 1960-х годах, когда возникла необходимость унифицировать способы представления символов и управляющих кодов на компьютерах различных производителей.

ASCII был разработан американским национальным институтом стандартов (ANSI) и впервые опубликован в 1963 году. Основная идея ASCII заключалась в том, чтобы каждому символу сопоставить уникальный код от 0 до 127, что позволило компьютерам однозначно интерпретировать и обрабатывать текстовую информацию.

В 1964 году художник и программист Кеннет Ноултон использовал новую технику под названием «компьютерное рисование», чтобы создать портрет своей жены, используя ограниченный набор символов компьютера IBM 7094. Эти псевдографические изображения стали первыми примерами ASCII-арта.

ASCII стал основой для других кодировок символов, таких как ANSI, UTF-8, и оказал значительное влияние на развитие компьютерной индустрии и цифровых коммуникаций. 

Помимо стандартного набора ASCII, существуют расширенные версии Extended ASCII, которые включают дополнительные символы и знаки препинания.

Сегодня ASCII остается актуальным во многих областях информационных технологий.

Начало 1970-х — TeX / LaTeX

В начале 1970-х годов американский компьютерный ученый Дональд Кнут разработал систему компьютерной вёрстки TeX, которая стала революционным инструментом для набора и верстки научных и математических текстов. TeX предложил новый подход к созданию документов, основанный на высоком качестве типографии и точном позиционировании элементов текста.

Название произносится как «тех» (от греч. τέχνη — «искусство», «мастерство»). В написании буква E опущена ниже T и X. 

Впоследствии на основе TeX был разработан язык разметки LaTeX, который предоставил более высокий уровень абстракции и упростил процесс создания сложных документов. LaTeX стал стандартом в научных кругах, академических учреждениях и издательствах благодаря своей гибкости, мощности и возможности создания документов.

ΤΕΧ применяется в исходных текстах Википедии для набора математических формул. 

Сегодня TeX и LaTeX продолжают оставаться популярными среди специалистов в области науки и техники, подтверждая свою значимость и актуальность в цифровой эпохе.

Конец 1970-х — WordPerfect (WPD)

WPD был создан WordPerfect Corporation в конце 1970-х годов. Он был серьезным конкурентом Microsoft Word и предлагал широкий спектр функций для создания и редактирования текстов. 

WordPerfect предлагал уникальные функции, такие как Reveal Codes, которые позволяли пользователям просматривать и редактировать форматирование документа на уровне кода.

В начале 1980-х годов WordPerfect стал популярным текстовым процессором благодаря удобному интерфейсу, возможностям форматирования и поддержке различных языков. Формат WPD был основным форматом для сохранения документов, созданных в WordPerfect. 

Начало 1980-х — Plain Text (TXT)

Файлы TXT являлись продолжением ASCII и были широко использованы для хранения текстового контента без дополнительных функций форматирования. 

Каждый символ в TXT-формате хранится в виде бинарного кода.

TXT представляет собой последовательность символов без какого-либо форматирования или стилей оформления. Текстовые документы данного формата легко создавать и редактировать в различных ОС. Этим объясняется его популярность в различных областях. 

Начало 1980-х — Microsoft Word Document (DOC/DOCX)

DOC, разработанный Microsoft, является одним из наиболее популярных текстовых форматов. Его история начинается в 1980-м году с появлением программы Microsoft Word. Оригинально DOC предназначался для хранения текстовых документов, с сохранением форматирования, стилей и визуальных элементов.

Формат DOCX является частью стандарта Office Open XML, который был разработан Microsoft для хранения и обмена документами в различных офисных приложениях.

С появлением новых версий Microsoft Office, появился DOCX. Он представляет собой расширение DOC, использующее сжатие данных и XML-структуру для более эффективного хранения информации. Формат DOCX стал стандартом для версий Microsoft Word 2007 и выше.

DOC и DOCX стали неотъемлемой частью офисной работы, образования и деловой коммуникации. Эти форматы широко применяются для создания и обмена текстовыми документами, а также для коллективной работы над проектами. Они обеспечивают удобство и совместимость при обмене и редактировании документов, а также поддерживают различные возможности форматирования и стилей. DOC и DOCX остаются популярными среди пользователей в различных сферах деятельности.

Конец 1980-х — Rich Text Format (RTF)

История RTF началась в конце 1980-х годов, когда компания Microsoft создала этот формат для обеспечения обмена документами между различными приложениями и операционными системами. 

Файлы RTF в основном состоят из команд, записанных в кодах ASCII. Один файл состоит только из 7-битных символов ASCII.

Он пользуется популярностью среди пользователей, которым важно сохранить форматирование текста при обмене документами. RTF также хорошо поддерживается многими текстовыми редакторами и офисными приложениями, что делает его удобным и доступным для широкого круга пользователей.

Начало 1990-х — Hypertext Markup Language (HTML)

HTML это язык разметки, используемый для создания веб-страниц и отображения их содержимого в браузерах. История HTML началась в 1990-х годах, когда он был разработан Тимом Бернерс-Ли и его командой в рамках проекта World Wide Web (WWW) в CERN.

Первый сайт, который был создан и опубликован в интернете, назывался «info.cern.ch» и был запущен 6 августа 1991 года Тимом Бернерс-Ли в ЦЕРНе. Сайт представлял собой простую информационную страницу, содержащую описание проекта World Wide Web, ссылки на техническую документацию и инструкции по использованию.

Первая версия HTML была простой и содержала ограниченное количество тегов для структурирования текста и вставки изображений. С течением времени HTML стал основой для создания веб-страниц и веб-приложений, обеспечивая стандартизированный способ представления информации в интернете. 

С появлением новых версий HTML, таких как HTML5, стандарт продолжает развиваться, добавляя новые функции и возможности для улучшения веб-сайтов и приложений. HTML остается одним из самых важных языков программирования для веб-разработки и является основой для создания современного интернета.

Начало 1990-х — Portable Document Format (PDF)

Формат Portable Document Format (PDF) был разработан компанией Adobe Systems в начале 1990-х годов и стал одним из наиболее востребованных форматов для электронных документов. 

В 2001 году было обнаружено, что PDF-файлы могут быть переносчиками компьютерных вирусов. Там был найден червь OUTLOOK.PDFWorm.  

История PDF началась с появления программы Adobe Acrobat, которая предоставила возможность создания и просмотра документов в универсальном формате. Целью создания PDF было обеспечение удобного способа представления документов с сохранением первоначального форматирования. Формат произвел революцию в обмене документами и печати, сохранив форматирование и компоновку документов в разных системах. Несмотря на то, что Adobe Acrobat больше не работает в РФ, существуют отечественные редакторы PDF, такие как Master PDF, который предлагает техническую поддержку и знакомый интерфейс, функционально отвечающий всем требованиям российских пользователей.

С развитием технологий, Adobe продолжает совершенствовать формат PDF, добавляя новые возможности, такие как интерактивные элементы, защиту данных, поддержку мультимедийных файлов и другие. В настоящее время существует девять различных типов файлов PDF:

  1. PDF. Этот тип файлов считается стандартным форматом PDF. Он часто используется для обмена файлами и просмотра их в интернете.
  2. PDF / A. Этот тип файлов часто используется менеджерами и архивариусами, которым требуется долгосрочное хранение файлов. Он также имеет ограниченный набор функций, включая JavaScript, аудио- и видеоконтент.
  3. PDF / E. Этот формат поддерживает строительные, инженерные и производственные спецификации и часто используется в этих отраслях.
  4. PDF / X. Этот тип файлов PDF, который обычно используется графическими дизайнерами и специалистами по печати, предназначен для лучшей поддержки графики при совместном использовании и печати.
  5. PDF / VT. Этот файл похож на формат PDF / X, но имеет дополнительные возможности настройки. 
  6. PDF / UA. Этот тип формата совместим со вспомогательными технологиями, улучшая читаемость и навигацию для людей с ограниченными возможностями.
  7. PAdES. Этот тип файлов устанавливает стандарты для расширенных электронных подписей PDF. 
  8. PDF Healthcare. Этот стандарт был разработан для обеспечения наилучшей практики обработки медицинской информации и управления ею.
  9. PDF с возможностью поиска. Это стандартный PDF-файл с функцией поиска. 

PDF является идеальным выбором для документов, которые должны выглядеть одинаково на всех устройствах и операционных системах, а также для документов, которые требуют точного воспроизведения внешнего вида. 

Конец 1990-х — Extensible Markup Language (XML)

История XML началась в конце 1990-х годов, когда он был разработан Комитетом по разработке экстремального языка разметки и принят как стандарт Всемирной паутины.

XML был разработан рабочей группой из 11 человек при поддержке около 150 заинтересованных разработчиков. Члены рабочей группы никогда не встречались лицом к лицу. 

XML был создан с целью предоставить универсальный формат для обмена данных между различными системами и платформами. Он основан на принципе разметки документов с использованием тегов, что позволяет описывать структуру и содержание информации в удобочитаемой форме.

С появлением новых технологий, таких как JSON, XML стал менее популярным в некоторых областях, однако он все еще широко используется и остается важным. 

Современное развитие текстовых форматов 

Дебаты между открытыми и проприетарными форматами остаются актуальными и сегодня. Открытые форматы, такие как HTML и PDF, обеспечивают прозрачность, функциональную совместимость и долгосрочную доступность. С другой стороны, проприетарные форматы могут предоставлять расширенные функции, но могут быть ограничительными и зависеть от операционной системы. При этом существуют редакторы для разных ОС, например, Master PDF поддерживает кроссплатформенность и имеет версии для macOS, Windows и Linux.

Облачные вычисления произвели революцию в том, как мы храним данные, получаем к ним доступ и обмениваемся ими. Форматы файлов адаптировались к облачной среде. 

Microsoft Office Online и Google Docs обеспечивают совместную работу в режиме реального времени и бесшовную интеграцию со службами облачного хранения.

Искусственный интеллект также оказывает значительное влияние на развитие текстовых форматов, привнося новые возможности и улучшения в области обработки и анализа информации.

Вывод 

Рассмотренная история отражает технологические достижения и потребности пользователей в разные временные эпохи. Несмотря на разнообразие и особенности текстовых форматов, они продолжают оставаться важным инструментом для работы с текстом. История продолжается, и новые технологии будут совершенствовать способы обработки и передачи текстовых данных в цифровом мире. 

Что будем искать? Например,ChatGPT

Мы в социальных сетях