Попалась мне однажды на глаза замечательная колонка Ирины Матюшонок. Со времени её написания почти год прошёл и ситуация изменилась не в лучшую сторону. Боты теперь не только индексируют контент, но и сами его составляют.
Для начала позволю себе процитировать Ирину:
И пашут в три смены рекламные и новостные агентства, аналитические фирмы, онлайн-издания, IT-предприятия, сисадмины и серверы, журналисты и ноутбуки… лишь бы смилостивился поисковый владыка. Контента больше, больше контента! Больше эмоций, больше негативно окрашенных понятий, больше интриги, компенсируй качество слова количеством порнознаков! Даёшь ежедневную ротацию! Даёшь ежечасную ротацию! Даёшь десять тысяч кликов в час! Даёшь стране круглосуточного
угля… мля-млябла-бла! Слуги ботьи не спят, ибо не смыкает очей господин их! Он один знает всё, он один всё читает, всё видит, всё слышит (!) — ведь такое количествомусораинформации не в состоянии освоить даже трижды по тридцать миллиардов смертных пользователей Веба!
Если мы публикуем контент для роботов, то следующим логичным шагом будет автоматизация его изготовления. Причины тому чисто экономические — массовое машинное производство обходится дешевле. Нечто подобное происходило на заре промышленной революции, когда начали появляться первые мануфактуры.
Заменить автора машиной до сих пор никто не пытался. Эта светлая идея пришла в голову американцам (кто бы сомневался). По сообщению Национального общественного радио, компьютерная программа Narrative Science написала отчёт о бейсбольном матче лучше, чем спортивный комментатор. Вывод о сравнительном качестве текста был сделан на том основании, что программа упомянула рекордное достижение одного из игроков в первом абзаце, тогда как журналист — только во втором. Дескать, по всем репортёрским канонам решение компьютера более правильно.
И бог с ней, с программой: ну сформировала она отчёт на основании анализа статистических данных, что в этом такого? Допустим, даже лучшего качества (хотя и не факт — критерий оценки, мягко говоря, сомнителен). Всё это мероприятие — не более чем рекламная акция проекта: разработчики Narrative Science намерены поставлять подобные материалы спортивным изданиям, а в будущем они планируют расширить тематику автоматически сгенерированного контента.
Может ли это получиться? А почему нет? В журналистике есть немало поддающихся формализации направлений. Например, обзоры гаджетов по предоставленным технарями параметрам машина сможет писать не хуже некоторых «аналитиков всея Рунета». Матёрых акул пера компьютер не заменит, но дятлам клавиатуры он составит мощную конкуренцию. А дальше… кто знает?
Когда-то мы считали, что программа не выиграет шахматную партию у чемпиона мира. Или, скажем, не победит человека в викторине, где вопросы формулируются на естественном языке. По законам жанра (их теперь нарушать нельзя, а то придёшь в редакцию — а вместо тебя заметки ноутбук пишет) я должен высказать свою точку зрения на происходящее. Попробуем решить, хорошо это или плохо.
Журналистам можно сказать: мол, пишите лучше, и никакая машина не лишит вас работы. Это с одной стороны. А с другой, мы уже не только публикуем контент для поисковых систем, но и автоматически (в перспективе) его генерируем. И где, простите, в этой цепочке место homo, который (что сомнительно) sapiens? Со временем эта умная мысль может прийти в набитые полупроводниковыми элементами головы тружеников новых «мануфактур».