25 октября на нью-йоркском аукционе Christie’s произошло знаменательное событие: там впервые была продана работа, созданная искусственным интеллектом. При первоначальной оценке в $7000-$10 000, ее продажная цена составила $432 000, пишет Forbes. Работа была создана трио 25-летних французских студентов Obvious. За последний год они сделали серию портретов, изображающих членов вымышленной семьи Белами. Можно было бы сказать, что портрет Эдмонда Белами стал вершиной их творчества, однако творили не они, а программный код, — к тому же созданный не ими.
Автор кода — 19-летний Робби Баррат, студент Стэнфордского университета. Когда Баррату было 17 лет, он начал экспериментировать с искусственным интеллектом. Сначала он обучил компьютер писать рэп, загрузив в него 6000 строк из композиций Канье Уэста, а потом пошел дальше и загрузил в программу несколько тысяч изображений из Интернета, чтобы научить ее рисовать. Свой код он загрузил на GitHub. Так нейросеть, которой и воспользовались Obvious, оказалась в открытом доступе.
Нейронная сеть чаще всего применяется для распознавания образов: на вход подается некоторая неструктурированная информация, например, изображения, звук или текст, а на выходе мы хотим получить некоторый семантический вывод. Например, для изображения это может быть информация о находящихся на нем объектах. Однако нейронная сеть может также использоваться и для генерации новых данных, — такие сети называются генеративными.
Подобные сети на вход могут получать некоторый набор случайных значений, а задача сети — сгенерировать выход, который будет похож на реальное изображение, например, лицо человека. Obvious, к примеру, показали нейросети 15 000 портретов, написанных между XIV и XX веками — этим и объясняется своеобразный стиль картины, созданной компьютером.
Основная идея заключается в том, чтобы тренировать сеть на поиск шаблонов в определенном наборе данных. Обнаружив общие черты, которые присущи всем предложенным объектам, программа-генератор на их основе создает свой вариант компиляции. Затем вторая сеть — дискриминатор — оценивает ее работу, и если она может определить разницу между оригиналами и новым образцом, то отправляет изделие на доработку. Первая сеть (генератор) модифицирует свои данные и пытается снова провести их через дискриминатор, повторяя это до тех пор, пока вторая сеть не перестанет отличать подделку от оригинала.
Эта концепция сетей оказалась чрезвычайно мощным инструментом машинного обучения. Благодаря ему сети знают, как копировать основные визуальные шаблоны, но они не имеют ни малейшего представления, как они сочетаются друг с другом. На выходе мы получаем изображения, в которых границы нечеткие и фигуры перетекают друг в друга.
Но технология развивается, и сфера применения становится все шире. Важную роль в этом сыграли глубокие нейронные сети. Сегодня мы наблюдаем, как эти «трендовые» технологии начинают менять индустрию моды.
Пример успешного применения технологии в этой сфере — проект Алехандро Джакометти из компании EDITED, занимающейся аналитикой для ритейла. В ходе эксперимента он проводил распознавание тысяч изображений с подиумов весеннего показа Лондонской недели моды в 2017 году, что позволило выделять на фото изображение отдельных деталей одежды.
Для этого использовалась система из двух нейронных сетей: первая подсеть формировала уникальное представление входного изображения в виде набора вещественных чисел, а вторая восстанавливала из него исходное изображение. В процессе обучения параметры этих подсетей подбирались так, чтобы полученная картинка была максимально похожа на оригинал. Таким образом, первая подсеть смогла научиться получать компактную информацию из визуального образа одежды, которую стало возможно анализировать — например, оценивать похожесть двух нарядов между собой. Вторая подсеть дала возможность создать «цифровую модель» нарядов, описав десятки параметров каждого.
Когда исследователи накопили достаточно данных, то смогли научить компьютер отличать модели одного дизайнера от других, находить характерные элементы стиля. Более того, стало возможно предсказывать появление новых коллекций, предугадывать потребительский спрос.
Имея некоторую семантическую информацию для изображений одежды — например, ее стиль и материалы — можно обучить модель предсказывать их по неразмеченным базам фотографий и таким образом оценивать, как менялась мода в разное время.
Другой пример — когда технологии ИИ успешно сотрудничают с «живыми» представителями модных брендов. Один из примеров — гибридный подход, который использует американская компания Stitch Fix. Искусственный интеллект анализирует модные тренды вместе с дизайнерами компании и выдает рекомендации. В результате время создания новых моделей существенно сокращается. Кроме того, такой подход становится маркетинговой фишкой, что помогает компании выделиться на фоне конкурентов и привлечь внимание потребителей. Сейчас уже несколько десятков моделей одежды, разработанных при помощи разных видов искусственного интеллекта, успешно продаются в магазинах.