Компания Google из США разработала искусственный интеллект Whisk, который способен создавать изображения на основе уже существующих. Это позволяет значительно сократить объем текстовой информации, необходимой для взаимодействия с ИИ.
Whisk — это инновационный инструмент от Google Labs, который позволяет использовать изображения в качестве подсказок для ускорения творческого процесса.
Пользователи могут загрузить свои изображения, которые станут основой для создания эскизов. Также можно добавить текстовые подсказки, чтобы получить более точный результат. С помощью искусственного интеллекта можно создать эскиз, который затем можно скачать, отредактировать и дополнить. Для этого необходимо ввести текстовый запрос.
С помощью инструмента Whisk можно добавлять изображения для объекта, сцены и стиля. Затем эти изображения можно объединить, чтобы создать что-то уникальное — от цифровой плюшевой игрушки до эмалевой булавки или наклейки. Whisk автоматически создает детальные описания для ваших изображений. Затем эти описания передаются в последнюю версию модели генерации изображений от Google — Imagen 3. Этот процесс позволяет зафиксировать основную идею объекта, а не создать его точную копию. Благодаря этому можно легко изменять объекты, сцены и стили, используя новые подходы.
Поскольку Whisk анализирует изображение и выделяет в нем лишь некоторые ключевые элементы, он может создавать изображения, которые могут не соответствовать ожиданиям. Разработчики осознают, что эти элементы могут быть важными для проекта, и Whisk может не всегда точно их воспроизвести. Поэтому предоставлена возможность в любое время просматривать и редактировать основные параметры.
В процессе первых экспериментов с художниками и креативными личностями была получена обратная связь, которая позволила понять, что Whisk — это нечто большее, чем просто инструмент для редактирования изображений.
В Google считают, что Whisk лучше всего подходит для создания быстрых набросков, а не для детальной проработки. Также в компании отмечают, что искусственный интеллект может неправильно интерпретировать запрос, поэтому оставляют возможность редактировать исходные подсказки.