Google анонсировала генератор изображений Whisk без текстовых запросов

Компания Google из США разработала искусственный интеллект Whisk, который способен создавать изображения на основе уже существующих. Это позволяет значительно сократить объем текстовой информации, необходимой для взаимодействия с ИИ.

Whisk — это инновационный инструмент от Google Labs, который позволяет использовать изображения в качестве подсказок для ускорения творческого процесса.

Пользователи могут загрузить свои изображения, которые станут основой для создания эскизов. Также можно добавить текстовые подсказки, чтобы получить более точный результат. С помощью искусственного интеллекта можно создать эскиз, который затем можно скачать, отредактировать и дополнить. Для этого необходимо ввести текстовый запрос.

С помощью инструмента Whisk можно добавлять изображения для объекта, сцены и стиля. Затем эти изображения можно объединить, чтобы создать что-то уникальное — от цифровой плюшевой игрушки до эмалевой булавки или наклейки. Whisk автоматически создает детальные описания для ваших изображений. Затем эти описания передаются в последнюю версию модели генерации изображений от Google — Imagen 3. Этот процесс позволяет зафиксировать основную идею объекта, а не создать его точную копию. Благодаря этому можно легко изменять объекты, сцены и стили, используя новые подходы.

Поскольку Whisk анализирует изображение и выделяет в нем лишь некоторые ключевые элементы, он может создавать изображения, которые могут не соответствовать ожиданиям. Разработчики осознают, что эти элементы могут быть важными для проекта, и Whisk может не всегда точно их воспроизвести. Поэтому предоставлена возможность в любое время просматривать и редактировать основные параметры.

В процессе первых экспериментов с художниками и креативными личностями была получена обратная связь, которая позволила понять, что Whisk — это нечто большее, чем просто инструмент для редактирования изображений.

В Google считают, что Whisk лучше всего подходит для создания быстрых набросков, а не для детальной проработки. Также в компании отмечают, что искусственный интеллект может неправильно интерпретировать запрос, поэтому оставляют возможность редактировать исходные подсказки.

Что будем искать? Например,ChatGPT

Мы в социальных сетях