Американская корпорация Google представила нейросеть под названием Whisk, способную генерировать изображения на основе загруженных пользователями изображений. Этот инструмент обещает существенно снизить необходимость в текстовых формулировках при взаимодействии с искусственным интеллектом, предоставляя новым и креативным возможностям удобный способ формирования визуального контента.
Whisk предложит пользователям возможность загружать их собственные изображения, которые могут служить основой для создания эскизов. Пользователи также смогут добавлять текстовые подсказки для уточнения своих запросов. После генерации иконографического материала, результат можно будет скачать, отредактировать и дополнить, используя текстовые команды.
Инструмент ориентирован на создание быстрых эскизов, а не на детализированное редактирование. Как заявляет компания, Whisk лучше всего подходит для генерации простых набросков и создания уникальных визуальных решений. Однако разработчики осознают, что искусственный интеллект может ошибочно интерпретировать запросы, что может повлиять на финальный результат. Поэтому предусмотрена возможность редактирования начальных подсказок в процессе работы.
Whisk позволяет пользователям комбинировать изображения для обозначения объекта, сцены и стиля, что открывает новые горизонты для создания визуального контента — от ярких наклеек до технологичных эмалевых булавок. Исходящие из загруженных изображений описания передаются в последнюю версию модели генерации изображений от Google — Imagen 3, что позволяет фиксировать главные концептуальные идеи без необходимости создавать их точные копии.
Обратная связь, полученная в ходе первых экспериментов с художниками и креативщиками, показала, что Whisk выходит за рамки обычного редактирования изображений. Google признает, что при стремлении к быстроте разработки ИИ-инструментов могут пострадать их качество и точность. Несмотря на это, разработчики продолжают работать над улучшением функционала, чтобы пользователи могли эффективно использовать все возможности новой нейросети.
Таким образом, Google запускает Whisk как ориентированный на творчество инструмент, который может значительно упростить и ускорить процесс генерации изображений, не теряя при этом возможность редактирования и доработки результата. С учетом вышеописанных функций и потенциального воздействия на креативную сферу, этот инструмент может стать важным шагом в эволюции взаимодействия человека с искусственным интеллектом.
