Menu

Как сформулировать запрос к Fooocus?

Давайте сделаем значительный шаг в области профессиональной генерации изображений, сосредоточив внимание на контроле результатов генерации и формулировании эффективных запросов для нейросети.

Внимание! Эта методика подходит в первую очередь для генерации декоративных изображений!

Установка и функциональность Fooocus

Предполагается, что мы уже установили Fooocus, доступный как для Windows, так и для Mac. Этот инструмент, основанный на архитектуре Stable Diffusion XL, предоставляет пользователям мощные возможности для создания высококачественных изображений с помощью текстовых запросов. В отличие от облачных сервисов, таких как Midjourney или DALL-E, Fooocus функционирует локально, что устраняет задержки и необходимость подписки.

Структурирование запросов

Теперь мы сосредоточимся на создании грамотных запросов для нейросетей. Структурированные запросы улучшают ясность и точность запросов, что в свою очередь повышает качество генерируемых изображений. Чем более детализированным будет описание в запросе, тем выше вероятность получения желаемого результата. Например, вместо общего запроса "пейзаж" следует использовать более конкретные формулировки, такие как "городской пейзаж с закатом" или "фантастический дракон, летящий над горами". Никогда не жалейте сил и времени на составление подробного запроса.

Значение структурирования запросов

Ясность выражения идеи

Структурирование запросов способствует более четкому и однозначному выражению концепций, которые необходимо донести до нейросети. Это позволяет минимизировать возможные интерпретации и повышает точность обработки информации.

Упрощение доработки

Кроме того, наличие четкой структуры облегчает последующую модификацию запросов. Понимание организационных принципов позволит пользователю быстро ориентироваться в содержании и вносить необходимые изменения без значительных затрат времени.

Сравнение со структурированным кодом

Структурированные запросы можно сопоставить с хорошо организованным кодом, используемым программистами. Такой подход обеспечивает легкость передачи информации другим пользователям, что исключает путаницу и недоразумения. Это, в свою очередь, способствует эффективному обмену запросами, экономя время и усилия участников процесса.

Язык запросов

Я предпочитаю формулировать запросов для нейросети на английском языке, хотя Fooocus также поддерживает ввод запросов на русском (и других языках), но качество перевода оставляет желать лучшего. В дальнейшем все примеры будут приведены на английском, чтобы обеспечить максимальную совместимость с инструментом.

Интерфейс ввода запроса

fooocus styles

В интерфейсе Fooocus ввод запроса осуществляется в определенном поле. Для удобства напомним, что это поле выглядит так, как на иллюстрации. Прежде чем перейти к созданию запросов, рекомендуется отключить все стили, предлагаемые Fooocus. Для этого необходимо:

  1. Установить галочку «Advanced».
  2. Перейти во вкладку «Styles».
  3. Снять все галочки со стилей Fooocus.

Зачем отключать стили?

Отключение предустановленных стилей в Fooocus позволяет сосредоточиться на разработке собственных уникальных стилей, что является важным шагом в освоении генерации изображений. Это дает возможность пользователю экспериментировать с различными аспектами визуализации и развивать свои навыки. Самое главное: теперь вся власть всё управление сосредоточено в наших руках.

Основная структура запроса

Хотя запросы могут быть достаточно сложными, большинство запросов для модели SDXL лучше всего работают при использовании простой структуры:

[Стиль], [Предмет], [Окружение], [Действие]
Рассмотрим каждую из составляющих этой формулы:
  • Стиль: Определяет визуальную эстетику изображения (например, реализм, абстракция, импрессионизм).
  • Предмет: Указывает основной объект или тему изображения (например, портрет человека, животное, пейзаж).
  • Окружение: Описывает фон или контекст, в котором находится предмет (например, городской пейзаж, лес, космос).
  • Действие: Определяет динамику или активность в изображении (например: эльфийка, прыгающая через ручей ; птица, летящая над озером).

Применение структуры

При добавлении каждой новой составляющей в запрос наблюдается изменение общего направления и акцентов изображения. Это позволяет пользователю более точно формулировать свои идеи и получать результаты, соответствующие ожиданиям.

Выбор стиля для генерации изображений

В контексте генерации изображений с использованием искусственного интеллекта важно выбрать основной стиль, который будет определять визуальное направление вашего произведения. Стиль может включать в себя различные направления в искусстве, такие как реалистичные фотографии, иллюстрации, 3D-графика и другие.

Пример стиля

В качестве примера рассмотрим иллюстрацию в стиле "иллюстрация для детской книги". Запрос для генерации может выглядеть следующим образом:

Decorative flat Style for children illustration

Используя данный запрос, можно получить изображения, отражающие эстетику и особенности этого художественного направления.

Fooocus Style Fooocus Style

Основной объект

После выбора стиля необходимо определить основной объект, который станет центральным элементом изображения. Объектов может быть несколько. Например, можно расширить запрос, добавив кролика в шлапе бакалавра:


Decorative flat Style for children illustration, a little rabbit with square academic cap

Fooocus Style

Окружение

Окружение объекта также играет важную роль в создании атмосферы изображения. Оно может быть как простым (например, "чистый белый фон"), так и сложным. Для создания более динамичного фона можно использовать запрос:

 

Decorative flat Style for children illustration, a little rabbit with square academic cap, sitting inside a huge university library

Действие

Выбор действия для объекта завершает формирование запроса. Если объект не выполняет никаких действий (например, абстрактный логотип), то этот элемент можно опустить. Однако для более выразительного изображения можно добавить действие:

Decorative flat Style for children illustration, a little rabbit with square academic cap, sitting inside a huge university library, a dragonfly is flying in the foreground 

Fooocus Style Fooocus Style

Итоги

Создание эффективных запросов — это сложная задача для нейросетей. Однако с помощью нескольких итераций можно достичь желаемых результатов. Все перечисленные элементы являются позитивными запросами, которые указывают модели на необходимое направление генерации. Правильное структурирование запросов позволяет значительно улучшить качество итоговых изображений и повысить их соответствие ожиданиям пользователя.

Негативные запросы в генерации изображений

Определение негативных запросов

Негативные или отрицательные запросы предназначены для указания нейросети на то, чего следует избегать при генерации изображений. Эти запросы помогают минимизировать нежелательные результаты и обеспечивают более точное соответствие ожиданиям пользователя.

Пример использования негативных запросов

Например, если вы хотите избежать фотореализма и цветной шляпы у кролика, вы можете использовать следующую формулировку:

blue cap, green cap, photorealism

В этом случае сначала укажите общую стилистику, а затем опишите объект. Для добавления негативных запросов в интерфейсе Fooocus необходимо:

  1. Установить галочку «Advanced».
  2. Перейти во вкладку «Settings».
  3. Ввести отрицательные запросы в поле «Negative Prompts».

Должно получиться что-то вроде:

Fooocus Style Fooocus Style

Результаты использования негативных запросов

В результате применения негативных запросов можно добиться того, что в сгенерированных изображениях, как минимум, не будут присутствовать желтые глаза у котов, что улучшает общее качество визуализации.

Мгновенное расширение запроса

Функция автоматического добавления токенов

В Fooocus существует функция, называемая «волшебной кнопкой», которая значительно улучшает ваше изображение путем добавления дополнительных токенов в базовый запрос. Эта функция автоматически включает слова, которые повышают качество генерируемых изображений. Стиль «Fooocus V2» использует искусственный интеллект (GPT-2) для адаптивного добавления токенов, что делает изображения более привлекательными. Вы можете найти настройки стилей, следуя ранее указанным инструкциям.

Пример работы стиля Fooocus V2

При запуске генерации в консоли вы можете увидеть запросы, созданные с помощью «Fooocus V2». Эти дополненные тексты (выделенные зеленым) отличаются от ваших базовых запросов. В большинстве случаев не стоит беспокоиться о том, что сгенерированные ключевые слова могут повлиять на ваши основные запросы.

Заключение

Fooocus является весьма гибкой информационной системой для генерации изображений. Интерфейс преображается от минималистично-простого до невероятно подробного.

Более того, можно использовать строго собственную стилистику, а можно воспользоваться предопределенными стилями, включая дополнение запросов в Fooocus V2. Эта функция является секретным ингредиентом, который делает Fooocus простым в освоении и позволяет даже начинающим пользователям достигать результатов, сопоставимых с теми, что предлагает Midjourney, а иногда даже превосходящих их.

Авторизуйтесь, чтобы получить возможность оставлять комментарии

Другие материалы в этой категории:

Go to top