Просто про AI
← До списку статей

Мистецтво негативного промпту

📄

У генеративному мистецтві позитивний промпт визначає траєкторію руху, тоді як негативний промпт виступає в ролі обмежувальних бар'єрів. Це механізм «віднімання» ймовірностей появи певних піксельних структур. Якщо позитивний запит вказує нейромережі, куди йти, то негативний – куди заходити категорично заборонено.

Математика заперечення: як це працює під капотом

Більшість сучасних моделей (Midjourney, Stable Diffusion, DALL-E 3) використовують метод Classifier-Free Guidance (CFG). Під час генерації модель створює два вектори: один на основі вашого запиту, інший – порожній (або з негативним запитом). Потім вона обчислює математичну різницю між ними.

Коли ви вводите параметр --no text, ви буквально змушуєте модель зміщувати передбачення кожного наступного пікселя в бік, протилежний від візуальних ознак, що класифікуються як «текст».

Структуризація негативного запиту: класифікація «сміття»

Щоб негативний промпт не перетворювався на хаотичний набір слів, його варто розділити на три функціональні шари:

Технічні дефекти (Technical Artifacts)

Це базовий шар, який бореться з недоліками самої моделі або низькою якістю тренувальних даних:

  • low resolution, grainy, blurry, pixelated, jpeg artifacts – боротьба за чіткість.
  • out of frame, cropped, cut off – запобігання обрізанню головного об'єкта краєм кадру.
  • low quality, normal quality, worst quality – тригери для відсікання «сміттєвих» шарів моделі.

Анатомічні та геометричні помилки (Anatomy & Geometry)

Найскладніший блок для генерації людей або складних механізмів:

  • extra fingers, mutated hands, poorly drawn hands, malformed limbs – корекція кінцівок.
  • missing arms, extra legs, fused fingers, too many fingers – уточнення структури тіла.
  • disfigured, deformed, body out of proportion – підтримка загальної анатомічної цілісності.

Комерційне та візуальне сміття (Visual Noise)

Те, що заважає стоковому фото виглядати професійно:

  • text, watermark, signature, logo, copyright, username – критично для комерційного використання.
  • ugly, tiling, monochrome, grayscale – якщо потрібен кольоровий та естетичний результат.
  • clutter, messy, busy background – для отримання чистих ізолятів або мінімалістичних композицій.

Специфіка синтаксису: Midjourney vs Stable Diffusion

Механіка негативного промпту суттєво відрізняється залежно від інструменту.

Midjourney (Параметр --no)

В MJ негативний промпт додається в кінці через параметр. Модель сприймає слова після нього як цілісні поняття.

  • Помилка: --no red apple (модель може прибрати і червоний колір, і яблуко взагалі).
  • Правильно: --no red (якщо треба залишити яблуко іншого кольору).
  • Ваги: Можна використовувати синтаксис word::-0.5 для тонкого налаштування, але параметр --no автоматично застосовує від’ємну вагу.

Stable Diffusion (Negative Prompt Field)

Тут використання дужок та коефіцієнтів дозволяє точно дозувати «силу заперечення»:

  • (text:1.3) – посилення ігнорування тексту.
  • [watermark] – послаблення впливу токена.
  • Embeddings: Замість списку з 50 слів професіонали використовують навчені вектори на кшталт EasyNegative, які вже містять тисячі прикладів «поганих» зображень.

Стратегія «Чистого кадру» для стокового фотографа

Для створення контенту, який гарантовано пройде модерацію на Adobe Stock або Shutterstock, негативний промпт має бути агресивним у плані артефактів, але обережним у плані стилістики.

Типовий набір для стокового ізоляту (Commercial Clean):

--no text, watermark, logo, signature, blurry, grainy, low-res, distorted, out of focus, messy background, shadows (якщо потрібен чистий flat lay).

Важливо: Кожне слово в промпті займає частину загального «об'єму» уваги моделі. Якщо вписати 100 слів у негатив, модель може почати ігнорувати позитивний запит або створювати дивні візуальні аберації через занадто вузький коридор можливостей.

Коли негативний промпт не працює

Бувають випадки, коли заперечення лише погіршує ситуацію. Це стається через «ефект рожевого слона». Якщо ви кажете моделі «не думай про рожевого слона», вона спочатку має активувати цей концепт, щоб потім спробувати його відняти.

  • Проблема: Ви пишете --no sunglasses, але окуляри все одно з'являються.
  • Причина: Об'єкт занадто сильно асоціюється з контекстом (наприклад, «пляж, сонце»).
  • Рішення: Замість негативного промпту змініть позитивний. Додайте деталі, які несумісні з окулярами (наприклад, reading books close up).

6. Висновки

Робота з негативними промптами – це ітеративний процес. Для професійної роботи зі стоками ідеальним є підхід «базового пресету», який закриває 90% технічних дефектів, залишаючи простір для творчого маневру в позитивному запиті.

Чек-лист перед генерацією:

  1. Чи немає в негативі слів, які конфліктують з об'єктом (наприклад, --no dark для нічної сцени)?
  2. Чи використовуються технічні терміни (low-res), чи лише абстрактні прикметники?
  3. Чи не перевантажений список? Оптимальна кількість – до 15 ключових понять.