📖Słownik

Skala CFG (Skala Kierowania) - Wyjaśnienie Parametru Generowania Obrazów AI

Zrozum Skala CFG (Classifier-Free Guidance) - kluczowy parametr kontrolujący, jak ściśle AI podąża za twoimi wskazówkami podczas generowania obrazów.

Czym jest Skala CFG?

Skala CFG (Classifier-Free Guidance Scale), znana także jako Skala Kierowania, to parametr kontrolujący, jak ściśle AI podąża za tekstowym promptem podczas generowania obrazów. Zasadniczo określa równowagę między kreatywnością a zgodnością z promptem.

Jak działa Skala CFG?

Koncepcja techniczna

Podczas generowania obrazu AI bierze pod uwagę:

  • Wynik uwarunkowany: Co model generuje na podstawie twojego promptu
  • Wynik nieuwarunkowany: Co by generował bez wskazówek

Skala CFG określa, jak bardzo należy podkreślić wynik uwarunkowany (zgodny z promptem) nad nieuwarunkowanym.

Formuła

Uproszczona: Final = Unconditioned + CFG × (Conditioned - Unconditioned)

Wyższe CFG = Większy wpływ twojego promptu

Wartości Skali CFG

Niskie CFG (1-5)

Charakterystyka:

  • Bardziej kreatywne/losowe wyniki
  • Softer, senne obrazy
  • Luźna interpretacja promptu
  • Bardziej zróżnicowane wyniki
  • Może wydawać się nieostre

Najlepsze dla: Abstrakcyjna sztuka, eksperymentalne prace, miękkie estetyki

Średnie CFG (6-10)

Charakterystyka:

  • Zrównoważona kreatywność i zgodność
  • Naturalnie wyglądające wyniki
  • Dobra zgodność z promptem
  • Najczęściej używany zakres

Najlepsze dla: Większość ogólnych zastosowań, zalecany punkt wyjściowy

Wysokie CFG (11-20)

Charakterystyka:

  • Ścisła zgodność z promptem
  • Więcej kontrastu i nasycenia
  • Może wydawać się surowe lub sztuczne
  • Mniej kreatywnej różnorodności

Najlepsze dla: Specyficzne wymagania, techniczna dokładność

Bardzo wysokie CFG (20+)

Charakterystyka:

  • Ekstremalna zgodność z promptem
  • Często generuje artefakty
  • Nadmiernie nasycone kolory
  • Zniekształcone detale

Ogólnie niezalecane

Przykłady wizualne

Wartość CFGZgodność z promptemJakość obrazuKreatywność
3NiskaSofte/SennieWysoka
7ŚredniaZrównoważonaŚrednia
12WysokaOstro/KontrastowoNiska
20Bardzo WysokaCzęsto z ArtefaktamiBardzo Niska

Zalecane ustawienia w zależności od zastosowania

Obrazy fotorealistyczne

  • CFG 5-8
  • Naturalne, wiarygodne wyniki
  • Unika sztucznego wyglądu

Prace artystyczne/stylizowane

  • CFG 7-10
  • Dobra zgodność ze stylem
  • Utrzymuje artystyczną spójność

Dokładność określonego tematu

  • CFG 8-12
  • Kiedy ważne jest ścisłe dopasowanie do promptu
  • Ilustracje techniczne

Abstrakcyjne/Kreatywne

  • CFG 3-6
  • Więcej pożądanej losowości
  • Praca eksperymentalna

Skala CFG + inne parametry

Interakcja z krokami

  • Wyższe CFG często korzysta z większej liczby kroków
  • Niskie kroki + wysokie CFG = artefakty
  • Zrównoważ oba parametry razem

Interakcja z samplerem

  • Różne samplery reagują różnie na CFG
  • Niektóre samplery preferują niższe CFG
  • Eksperymentuj z kombinacjami

Preferencje specyficzne dla modelu

  • Różne modele mają optymalne zakresy CFG
  • Modele Flux: Często 3-7
  • Stable Diffusion: Często 7-11
  • Sprawdź dokumentację modelu

Rozwiązywanie problemów z CFG

Obrazy zbyt miękkie/rozmyte

  • Zwiększ CFG (spróbuj +2-3)
  • Dodaj bardziej szczegółowy prompt
  • Zwiększ ilość kroków

Obrazy zbyt surowe/sztuczne

  • Zmniejsz CFG (spróbuj -2-3)
  • Użyj łagodniejszego języka promptu
  • Spróbuj inny sampler

Artefakty i zniekształcenia

  • CFG prawdopodobnie zbyt wysokie
  • Zredukuj do zakresu 7-10
  • Zwiększ kroki

Prompt jest ignorowany

  • CFG może być zbyt niskie
  • Zwiększ do zakresu 7-10
  • Sprawdź formatowanie promptu

Skala CFG na różnych platformach

Warianty nazewnictwa

To samo pojęcie ma różne nazwy:

  • Skala CFG - Stable Diffusion
  • Skala Kierowania - Ogólny termin
  • Kierowanie - Niektóre platformy
  • Kierowanie Prompm - Pojęcie przyjazne użytkownikom

Domyślne wartości

Popularne wartości domyślne na różnych platformach:

  • Stable Diffusion: 7-7.5
  • DALL-E: Nie podlega dostosowaniu przez użytkownika
  • Midjourney: Parametr Stylize (powiązane pojęcie)

Porady profesjonalne

Znajdowanie własnego "słodkiego punktu"

  1. Zacznij od domyślnej wartości (zwykle 7)
  2. Generuj obrazy testowe
  3. Dostosuj o 2 punkty w górę lub w dół
  4. Porównaj wyniki
  5. Zanotuj, co działa w twoim stylu

Zalecenia specyficzne dla stylu

  • Portrety: 6-8 dla naturalnego wyglądu
  • Krajobrazy: 7-9 dla szczegółowości
  • Anime: 7-10 dla zgodności ze stylem
  • Abstrakcja: 3-6 dla kreatywności

Strategia generowania masowego

  • Generuj ten sam prompt przy różnych wartościach CFG
  • Porównaj wyniki obok siebie
  • Zidentyfikuj optymalny zakres dla twojego przypadku użycia

Najczęstsze nieporozumienia

"Im wyżej, tym lepiej"

Fałsz - Wyższe CFG nie oznacza lepszych obrazów. Oznacza ścisłą zgodność, co często daje gorsze wyniki wizualne.

"Jedna wielkość pasuje do wszystkich"

Fałsz - Optymalne CFG różni się w zależności od modelu, promptu i pożądanego stylu wyjściowego.

"CFG zwiększa szczegóły"

Częściowo fałsz - CFG wpływa na zgodność z promptem, nie na poziom szczegółów. Szczegóły są zależne od rozdzielczości, kroków i modelu.

Podsumowanie

Skala CFG jest podstawowym parametrem w generowaniu obrazów AI:

  • Niskie (1-5): Kreatywne, miękkie, luźna interpretacja
  • Średnie (6-10): Zrównoważone, zalecane do większości zastosowań
  • Wysokie (11-15): Ścisła zgodność, potencjalnie surowe
  • Bardzo wysokie (16+): Zwykle powoduje artefakty

Zacznij od domyślnej, a następnie dostosuj w zależności od swoich potrzeb i używanego modelu.

TAGI

Powiązane Artykuły

Powrót do Bazy Wiedzy