Czym jest Skala CFG?
Skala CFG (Classifier-Free Guidance Scale), znana także jako Skala Kierowania, to parametr kontrolujący, jak ściśle AI podąża za tekstowym promptem podczas generowania obrazów. Zasadniczo określa równowagę między kreatywnością a zgodnością z promptem.
Jak działa Skala CFG?
Koncepcja techniczna
Podczas generowania obrazu AI bierze pod uwagę:
- Wynik uwarunkowany: Co model generuje na podstawie twojego promptu
- Wynik nieuwarunkowany: Co by generował bez wskazówek
Skala CFG określa, jak bardzo należy podkreślić wynik uwarunkowany (zgodny z promptem) nad nieuwarunkowanym.
Formuła
Uproszczona: Final = Unconditioned + CFG × (Conditioned - Unconditioned)
Wyższe CFG = Większy wpływ twojego promptu
Wartości Skali CFG
Niskie CFG (1-5)
Charakterystyka:
- Bardziej kreatywne/losowe wyniki
- Softer, senne obrazy
- Luźna interpretacja promptu
- Bardziej zróżnicowane wyniki
- Może wydawać się nieostre
Najlepsze dla: Abstrakcyjna sztuka, eksperymentalne prace, miękkie estetyki
Średnie CFG (6-10)
Charakterystyka:
- Zrównoważona kreatywność i zgodność
- Naturalnie wyglądające wyniki
- Dobra zgodność z promptem
- Najczęściej używany zakres
Najlepsze dla: Większość ogólnych zastosowań, zalecany punkt wyjściowy
Wysokie CFG (11-20)
Charakterystyka:
- Ścisła zgodność z promptem
- Więcej kontrastu i nasycenia
- Może wydawać się surowe lub sztuczne
- Mniej kreatywnej różnorodności
Najlepsze dla: Specyficzne wymagania, techniczna dokładność
Bardzo wysokie CFG (20+)
Charakterystyka:
- Ekstremalna zgodność z promptem
- Często generuje artefakty
- Nadmiernie nasycone kolory
- Zniekształcone detale
Ogólnie niezalecane
Przykłady wizualne
| Wartość CFG | Zgodność z promptem | Jakość obrazu | Kreatywność |
|---|---|---|---|
| 3 | Niska | Softe/Sennie | Wysoka |
| 7 | Średnia | Zrównoważona | Średnia |
| 12 | Wysoka | Ostro/Kontrastowo | Niska |
| 20 | Bardzo Wysoka | Często z Artefaktami | Bardzo Niska |
Zalecane ustawienia w zależności od zastosowania
Obrazy fotorealistyczne
- CFG 5-8
- Naturalne, wiarygodne wyniki
- Unika sztucznego wyglądu
Prace artystyczne/stylizowane
- CFG 7-10
- Dobra zgodność ze stylem
- Utrzymuje artystyczną spójność
Dokładność określonego tematu
- CFG 8-12
- Kiedy ważne jest ścisłe dopasowanie do promptu
- Ilustracje techniczne
Abstrakcyjne/Kreatywne
- CFG 3-6
- Więcej pożądanej losowości
- Praca eksperymentalna
Skala CFG + inne parametry
Interakcja z krokami
- Wyższe CFG często korzysta z większej liczby kroków
- Niskie kroki + wysokie CFG = artefakty
- Zrównoważ oba parametry razem
Interakcja z samplerem
- Różne samplery reagują różnie na CFG
- Niektóre samplery preferują niższe CFG
- Eksperymentuj z kombinacjami
Preferencje specyficzne dla modelu
- Różne modele mają optymalne zakresy CFG
- Modele Flux: Często 3-7
- Stable Diffusion: Często 7-11
- Sprawdź dokumentację modelu
Rozwiązywanie problemów z CFG
Obrazy zbyt miękkie/rozmyte
- Zwiększ CFG (spróbuj +2-3)
- Dodaj bardziej szczegółowy prompt
- Zwiększ ilość kroków
Obrazy zbyt surowe/sztuczne
- Zmniejsz CFG (spróbuj -2-3)
- Użyj łagodniejszego języka promptu
- Spróbuj inny sampler
Artefakty i zniekształcenia
- CFG prawdopodobnie zbyt wysokie
- Zredukuj do zakresu 7-10
- Zwiększ kroki
Prompt jest ignorowany
- CFG może być zbyt niskie
- Zwiększ do zakresu 7-10
- Sprawdź formatowanie promptu
Skala CFG na różnych platformach
Warianty nazewnictwa
To samo pojęcie ma różne nazwy:
- Skala CFG - Stable Diffusion
- Skala Kierowania - Ogólny termin
- Kierowanie - Niektóre platformy
- Kierowanie Prompm - Pojęcie przyjazne użytkownikom
Domyślne wartości
Popularne wartości domyślne na różnych platformach:
- Stable Diffusion: 7-7.5
- DALL-E: Nie podlega dostosowaniu przez użytkownika
- Midjourney: Parametr Stylize (powiązane pojęcie)
Porady profesjonalne
Znajdowanie własnego "słodkiego punktu"
- Zacznij od domyślnej wartości (zwykle 7)
- Generuj obrazy testowe
- Dostosuj o 2 punkty w górę lub w dół
- Porównaj wyniki
- Zanotuj, co działa w twoim stylu
Zalecenia specyficzne dla stylu
- Portrety: 6-8 dla naturalnego wyglądu
- Krajobrazy: 7-9 dla szczegółowości
- Anime: 7-10 dla zgodności ze stylem
- Abstrakcja: 3-6 dla kreatywności
Strategia generowania masowego
- Generuj ten sam prompt przy różnych wartościach CFG
- Porównaj wyniki obok siebie
- Zidentyfikuj optymalny zakres dla twojego przypadku użycia
Najczęstsze nieporozumienia
"Im wyżej, tym lepiej"
Fałsz - Wyższe CFG nie oznacza lepszych obrazów. Oznacza ścisłą zgodność, co często daje gorsze wyniki wizualne.
"Jedna wielkość pasuje do wszystkich"
Fałsz - Optymalne CFG różni się w zależności od modelu, promptu i pożądanego stylu wyjściowego.
"CFG zwiększa szczegóły"
Częściowo fałsz - CFG wpływa na zgodność z promptem, nie na poziom szczegółów. Szczegóły są zależne od rozdzielczości, kroków i modelu.
Podsumowanie
Skala CFG jest podstawowym parametrem w generowaniu obrazów AI:
- Niskie (1-5): Kreatywne, miękkie, luźna interpretacja
- Średnie (6-10): Zrównoważone, zalecane do większości zastosowań
- Wysokie (11-15): Ścisła zgodność, potencjalnie surowe
- Bardzo wysokie (16+): Zwykle powoduje artefakty
Zacznij od domyślnej, a następnie dostosuj w zależności od swoich potrzeb i używanego modelu.