Najważniejsze Ustawienie, które Możesz Ignorować
Stworzyłeś doskonałą podpowiedź. Słowa są precyzyjne, styl zdefiniowany, klikasz generuj... a wynik to albo rozmazana plama, albo chrupiący, przesycony koszmar. Co poszło nie tak?
Często winowajcą jest Skala CFG – jeden z najważniejszych, a zarazem niezrozumianych parametrów w generowaniu obrazów AI. Zrozumienie tego jednego ustawienia może dramatycznie poprawić twoje wyniki.
Czym Jest Skala CFG?
CFG to skrót od Przewodnictwa Bez-Klasifikatora. To parametr kontrolujący, jak mocno AI podąża za twoją tekstową podpowiedzią w porównaniu do generowania bardziej "swobodnego" twórczego outputu.
Traktuj to jako pokrętło między dwoma ekstremami:
- Niska CFG (1-5): AI ma większą swobodę twórczą. Wyniki mogą odbiegać od twojej podpowiedzi, ale często wyglądają bardziej naturalnie i organicznie
- Wysoka CFG (15-30): AI ściśle trzyma się twojej podpowiedzi. Wyniki dokładnie pasują do opisu, ale mogą wyglądać sztucznie lub być przesycone
Prosta Analogia
Wyobraź sobie, że dajesz instrukcje artyście:
- Niska CFG: "Namaluj mi krajobraz. Nie krępuj się interpretować tego, jak chcesz."
- Średnia CFG: "Namaluj mi krajobraz z zachodem słońca i górami. Upewnij się, że te elementy są, ale możesz dodać własne akcenty."
- Wysoka CFG: "Namaluj mi dokładnie to: krajobraz z zachodem słońca, ośnieżonymi górami, trzema sosnami po lewej, jeziorem odbijającym pomarańczowe niebo. Każdy element musi być dokładnie taki, jak opisuję."
Jak Działa Skala CFG (Wyjaśnienie Techniczne)
Dla tych, którzy chcą zrozumieć mechanizmy:
Proces Denoisingu
Generowanie obrazów AI zaczyna się od losowego szumu i stopniowo "odszumia" go w obraz. Na każdym etapie model dokonuje przewidywań, jak powinien wyglądać finalny obraz.
Warunkowe vs. Beztopy
Model faktycznie dokonuje dwóch przewidywań na każdym etapie:
- Przewidywanie bez warunków: "Jak wyglądałby grafik generowaniu przypadkowego obrazu?"
- Przewidywanie warunkowe: "Jak wyglądałby obraz, który odpowiada tej konkretnej podpowiedzi?"
Formuła CFG
Skala CFG określa, jak łączyć te przewidywania:
Ostateczne = Beztopy + CFG × (Warunkowe − Beztopy)
- CFG = 1: Używa tylko przewidywania warunkowego (podpowiedź-prowadzenie, ale słabe)
- CFG = 7: Silnie zmierza w stronę zawartości zgodnej z podpowiedzią
- CFG = 20: Agresywnie egzekwuje zgodność z podpowiedzią (często za mocno)
Wyższa CFG oznacza, że różnica między "tym, co chciałeś" a "przypadkowym obrazem" jest mocniej wzmacniana.
Znajdowanie Złotego Środka
Typowy Zakres: 5-15
Większość generatorów obrazów AI działa najlepiej w tym zakresie. Dokładny złoty środek zależy od:
- Modelu, którego używasz
- Złożoności twojej podpowiedzi
- Stylu, który celujesz
- Osobistych preferencji
Zalecenia Specyficzne dla Modelu
Stable Diffusion (SD 1.5, SDXL):
- Użytek ogólny: 7-8
- Fotorealistyczne: 5-7
- Sztuka/sklepienia: 8-12
- Maksymalne trzymanie się podpowiedzi: 12-15
Modele Flux:
- Flux Schnell: 1-4 (zaprojektowane do niskiej CFG)
- Flux Dev: 3-5
- Flux Pro: 2-4
Midjourney:
- Używa parametru "stylize" zamiast (podobna koncepcja)
- Niższy = bardziej dosłowny, wyższy = bardziej artystyczny
DALL-E:
- CFG jest obsługiwana wewnętrznie, nie można jej dostosować przez użytkownika
Efekty Różnych Wartości CFG
Bardzo Niska (1-3)
Cechy:
- Delikatna, marzycielska jakość
- Kolory są stłumione i naturalne
- Zgodność z podpowiedzią jest luźna
- Może ignorować specyficzne szczegóły
- Może wydawać się nieukierunkowane lub przypadkowe
Kiedy używać:
- Abstrakcyjna lub surrealistyczna sztuka
- Gdy chcesz twórczości AI
- Delikatne, atmosferyczne obrazy
- Z modelami Flux (zaprojektowane do niskiej CFG)
Nisko-Średnia (4-6)
Cechy:
- Naturalnie wyglądające obrazy
- Dobre połączenie zgodności z podpowiedzią i kreatywności
- Delikatne oświetlenie, realistyczne kolory
- Mogą wystąpić drobne różnice od podpowiedzi
Kiedy używać:
- Fotorealistyczne obrazy
- Portrety i ludzie
- Natury sceny
- Kiedy realizm liczy się bardziej niż precyzja
Średnia (7-9)
Cechy:
- Silna zgodność z podpowiedzią
- Zrównoważona saturacja i kontrast
- Wyraźna definicja podmiotu
- Dobra reprodukcja detali
Kiedy używać:
- Generacja ogólnego przeznaczenia
- Gdy potrzebujesz niezawodnych wyników
- Komercyjne i produktowe obrazy
- Większość przepływów Stable Diffusion
Średnio-Wysoka (10-14)
Cechy:
- Bardzo silna zgodność z podpowiedzią
- Zwiększona saturacja
- Wyższy kontrast
- Szczegóły stają się bardziej wyraźne
- Zaczynają wyglądać na "wygenerowane przez AI"
Kiedy używać:
- Kiedy precyzja podpowiedzi jest krytyczna
- Stylizowane lub graficzne dzieła sztuki
- Kiedy konkretne elementy muszą się pojawić
- Próby renderowania tekstu
Wysoka (15-20+)
Cechy:
- Maksymalna zgodność z podpowiedzią
- Przesycone kolory
- Ostre, sztuczne wykończenie
- Często spotykane artefakty i zniekształcenia
- "Chrupki" lub "smażony" wygląd
Kiedy używać:
- Rzadko – zwykle oznacza, że podpowiedź wymaga pracy
- Specyficzne efekty artystyczne
- Testowanie skuteczności podpowiedzi
- Niektóre style sztuki abstrakcyjnej lub glitch artu
Typowe Problemy i Rozwiązania
Problem: Obrazy Wydają się Rozmazane lub Nieostre
Prawdopodobna przyczyna: CFG zbyt niska
Rozwiązanie: Zwiększ CFG o 2-3 punkty. Jeśli używasz Flux, spróbuj zwiększyć z 2 na 4.
Problem: Obrazy Wydają się Przesycone lub Sztuczne
Prawdopodobna przyczyna: CFG zbyt wysoka
Rozwiązanie: Obniż CFG o 2-3 punkty. W większości przypadków dobrze będą działały wartości między 6-8.
Problem: AI Ignoruje Części Podpowiedzi
Prawdopodobna przyczyna: CFG może być za niski, ale często sama podpowiedź wymaga poprawy
Rozwiązanie: Spróbuj delikatnie zwiększyć CFG. Jeśli to nie pomoże, zmień strukturę podpowiedzi, aby podkreślić ważne elementy.
Problem: Dziwne Artefakty lub Wygląd "Smażonego"
Prawdopodobna przyczyna: CFG znacząco zbyt wysoka
Rozwiązanie: Obniż CFG do zakresu 7-10. Chrupkie artefakty to klasyczny znak nadmiernego przewodnictwa.
Problem: Twarze Wyglądają na Zniekształcone
Prawdopodobna przyczyna: CFG źle współpracuje z generowaniem twarzy
Rozwiązanie: Dla portretów obniż CFG do zakresu 5-7. Twarze są wrażliwe na wysokie wartości CFG.
Strategie Skali CFG
Strategia 1: Podejście Bracketingowe
Gdy jesteś niepewny, wygeneruj tę samą podpowiedź z wieloma wartościami CFG:
- Wygeneruj przy CFG 5, 7, 9, 11
- Porównaj wyniki
- Dopasuj się do swojego ulubionego
To szybko pokaże ci optymalny zakres dla twojej konkretnej podpowiedzi.
Strategia 2: Dopasowanie CFG do Treści
- Realistyczne zdjęcia: Niższe CFG (5-7)
- Ilustracje: Średnie CFG (7-10)
- Sztuka graficzna: Wyższe CFG (9-12)
- Abstrakcja: Zmienna (eksperymentuj!)
Strategia 3: Dostosowanie do Złożoności Podpowiedzi
- Proste podpowiedzi: Mogą obsługiwać niższe CFG
- Złożone podpowiedzi: Mogą potrzebować wyższych CFG, aby zawrzeć wszystkie elementy
- Bardzo konkretne podpowiedzi: Wyższe CFG, ale uważaj na artefakty
CFG i Inne Parametry
CFG vs. Kroki
Znacząco współdziałają:
- Wyższe CFG często korzystają z większej liczby kroków, aby rozwiązać szczegóły
- Niższa CFG często może używać mniej kroków bez utraty jakości
- Jeśli zwiększasz CFG, rozważ zwiększenie także kroków
CFG vs. Sampler
Różne samplery mają różne wrażliwości na CFG:
- Euler: Standardowa odpowiedź CFG
- DPM++ 2M: Działa dobrze w średnie CFG
- DDIM: Może obsługiwać wyższe CFG z mniejszym artefaktowaniem
CFG vs. Model
Każdy model ma swój własny optymalny zakres CFG:
- Przeczytaj dokumentację modelu dla zaleceń
- Niestandardowe modele mogą mieć specyficzne potrzeby CFG
- Kiedy przełączasz modele, nie zakładaj, że twoje normalne CFG zadziała
Zaawansowane: Dynamiczne CFG
Niektóre zaawansowane przepływy pracy wykorzystują zmienne CFG podczas generowania:
- Wysokie CFG na początku: Ustala kompozycję i kluczowe elementy
- Niższe CFG później: Pozwala na naturalny rozwój szczegółów
To może produkować obrazy, które są zarówno zgodne z podpowiedzią, jak i naturalnie wyglądające. Narzędzia takie jak ComfyUI wspierają to przez custom nodes.
Praktyczne Przykłady
Portretowa Fotografia
Podpowiedź: "Profesjonalny portret kobiety biznesu, oświetlenie studyjne, neutralne tło"
- CFG 5: Delikatne, naturalne oświetlenie, drobna zmienność podpowiedzi
- CFG 7: Wyraźne oświetlenie studyjne, zgodność z podpowiedzią
- CFG 12: Ostre oświetlenie, możliwe nienaturalne odcienie skóry
- Najlepszy wybór: 5-7
Ilustracja Fantasy
Podpowiedź: "Epiku smok siedzący na kryształowej górze, zachód słońca, styl fantastyczny"
- CFG 5: Atmosferyczny, ale szczegóły mogą być niejasne
- CFG 8: Wyraźny smok i góra, dobre zrównoważenie
- CFG 12: Bardzo zdefiniowane elementy, podkreślone kolory
- Najlepszy wybór: 7-10
Zdjęcie Produktu
Podpowiedź: "Biały trampki na białym tle, fotografia produktu, czyste oświetlenie"
- CFG 5: Może nie osiągnąć czystego wyglądu produktu
- CFG 8: Czysty, profesjonalny wygląd
- CFG 12: Ryzyko przepalenia i artefaktów
- Najlepszy wybór: 7-9
Podsumowanie
Skala CFG to twoja najpotężniejsza dźwignia w kontroli jakości generowania obrazów AI. Zbyt niska i twoje obrazy oddalają się od twojej wizji; zbyt wysoka i stają się sztuczne i ostre.
Kluczowe spostrzeżenia:
- 7-8 to bezpieczny punkt wyjścia dla większości modeli i podpowiedzi
- Dopasuj się podstawy na podstawie typu treści – realistyczne = niższe, stylizowane = wyższe
- Obserwuj znaki ostrzegawcze – rozmazane oznacza zbyt niski, chrupki oznacza zbyt wysoki
- Różne modele mają różne złote środki – zawsze sprawdzaj dokumentację
- W razie wątpliwości, bracket – przetestuj różne wartości i porównaj
Opanuj Skale CFG, a zdobędziesz znacznie większą kontrolę nad swoimi generowanymi obrazami AI. To różnica między walką z AI a współpracą z nim.