📖Słownik

Wyjaśnienie Skali CFG: Opanowanie Kontroli Generowania Obrazów AI

Zrozum Skali CFG (Przewodnictwo Bez-Klasifikatora) - kluczowy parametr kontrolujący, jak dokładnie AI podąża za twoimi podpowiedziami. Dowiedz się o optymalnych wartościach dla różnych scenariuszy.

Najważniejsze Ustawienie, które Możesz Ignorować

Stworzyłeś doskonałą podpowiedź. Słowa są precyzyjne, styl zdefiniowany, klikasz generuj... a wynik to albo rozmazana plama, albo chrupiący, przesycony koszmar. Co poszło nie tak?

Często winowajcą jest Skala CFG – jeden z najważniejszych, a zarazem niezrozumianych parametrów w generowaniu obrazów AI. Zrozumienie tego jednego ustawienia może dramatycznie poprawić twoje wyniki.

Czym Jest Skala CFG?

CFG to skrót od Przewodnictwa Bez-Klasifikatora. To parametr kontrolujący, jak mocno AI podąża za twoją tekstową podpowiedzią w porównaniu do generowania bardziej "swobodnego" twórczego outputu.

Traktuj to jako pokrętło między dwoma ekstremami:

  • Niska CFG (1-5): AI ma większą swobodę twórczą. Wyniki mogą odbiegać od twojej podpowiedzi, ale często wyglądają bardziej naturalnie i organicznie
  • Wysoka CFG (15-30): AI ściśle trzyma się twojej podpowiedzi. Wyniki dokładnie pasują do opisu, ale mogą wyglądać sztucznie lub być przesycone

Prosta Analogia

Wyobraź sobie, że dajesz instrukcje artyście:

  • Niska CFG: "Namaluj mi krajobraz. Nie krępuj się interpretować tego, jak chcesz."
  • Średnia CFG: "Namaluj mi krajobraz z zachodem słońca i górami. Upewnij się, że te elementy są, ale możesz dodać własne akcenty."
  • Wysoka CFG: "Namaluj mi dokładnie to: krajobraz z zachodem słońca, ośnieżonymi górami, trzema sosnami po lewej, jeziorem odbijającym pomarańczowe niebo. Każdy element musi być dokładnie taki, jak opisuję."

Jak Działa Skala CFG (Wyjaśnienie Techniczne)

Dla tych, którzy chcą zrozumieć mechanizmy:

Proces Denoisingu

Generowanie obrazów AI zaczyna się od losowego szumu i stopniowo "odszumia" go w obraz. Na każdym etapie model dokonuje przewidywań, jak powinien wyglądać finalny obraz.

Warunkowe vs. Beztopy

Model faktycznie dokonuje dwóch przewidywań na każdym etapie:

  1. Przewidywanie bez warunków: "Jak wyglądałby grafik generowaniu przypadkowego obrazu?"
  2. Przewidywanie warunkowe: "Jak wyglądałby obraz, który odpowiada tej konkretnej podpowiedzi?"

Formuła CFG

Skala CFG określa, jak łączyć te przewidywania:

Ostateczne = Beztopy + CFG × (Warunkowe − Beztopy)

  • CFG = 1: Używa tylko przewidywania warunkowego (podpowiedź-prowadzenie, ale słabe)
  • CFG = 7: Silnie zmierza w stronę zawartości zgodnej z podpowiedzią
  • CFG = 20: Agresywnie egzekwuje zgodność z podpowiedzią (często za mocno)

Wyższa CFG oznacza, że różnica między "tym, co chciałeś" a "przypadkowym obrazem" jest mocniej wzmacniana.

Znajdowanie Złotego Środka

Typowy Zakres: 5-15

Większość generatorów obrazów AI działa najlepiej w tym zakresie. Dokładny złoty środek zależy od:

  • Modelu, którego używasz
  • Złożoności twojej podpowiedzi
  • Stylu, który celujesz
  • Osobistych preferencji

Zalecenia Specyficzne dla Modelu

Stable Diffusion (SD 1.5, SDXL):

  • Użytek ogólny: 7-8
  • Fotorealistyczne: 5-7
  • Sztuka/sklepienia: 8-12
  • Maksymalne trzymanie się podpowiedzi: 12-15

Modele Flux:

  • Flux Schnell: 1-4 (zaprojektowane do niskiej CFG)
  • Flux Dev: 3-5
  • Flux Pro: 2-4

Midjourney:

  • Używa parametru "stylize" zamiast (podobna koncepcja)
  • Niższy = bardziej dosłowny, wyższy = bardziej artystyczny

DALL-E:

  • CFG jest obsługiwana wewnętrznie, nie można jej dostosować przez użytkownika

Efekty Różnych Wartości CFG

Bardzo Niska (1-3)

Cechy:

  • Delikatna, marzycielska jakość
  • Kolory są stłumione i naturalne
  • Zgodność z podpowiedzią jest luźna
  • Może ignorować specyficzne szczegóły
  • Może wydawać się nieukierunkowane lub przypadkowe

Kiedy używać:

  • Abstrakcyjna lub surrealistyczna sztuka
  • Gdy chcesz twórczości AI
  • Delikatne, atmosferyczne obrazy
  • Z modelami Flux (zaprojektowane do niskiej CFG)

Nisko-Średnia (4-6)

Cechy:

  • Naturalnie wyglądające obrazy
  • Dobre połączenie zgodności z podpowiedzią i kreatywności
  • Delikatne oświetlenie, realistyczne kolory
  • Mogą wystąpić drobne różnice od podpowiedzi

Kiedy używać:

  • Fotorealistyczne obrazy
  • Portrety i ludzie
  • Natury sceny
  • Kiedy realizm liczy się bardziej niż precyzja

Średnia (7-9)

Cechy:

  • Silna zgodność z podpowiedzią
  • Zrównoważona saturacja i kontrast
  • Wyraźna definicja podmiotu
  • Dobra reprodukcja detali

Kiedy używać:

  • Generacja ogólnego przeznaczenia
  • Gdy potrzebujesz niezawodnych wyników
  • Komercyjne i produktowe obrazy
  • Większość przepływów Stable Diffusion

Średnio-Wysoka (10-14)

Cechy:

  • Bardzo silna zgodność z podpowiedzią
  • Zwiększona saturacja
  • Wyższy kontrast
  • Szczegóły stają się bardziej wyraźne
  • Zaczynają wyglądać na "wygenerowane przez AI"

Kiedy używać:

  • Kiedy precyzja podpowiedzi jest krytyczna
  • Stylizowane lub graficzne dzieła sztuki
  • Kiedy konkretne elementy muszą się pojawić
  • Próby renderowania tekstu

Wysoka (15-20+)

Cechy:

  • Maksymalna zgodność z podpowiedzią
  • Przesycone kolory
  • Ostre, sztuczne wykończenie
  • Często spotykane artefakty i zniekształcenia
  • "Chrupki" lub "smażony" wygląd

Kiedy używać:

  • Rzadko – zwykle oznacza, że podpowiedź wymaga pracy
  • Specyficzne efekty artystyczne
  • Testowanie skuteczności podpowiedzi
  • Niektóre style sztuki abstrakcyjnej lub glitch artu

Typowe Problemy i Rozwiązania

Problem: Obrazy Wydają się Rozmazane lub Nieostre

Prawdopodobna przyczyna: CFG zbyt niska

Rozwiązanie: Zwiększ CFG o 2-3 punkty. Jeśli używasz Flux, spróbuj zwiększyć z 2 na 4.

Problem: Obrazy Wydają się Przesycone lub Sztuczne

Prawdopodobna przyczyna: CFG zbyt wysoka

Rozwiązanie: Obniż CFG o 2-3 punkty. W większości przypadków dobrze będą działały wartości między 6-8.

Problem: AI Ignoruje Części Podpowiedzi

Prawdopodobna przyczyna: CFG może być za niski, ale często sama podpowiedź wymaga poprawy

Rozwiązanie: Spróbuj delikatnie zwiększyć CFG. Jeśli to nie pomoże, zmień strukturę podpowiedzi, aby podkreślić ważne elementy.

Problem: Dziwne Artefakty lub Wygląd "Smażonego"

Prawdopodobna przyczyna: CFG znacząco zbyt wysoka

Rozwiązanie: Obniż CFG do zakresu 7-10. Chrupkie artefakty to klasyczny znak nadmiernego przewodnictwa.

Problem: Twarze Wyglądają na Zniekształcone

Prawdopodobna przyczyna: CFG źle współpracuje z generowaniem twarzy

Rozwiązanie: Dla portretów obniż CFG do zakresu 5-7. Twarze są wrażliwe na wysokie wartości CFG.

Strategie Skali CFG

Strategia 1: Podejście Bracketingowe

Gdy jesteś niepewny, wygeneruj tę samą podpowiedź z wieloma wartościami CFG:

  1. Wygeneruj przy CFG 5, 7, 9, 11
  2. Porównaj wyniki
  3. Dopasuj się do swojego ulubionego

To szybko pokaże ci optymalny zakres dla twojej konkretnej podpowiedzi.

Strategia 2: Dopasowanie CFG do Treści

  • Realistyczne zdjęcia: Niższe CFG (5-7)
  • Ilustracje: Średnie CFG (7-10)
  • Sztuka graficzna: Wyższe CFG (9-12)
  • Abstrakcja: Zmienna (eksperymentuj!)

Strategia 3: Dostosowanie do Złożoności Podpowiedzi

  • Proste podpowiedzi: Mogą obsługiwać niższe CFG
  • Złożone podpowiedzi: Mogą potrzebować wyższych CFG, aby zawrzeć wszystkie elementy
  • Bardzo konkretne podpowiedzi: Wyższe CFG, ale uważaj na artefakty

CFG i Inne Parametry

CFG vs. Kroki

Znacząco współdziałają:

  • Wyższe CFG często korzystają z większej liczby kroków, aby rozwiązać szczegóły
  • Niższa CFG często może używać mniej kroków bez utraty jakości
  • Jeśli zwiększasz CFG, rozważ zwiększenie także kroków

CFG vs. Sampler

Różne samplery mają różne wrażliwości na CFG:

  • Euler: Standardowa odpowiedź CFG
  • DPM++ 2M: Działa dobrze w średnie CFG
  • DDIM: Może obsługiwać wyższe CFG z mniejszym artefaktowaniem

CFG vs. Model

Każdy model ma swój własny optymalny zakres CFG:

  • Przeczytaj dokumentację modelu dla zaleceń
  • Niestandardowe modele mogą mieć specyficzne potrzeby CFG
  • Kiedy przełączasz modele, nie zakładaj, że twoje normalne CFG zadziała

Zaawansowane: Dynamiczne CFG

Niektóre zaawansowane przepływy pracy wykorzystują zmienne CFG podczas generowania:

  • Wysokie CFG na początku: Ustala kompozycję i kluczowe elementy
  • Niższe CFG później: Pozwala na naturalny rozwój szczegółów

To może produkować obrazy, które są zarówno zgodne z podpowiedzią, jak i naturalnie wyglądające. Narzędzia takie jak ComfyUI wspierają to przez custom nodes.

Praktyczne Przykłady

Portretowa Fotografia

Podpowiedź: "Profesjonalny portret kobiety biznesu, oświetlenie studyjne, neutralne tło"

  • CFG 5: Delikatne, naturalne oświetlenie, drobna zmienność podpowiedzi
  • CFG 7: Wyraźne oświetlenie studyjne, zgodność z podpowiedzią
  • CFG 12: Ostre oświetlenie, możliwe nienaturalne odcienie skóry
  • Najlepszy wybór: 5-7

Ilustracja Fantasy

Podpowiedź: "Epiku smok siedzący na kryształowej górze, zachód słońca, styl fantastyczny"

  • CFG 5: Atmosferyczny, ale szczegóły mogą być niejasne
  • CFG 8: Wyraźny smok i góra, dobre zrównoważenie
  • CFG 12: Bardzo zdefiniowane elementy, podkreślone kolory
  • Najlepszy wybór: 7-10

Zdjęcie Produktu

Podpowiedź: "Biały trampki na białym tle, fotografia produktu, czyste oświetlenie"

  • CFG 5: Może nie osiągnąć czystego wyglądu produktu
  • CFG 8: Czysty, profesjonalny wygląd
  • CFG 12: Ryzyko przepalenia i artefaktów
  • Najlepszy wybór: 7-9

Podsumowanie

Skala CFG to twoja najpotężniejsza dźwignia w kontroli jakości generowania obrazów AI. Zbyt niska i twoje obrazy oddalają się od twojej wizji; zbyt wysoka i stają się sztuczne i ostre.

Kluczowe spostrzeżenia:

  • 7-8 to bezpieczny punkt wyjścia dla większości modeli i podpowiedzi
  • Dopasuj się podstawy na podstawie typu treści – realistyczne = niższe, stylizowane = wyższe
  • Obserwuj znaki ostrzegawcze – rozmazane oznacza zbyt niski, chrupki oznacza zbyt wysoki
  • Różne modele mają różne złote środki – zawsze sprawdzaj dokumentację
  • W razie wątpliwości, bracket – przetestuj różne wartości i porównaj

Opanuj Skale CFG, a zdobędziesz znacznie większą kontrolę nad swoimi generowanymi obrazami AI. To różnica między walką z AI a współpracą z nim.

TAGI

Powiązane Artykuły

Powrót do Bazy Wiedzy