Was ist die CFG Scale?
Die CFG Scale (Classifier-Free Guidance Scale), auch Guidance Scale genannt, ist ein Parameter, der steuert, wie strikt die KI Ihrem Text-Prompt bei der Bildgenerierung folgt. Sie bestimmt im Wesentlichen das Gleichgewicht zwischen Kreativität und Prompt-Befolgung.
Wie die CFG Scale funktioniert
Das technische Konzept
Während der Bildgenerierung berücksichtigt die KI:
- Bedingtes Ergebnis: Was das Modell basierend auf Ihrem Prompt generiert
- Unbedingtes Ergebnis: Was es ohne Führung generieren würde
Die CFG Scale bestimmt, wie stark das bedingte (durch Prompt geführte) Ergebnis gegenüber dem unbedingten betont wird.
Die Formel
Vereinfacht: Ergebnis = Unbedingt + CFG × (Bedingt - Unbedingt)
Höhere CFG = Mehr Einfluss durch Ihren Prompt
CFG Scale-Werte
Niedrige CFG (1-5)
Eigenschaften:
- Kreativere/zufälligere Ergebnisse
- Weichere, traumhaftere Bilder
- Lockere Prompt-Interpretation
- Vielfältigere Ergebnisse
- Kann unfokussiert wirken
Optimal für: Abstrakte Kunst, experimentelle Arbeiten, weiche Ästhetik
Mittlere CFG (6-10)
Eigenschaften:
- Ausgewogene Kreativität und Befolgung
- Natürlich aussehende Ergebnisse
- Gute Prompt-Befolgung
- Am häufigsten verwendeter Bereich
Optimal für: Die meisten allgemeinen Anwendungsfälle, empfohlener Ausgangspunkt
Hohe CFG (11-20)
Eigenschaften:
- Strikte Prompt-Befolgung
- Mehr Kontrast und Sättigung
- Kann harsch oder künstlich wirken
- Weniger kreative Variation
Optimal für: Spezifische Anforderungen, technische Genauigkeit
Sehr hohe CFG (20+)
Eigenschaften:
- Extreme Prompt-Befolgung
- Erzeugt oft Artefakte
- Übersättigte Farben
- Verzerrte Details
Generell nicht empfohlen
Visuelle Beispiele
| CFG-Wert | Prompt-Befolgung | Bildqualität | Kreativität |
|---|---|---|---|
| 3 | Niedrig | Weich/Traumhaft | Hoch |
| 7 | Mittel | Ausgewogen | Mittel |
| 12 | Hoch | Scharf/Kontrastreich | Niedrig |
| 20 | Sehr hoch | Oft mit Artefakten | Sehr niedrig |
Empfohlene Einstellungen nach Anwendungsfall
Fotorealistische Bilder
- CFG 5-8
- Natürliche, glaubwürdige Ergebnisse
- Vermeidet künstlichen Look
Künstlerische/stilisierte Arbeiten
- CFG 7-10
- Gute Stilbefolgung
- Bewahrt künstlerische Kohärenz
Spezifische Motivgenauigkeit
- CFG 8-12
- Wenn exakte Prompt-Übereinstimmung wichtig ist
- Technische Illustrationen
Abstrakt/Kreativ
- CFG 3-6
- Mehr Zufälligkeit gewünscht
- Experimentelle Arbeiten
CFG Scale + andere Parameter
Zusammenspiel mit Schritten
- Höhere CFG profitiert oft von mehr Schritten
- Wenige Schritte + hohe CFG = Artefakte
- Beide Parameter zusammen ausbalancieren
Zusammenspiel mit Sampler
- Verschiedene Sampler reagieren unterschiedlich auf CFG
- Einige Sampler bevorzugen niedrigere CFG
- Mit Kombinationen experimentieren
Modellspezifische Vorlieben
- Verschiedene Modelle haben optimale CFG-Bereiche
- Flux-Modelle: Oft 3-7
- Stable Diffusion: Oft 7-11
- Modelldokumentation prüfen
Fehlerbehebung mit CFG
Bilder zu weich/unfokussiert
- CFG erhöhen (um +2-3 versuchen)
- Spezifischere Prompt-Details hinzufügen
- Schrittzahl erhöhen
Bilder zu harsch/künstlich
- CFG senken (um -2-3 versuchen)
- Weichere Prompt-Sprache verwenden
- Anderen Sampler ausprobieren
Artefakte und Verzerrungen
- CFG wahrscheinlich zu hoch
- Auf Bereich 7-10 reduzieren
- Schritte erhöhen
Prompt wird ignoriert
- CFG möglicherweise zu niedrig
- Auf Bereich 7-10 erhöhen
- Prompt-Formatierung prüfen
CFG Scale auf verschiedenen Plattformen
Namensvielfalt
Das gleiche Konzept hat verschiedene Namen:
- CFG Scale - Stable Diffusion
- Guidance Scale - Allgemeiner Begriff
- Guidance - Einige Plattformen
- Prompt Guidance - Benutzerfreundlicher Begriff
Standardwerte
Gängige Standardwerte plattformübergreifend:
- Stable Diffusion: 7-7,5
- DALL-E: Nicht vom Benutzer einstellbar
- Midjourney: Stylize-Parameter (verwandtes Konzept)
Profi-Tipps
Ihren Sweet Spot finden
- Mit dem Standardwert beginnen (meist 7)
- Testbilder generieren
- Um 2 Punkte nach oben oder unten anpassen
- Ergebnisse vergleichen
- Notieren, was für Ihren Stil funktioniert
Stilspezifische Empfehlungen
- Porträts: 6-8 für natürlichen Look
- Landschaften: 7-9 für Details
- Anime: 7-10 für Stilbefolgung
- Abstrakt: 3-6 für Kreativität
Strategie für Stapelgenerierung
- Gleichen Prompt bei verschiedenen CFG-Werten generieren
- Ergebnisse nebeneinander vergleichen
- Optimalen Bereich für Ihren Anwendungsfall identifizieren
Häufige Irrtümer
"Höher ist besser"
Falsch - Höhere CFG bedeutet nicht bessere Bilder. Es bedeutet striktere Befolgung, was oft schlechter aussehende Ergebnisse liefert.
"Eine Einstellung für alles"
Falsch - Die optimale CFG variiert je nach Modell, Prompt und gewünschtem Ausgabestil.
"CFG fügt Details hinzu"
Teilweise falsch - CFG beeinflusst die Prompt-Befolgung, nicht den Detailgrad. Details werden durch Auflösung, Schritte und Modell beeinflusst.
Zusammenfassung
Die CFG Scale ist ein fundamentaler Parameter der KI-Bildgenerierung:
- Niedrig (1-5): Kreativ, weich, lockere Interpretation
- Mittel (6-10): Ausgewogen, für die meisten Anwendungen empfohlen
- Hoch (11-15): Strikte Befolgung, potenziell harsch
- Sehr hoch (16+): Verursacht meist Artefakte
Beginnen Sie mit dem Standardwert und passen Sie dann basierend auf Ihren spezifischen Bedürfnissen und dem verwendeten Modell an.