📖Glossar

CFG Scale (Guidance Scale) - KI-Bildgenerierungsparameter erklärt

Verstehen Sie die CFG Scale (Classifier-Free Guidance) - den Schlüsselparameter, der steuert, wie genau die KI Ihren Prompts bei der Bildgenerierung folgt.

CFG Scale (Guidance Scale) - KI-Bildgenerierungsparameter erklärt

Was ist die CFG Scale?

Die CFG Scale (Classifier-Free Guidance Scale), auch Guidance Scale genannt, ist ein Parameter, der steuert, wie strikt die KI Ihrem Text-Prompt bei der Bildgenerierung folgt. Sie bestimmt im Wesentlichen das Gleichgewicht zwischen Kreativität und Prompt-Befolgung.

Wie die CFG Scale funktioniert

Das technische Konzept

Während der Bildgenerierung berücksichtigt die KI:

  • Bedingtes Ergebnis: Was das Modell basierend auf Ihrem Prompt generiert
  • Unbedingtes Ergebnis: Was es ohne Führung generieren würde

Die CFG Scale bestimmt, wie stark das bedingte (durch Prompt geführte) Ergebnis gegenüber dem unbedingten betont wird.

Die Formel

Vereinfacht: Ergebnis = Unbedingt + CFG × (Bedingt - Unbedingt)

Höhere CFG = Mehr Einfluss durch Ihren Prompt

CFG Scale-Werte

Niedrige CFG (1-5)

Eigenschaften:

  • Kreativere/zufälligere Ergebnisse
  • Weichere, traumhaftere Bilder
  • Lockere Prompt-Interpretation
  • Vielfältigere Ergebnisse
  • Kann unfokussiert wirken

Optimal für: Abstrakte Kunst, experimentelle Arbeiten, weiche Ästhetik

Mittlere CFG (6-10)

Eigenschaften:

  • Ausgewogene Kreativität und Befolgung
  • Natürlich aussehende Ergebnisse
  • Gute Prompt-Befolgung
  • Am häufigsten verwendeter Bereich

Optimal für: Die meisten allgemeinen Anwendungsfälle, empfohlener Ausgangspunkt

Hohe CFG (11-20)

Eigenschaften:

  • Strikte Prompt-Befolgung
  • Mehr Kontrast und Sättigung
  • Kann harsch oder künstlich wirken
  • Weniger kreative Variation

Optimal für: Spezifische Anforderungen, technische Genauigkeit

Sehr hohe CFG (20+)

Eigenschaften:

  • Extreme Prompt-Befolgung
  • Erzeugt oft Artefakte
  • Übersättigte Farben
  • Verzerrte Details

Generell nicht empfohlen

Visuelle Beispiele

CFG-WertPrompt-BefolgungBildqualitätKreativität
3NiedrigWeich/TraumhaftHoch
7MittelAusgewogenMittel
12HochScharf/KontrastreichNiedrig
20Sehr hochOft mit ArtefaktenSehr niedrig

Empfohlene Einstellungen nach Anwendungsfall

Fotorealistische Bilder

  • CFG 5-8
  • Natürliche, glaubwürdige Ergebnisse
  • Vermeidet künstlichen Look

Künstlerische/stilisierte Arbeiten

  • CFG 7-10
  • Gute Stilbefolgung
  • Bewahrt künstlerische Kohärenz

Spezifische Motivgenauigkeit

  • CFG 8-12
  • Wenn exakte Prompt-Übereinstimmung wichtig ist
  • Technische Illustrationen

Abstrakt/Kreativ

  • CFG 3-6
  • Mehr Zufälligkeit gewünscht
  • Experimentelle Arbeiten

CFG Scale + andere Parameter

Zusammenspiel mit Schritten

  • Höhere CFG profitiert oft von mehr Schritten
  • Wenige Schritte + hohe CFG = Artefakte
  • Beide Parameter zusammen ausbalancieren

Zusammenspiel mit Sampler

  • Verschiedene Sampler reagieren unterschiedlich auf CFG
  • Einige Sampler bevorzugen niedrigere CFG
  • Mit Kombinationen experimentieren

Modellspezifische Vorlieben

  • Verschiedene Modelle haben optimale CFG-Bereiche
  • Flux-Modelle: Oft 3-7
  • Stable Diffusion: Oft 7-11
  • Modelldokumentation prüfen

Fehlerbehebung mit CFG

Bilder zu weich/unfokussiert

  • CFG erhöhen (um +2-3 versuchen)
  • Spezifischere Prompt-Details hinzufügen
  • Schrittzahl erhöhen

Bilder zu harsch/künstlich

  • CFG senken (um -2-3 versuchen)
  • Weichere Prompt-Sprache verwenden
  • Anderen Sampler ausprobieren

Artefakte und Verzerrungen

  • CFG wahrscheinlich zu hoch
  • Auf Bereich 7-10 reduzieren
  • Schritte erhöhen

Prompt wird ignoriert

  • CFG möglicherweise zu niedrig
  • Auf Bereich 7-10 erhöhen
  • Prompt-Formatierung prüfen

CFG Scale auf verschiedenen Plattformen

Namensvielfalt

Das gleiche Konzept hat verschiedene Namen:

  • CFG Scale - Stable Diffusion
  • Guidance Scale - Allgemeiner Begriff
  • Guidance - Einige Plattformen
  • Prompt Guidance - Benutzerfreundlicher Begriff

Standardwerte

Gängige Standardwerte plattformübergreifend:

  • Stable Diffusion: 7-7,5
  • DALL-E: Nicht vom Benutzer einstellbar
  • Midjourney: Stylize-Parameter (verwandtes Konzept)

Profi-Tipps

Ihren Sweet Spot finden

  1. Mit dem Standardwert beginnen (meist 7)
  2. Testbilder generieren
  3. Um 2 Punkte nach oben oder unten anpassen
  4. Ergebnisse vergleichen
  5. Notieren, was für Ihren Stil funktioniert

Stilspezifische Empfehlungen

  • Porträts: 6-8 für natürlichen Look
  • Landschaften: 7-9 für Details
  • Anime: 7-10 für Stilbefolgung
  • Abstrakt: 3-6 für Kreativität

Strategie für Stapelgenerierung

  • Gleichen Prompt bei verschiedenen CFG-Werten generieren
  • Ergebnisse nebeneinander vergleichen
  • Optimalen Bereich für Ihren Anwendungsfall identifizieren

Häufige Irrtümer

"Höher ist besser"

Falsch - Höhere CFG bedeutet nicht bessere Bilder. Es bedeutet striktere Befolgung, was oft schlechter aussehende Ergebnisse liefert.

"Eine Einstellung für alles"

Falsch - Die optimale CFG variiert je nach Modell, Prompt und gewünschtem Ausgabestil.

"CFG fügt Details hinzu"

Teilweise falsch - CFG beeinflusst die Prompt-Befolgung, nicht den Detailgrad. Details werden durch Auflösung, Schritte und Modell beeinflusst.

Zusammenfassung

Die CFG Scale ist ein fundamentaler Parameter der KI-Bildgenerierung:

  • Niedrig (1-5): Kreativ, weich, lockere Interpretation
  • Mittel (6-10): Ausgewogen, für die meisten Anwendungen empfohlen
  • Hoch (11-15): Strikte Befolgung, potenziell harsch
  • Sehr hoch (16+): Verursacht meist Artefakte

Beginnen Sie mit dem Standardwert und passen Sie dann basierend auf Ihren spezifischen Bedürfnissen und dem verwendeten Modell an.

TAGS

Verwandte Artikel

Zurück zur Wissensdatenbank