📖Glossaire

Échelle CFG Expliquée : Maîtriser le Contrôle de Génération d'Images IA

Comprendre l'échelle CFG (Classifier-Free Guidance) - le paramètre crucial qui contrôle la façon dont l'IA suit vos instructions. Apprenez les valeurs optimales pour différents scénarios.

Le Réglage le Plus Important Que Vous Pourriez Ignorer

Vous avez créé l'invite parfaite. Les mots sont précis, le style est défini, vous appuyez sur générer... et le résultat est soit un flou total, soit un cauchemar crispé et sursaturé. Que s'est-il passé ?

Souvent, le coupable est l'échelle CFG – l'un des paramètres les plus importants et pourtant mal compris dans la génération d'images IA. Comprendre ce seul réglage peut améliorer considérablement vos résultats.

Qu'est-ce que l'Échelle CFG ?

CFG signifie Guidage Sans Classificateur. C'est un paramètre qui contrôle la force avec laquelle l'IA suit votre invitation textuelle par rapport à la génération d'une sortie créative plus "libre".

Imaginez-le comme un curseur entre deux extrêmes :

  • CFG Bas (1-5): L'IA a plus de liberté créative. Les résultats peuvent s'éloigner de votre invitation mais apparaissent souvent plus naturels et organiques
  • CFG Élevé (15-30): L'IA suit strictement votre invitation. Les résultats correspondent étroitement à votre description, mais peuvent sembler artificiels ou sursaturés

Une Analogique Simple

Imaginez donner des instructions à un artiste :

  • CFG Bas : "Peins-moi un paysage. Interprète-le comme tu le souhaites."
  • CFG Moyen : "Peins-moi un paysage de coucher de soleil avec des montagnes. Assure-toi que ces éléments soient présents, mais ajoute ta touche personnelle."
  • CFG Élevé : "Peins-moi exactement ceci : un paysage de coucher de soleil avec des montagnes enneigées, trois pins à gauche, un lac reflétant le ciel orange. Chaque élément doit être exactement comme je le décris."

Comment Fonctionne l'Échelle CFG (Explication Technique)

Pour ceux qui veulent comprendre le fonctionnement :

Le Processus de Dénoyage

La génération d'images IA fonctionne en partant d'un bruit aléatoire et en le "dénoyant" progressivement en une image. À chaque étape, le modèle fait des prédictions sur ce à quoi l'image finale devrait ressembler.

Conditionnel vs. Inconditionnel

Le modèle fait en réalité deux prédictions à chaque étape :

  1. Prédiction inconditionnelle : "À quoi ressemblerait une image générique ?"
  2. Prédiction conditionnelle : "À quoi ressemblerait une image correspondant à cette invitation spécifique ?"

La Formule CFG

L'échelle CFG détermine comment mélanger ces prédictions :

Final = Inconditionnel + CFG × (Conditionnel − Inconditionnel)

  • CFG = 1 : N'utilise que la prédiction conditionnelle (guidée par l'invitation mais faible)
  • CFG = 7 : Oriente fortement vers le contenu correspondant à l'invitation
  • CFG = 20 : Renforce agressivement l'adhérence à l'invitation (souvent trop)

Un CFG plus élevé signifie que la différence entre "ce que vous avez demandé" et "image générique" est amplifiée plus fortement.

Le Point Idéal

L'Échelle Commune : 5-15

La plupart des générateurs d'images IA fonctionnent le mieux dans cette échelle. Le point idéal exact dépend de :

  • Le modèle spécifique que vous utilisez
  • La complexité de votre invitation
  • Le style que vous visez
  • La préférence personnelle

Recommandations Spécifiques au Modèle

Stable Diffusion (SD 1.5, SDXL):

  • Utilisation générale : 7-8
  • Photoréaliste : 5-7
  • Artistique/stylisé : 8-12
  • Adhérence maximale à l'invitation : 12-15

Modèles Flux :

  • Flux Schnell : 1-4 (conçu pour un CFG bas)
  • Flux Dev : 3-5
  • Flux Pro : 2-4

Midjourney :

  • Utilise le paramètre "stylize" à la place (concept similaire)
  • Plus bas = plus littéral, plus haut = plus artistique

DALL-E :

  • Le CFG est géré en interne, non réglable par l'utilisateur

Effets des Différentes Valeurs de CFG

Très Bas (1-3)

Caractéristiques :

  • Qualité douce, onirique
  • Les couleurs sont atténuées et naturelles
  • L'adhérence à l'invitation est lâche
  • Peut ignorer des détails spécifiques
  • Peut paraître flou ou aléatoire

Quand utiliser :

  • Art abstrait ou surréaliste
  • Lorsque vous voulez de la créativité IA
  • Images douces et atmosphériques
  • Avec des modèles Flux (conçus pour un CFG bas)

Bas-Moyen (4-6)

Caractéristiques :

  • Images à l'apparence naturelle
  • Bon équilibre entre respect de l'invitation et créativité
  • Lumière douce, couleurs réalistes
  • Des détails mineurs peuvent varier par rapport à l'invitation

Quand utiliser :

  • Images photoréalistes
  • Portraits et personnes
  • Scènes naturelles
  • Lorsque le réalisme est plus important que la précision

Moyen (7-9)

Caractéristiques :

  • Forte adhérence à l'invitation
  • Saturation et contraste équilibrés
  • Définition claire du sujet
  • Bonne reproduction des détails

Quand utiliser :

  • Génération à usage général
  • Lorsque vous avez besoin de résultats fiables
  • Images commerciales et de produits
  • La plupart des flux de travail Stable Diffusion

Moyen-Élevé (10-14)

Caractéristiques :

  • Très forte adhérence à l'invitation
  • Saturation accrue
  • Contraste plus élevé
  • Les détails deviennent plus prononcés
  • Commence à paraître "généré par IA"

Quand utiliser :

  • Lorsque la précision de l'invitation est essentielle
  • Art stylisé ou graphique
  • Lorsque des éléments spécifiques doivent apparaître
  • Tentatives de rendu de texte

Élevé (15-20+)

Caractéristiques :

  • Adhérence maximale à l'invitation
  • Couleurs sursaturées
  • Aspect dur et artificiel
  • Artefacts et distorsions courants
  • Apparence "crispée" ou "friture"

Quand utiliser :

  • Rarement – indique généralement que l'invitation doit être retravaillée
  • Effets artistiques spécifiques
  • Tester l'efficacité de l'invitation
  • Certaines styles d'art abstrait ou de glitch

Problèmes Communs et Solutions

Problème : Les Images Semblent Floues ou Non Focalisées

Cause probable : CFG trop bas

Solution : Augmenter le CFG de 2-3 points. Si vous utilisez Flux, essayez de passer de 2 à 4.

Problème : Les Images Semblent Sursaturées ou Artificielles

Cause probable : CFG trop élevé

Solution : Réduire le CFG de 2-3 points. La plupart des cas sont bien entre 6-8.

Problème : L'IA Ignore Des Parties de l'Invitation

Cause probable : CFG pourrait être trop bas, mais souvent l'invitation elle-même doit être retravaillée

Solution : Essayez d'augmenter légèrement le CFG. Si cela n'aide pas, restructurez votre invitation pour souligner les éléments importants.

Problème : Artefacts Étranges ou Apparence "Frite"

Cause probable : CFG significativement trop élevé

Solution : Réduire le CFG à une échelle de 7-10. Les artefacts crispés sont un signe classique d'une guidance excessive.

Problème : Les Visages Sont Distordus

Cause probable : Interaction inappropriée du CFG avec la génération de visages

Solution : Pour les portraits, réduire le CFG à une échelle de 5-7. Les visages sont sensibles à des valeurs élevées de CFG.

Stratégies d'Échelle CFG

Stratégie 1 : L'Approche de L'encadrement

En cas de doute, générez la même invitation à plusieurs valeurs de CFG :

  1. Générez à CFG 5, 7, 9, 11
  2. Comparez les résultats
  3. Ajustez autour de votre préférence

Cela vous montre rapidement la plage optimale pour votre invitation spécifique.

Stratégie 2 : Adapter le CFG au Contenu

  • Photos réalistes : CFG bas (5-7)
  • Illustrations : CFG moyen (7-10)
  • Art graphique : CFG élevé (9-12)
  • Abstrait : Variable (expérimentez !)

Stratégie 3 : Ajuster à la Complexité de l'Invitation

  • Invitations simples : Peuvent gérer un CFG bas
  • Invitations complexes : Peuvent nécessiter un CFG élevé pour inclure tous les éléments
  • Invitations très spécifiques : CFG élevé, mais attention aux artefacts

CFG et Autres Paramètres

CFG vs. Étapes

Ces éléments interagissent considérablement :

  • Un CFG plus élevé bénéficie souvent de plus d'étapes pour résoudre les détails
  • Un CFG bas peut souvent utiliser moins d'étapes sans perte de qualité
  • Si vous augmentez le CFG, envisagez d'augmenter légèrement les étapes aussi

CFG vs. Échantillonneur

Les différents échantillonneurs ont des sensibilités différentes au CFG :

  • Euler : Réponse standard du CFG
  • DPM++ 2M : Fonctionne bien avec un CFG modéré
  • DDIM : Peut gérer un CFG élevé avec moins d'artefacts

CFG vs. Modèle

Chaque modèle a sa propre plage de CFG optimal :

  • Lisez la documentation du modèle pour les recommandations
  • Les modèles sur mesure peuvent avoir des besoins spécifiques en CFG
  • Lorsque vous changez de modèle, ne supposez pas que votre CFG habituel fonctionnera

Avancé : CFG Dynamique

Certains flux de travail avancés utilisent un CFG variable tout au long de la génération :

  • CFG élevé au début : Établit la composition et les éléments clés
  • CFG plus bas plus tard : Permet le développement de détails naturels

Cela peut produire des images à la fois précises par rapport à l'invitation et d'apparence naturelle. Des outils comme ComfyUI le prennent en charge via des nœuds personnalisés.

Exemples Pratiques

Photographie de Portrait

Invitation : "Portrait professionnel d'une femme d'affaires, éclairage studio, fond neutre"

  • CFG 5 : Éclairage doux et naturel, légère variation de l'invitation
  • CFG 7 : Éclairage studio clair, conforme à l'invitation
  • CFG 12 : Éclairage dur, teintes de peau potentiellement non naturelles
  • Meilleur choix : 5-7

Illustration Fantastique

Invitation : "Dragon épique perché sur une montagne de cristal, coucher de soleil, style art fantastique"

  • CFG 5 : Atmosphérique mais les détails peuvent être vagues
  • CFG 8 : Dragon et montagne clairs, bon équilibre
  • CFG 12 : Éléments très définis, couleurs intensifiées
  • Meilleur choix : 7-10

Prise de Vue Produit

Invitation : "Baskets blanches sur fond blanc, photographie de produit, éclairage propre"

  • CFG 5 : Peut ne pas atteindre l'aspect de propreté du produit
  • CFG 8 : Aspect propre et professionnel
  • CFG 12 : Risque de sur-affûtage et d'artefacts
  • Meilleur choix : 7-9

Conclusion

L'échelle CFG est votre levier le plus puissant pour contrôler la qualité de la génération d'images IA. Trop bas et vos images s'éloignent de votre vision ; trop élevé et elles deviennent artificielles et dures.

Les idées clés :

  • 7-8 est un point de départ sûr pour la plupart des modèles et des invitations
  • Ajustez en fonction du type de contenu – réaliste = plus bas, stylisé = plus haut
  • Faites attention aux signes révélateurs – flou signifie trop bas, croquant signifie trop élevé
  • Les différents modèles ont des points doux différents – consultez toujours la documentation
  • En cas de doute, encadrez – testez plusieurs valeurs et comparez

Maîtrisez l'échelle CFG et vous aurez beaucoup plus de contrôle sur vos images générées par IA. C'est la différence entre combattre l'IA et collaborer avec elle.

TAGS

Articles Connexes

Retour à la Base de Connaissances