Le Réglage le Plus Important Que Vous Pourriez Ignorer
Vous avez créé l'invite parfaite. Les mots sont précis, le style est défini, vous appuyez sur générer... et le résultat est soit un flou total, soit un cauchemar crispé et sursaturé. Que s'est-il passé ?
Souvent, le coupable est l'échelle CFG – l'un des paramètres les plus importants et pourtant mal compris dans la génération d'images IA. Comprendre ce seul réglage peut améliorer considérablement vos résultats.
Qu'est-ce que l'Échelle CFG ?
CFG signifie Guidage Sans Classificateur. C'est un paramètre qui contrôle la force avec laquelle l'IA suit votre invitation textuelle par rapport à la génération d'une sortie créative plus "libre".
Imaginez-le comme un curseur entre deux extrêmes :
- CFG Bas (1-5): L'IA a plus de liberté créative. Les résultats peuvent s'éloigner de votre invitation mais apparaissent souvent plus naturels et organiques
- CFG Élevé (15-30): L'IA suit strictement votre invitation. Les résultats correspondent étroitement à votre description, mais peuvent sembler artificiels ou sursaturés
Une Analogique Simple
Imaginez donner des instructions à un artiste :
- CFG Bas : "Peins-moi un paysage. Interprète-le comme tu le souhaites."
- CFG Moyen : "Peins-moi un paysage de coucher de soleil avec des montagnes. Assure-toi que ces éléments soient présents, mais ajoute ta touche personnelle."
- CFG Élevé : "Peins-moi exactement ceci : un paysage de coucher de soleil avec des montagnes enneigées, trois pins à gauche, un lac reflétant le ciel orange. Chaque élément doit être exactement comme je le décris."
Comment Fonctionne l'Échelle CFG (Explication Technique)
Pour ceux qui veulent comprendre le fonctionnement :
Le Processus de Dénoyage
La génération d'images IA fonctionne en partant d'un bruit aléatoire et en le "dénoyant" progressivement en une image. À chaque étape, le modèle fait des prédictions sur ce à quoi l'image finale devrait ressembler.
Conditionnel vs. Inconditionnel
Le modèle fait en réalité deux prédictions à chaque étape :
- Prédiction inconditionnelle : "À quoi ressemblerait une image générique ?"
- Prédiction conditionnelle : "À quoi ressemblerait une image correspondant à cette invitation spécifique ?"
La Formule CFG
L'échelle CFG détermine comment mélanger ces prédictions :
Final = Inconditionnel + CFG × (Conditionnel − Inconditionnel)
- CFG = 1 : N'utilise que la prédiction conditionnelle (guidée par l'invitation mais faible)
- CFG = 7 : Oriente fortement vers le contenu correspondant à l'invitation
- CFG = 20 : Renforce agressivement l'adhérence à l'invitation (souvent trop)
Un CFG plus élevé signifie que la différence entre "ce que vous avez demandé" et "image générique" est amplifiée plus fortement.
Le Point Idéal
L'Échelle Commune : 5-15
La plupart des générateurs d'images IA fonctionnent le mieux dans cette échelle. Le point idéal exact dépend de :
- Le modèle spécifique que vous utilisez
- La complexité de votre invitation
- Le style que vous visez
- La préférence personnelle
Recommandations Spécifiques au Modèle
Stable Diffusion (SD 1.5, SDXL):
- Utilisation générale : 7-8
- Photoréaliste : 5-7
- Artistique/stylisé : 8-12
- Adhérence maximale à l'invitation : 12-15
Modèles Flux :
- Flux Schnell : 1-4 (conçu pour un CFG bas)
- Flux Dev : 3-5
- Flux Pro : 2-4
Midjourney :
- Utilise le paramètre "stylize" à la place (concept similaire)
- Plus bas = plus littéral, plus haut = plus artistique
DALL-E :
- Le CFG est géré en interne, non réglable par l'utilisateur
Effets des Différentes Valeurs de CFG
Très Bas (1-3)
Caractéristiques :
- Qualité douce, onirique
- Les couleurs sont atténuées et naturelles
- L'adhérence à l'invitation est lâche
- Peut ignorer des détails spécifiques
- Peut paraître flou ou aléatoire
Quand utiliser :
- Art abstrait ou surréaliste
- Lorsque vous voulez de la créativité IA
- Images douces et atmosphériques
- Avec des modèles Flux (conçus pour un CFG bas)
Bas-Moyen (4-6)
Caractéristiques :
- Images à l'apparence naturelle
- Bon équilibre entre respect de l'invitation et créativité
- Lumière douce, couleurs réalistes
- Des détails mineurs peuvent varier par rapport à l'invitation
Quand utiliser :
- Images photoréalistes
- Portraits et personnes
- Scènes naturelles
- Lorsque le réalisme est plus important que la précision
Moyen (7-9)
Caractéristiques :
- Forte adhérence à l'invitation
- Saturation et contraste équilibrés
- Définition claire du sujet
- Bonne reproduction des détails
Quand utiliser :
- Génération à usage général
- Lorsque vous avez besoin de résultats fiables
- Images commerciales et de produits
- La plupart des flux de travail Stable Diffusion
Moyen-Élevé (10-14)
Caractéristiques :
- Très forte adhérence à l'invitation
- Saturation accrue
- Contraste plus élevé
- Les détails deviennent plus prononcés
- Commence à paraître "généré par IA"
Quand utiliser :
- Lorsque la précision de l'invitation est essentielle
- Art stylisé ou graphique
- Lorsque des éléments spécifiques doivent apparaître
- Tentatives de rendu de texte
Élevé (15-20+)
Caractéristiques :
- Adhérence maximale à l'invitation
- Couleurs sursaturées
- Aspect dur et artificiel
- Artefacts et distorsions courants
- Apparence "crispée" ou "friture"
Quand utiliser :
- Rarement – indique généralement que l'invitation doit être retravaillée
- Effets artistiques spécifiques
- Tester l'efficacité de l'invitation
- Certaines styles d'art abstrait ou de glitch
Problèmes Communs et Solutions
Problème : Les Images Semblent Floues ou Non Focalisées
Cause probable : CFG trop bas
Solution : Augmenter le CFG de 2-3 points. Si vous utilisez Flux, essayez de passer de 2 à 4.
Problème : Les Images Semblent Sursaturées ou Artificielles
Cause probable : CFG trop élevé
Solution : Réduire le CFG de 2-3 points. La plupart des cas sont bien entre 6-8.
Problème : L'IA Ignore Des Parties de l'Invitation
Cause probable : CFG pourrait être trop bas, mais souvent l'invitation elle-même doit être retravaillée
Solution : Essayez d'augmenter légèrement le CFG. Si cela n'aide pas, restructurez votre invitation pour souligner les éléments importants.
Problème : Artefacts Étranges ou Apparence "Frite"
Cause probable : CFG significativement trop élevé
Solution : Réduire le CFG à une échelle de 7-10. Les artefacts crispés sont un signe classique d'une guidance excessive.
Problème : Les Visages Sont Distordus
Cause probable : Interaction inappropriée du CFG avec la génération de visages
Solution : Pour les portraits, réduire le CFG à une échelle de 5-7. Les visages sont sensibles à des valeurs élevées de CFG.
Stratégies d'Échelle CFG
Stratégie 1 : L'Approche de L'encadrement
En cas de doute, générez la même invitation à plusieurs valeurs de CFG :
- Générez à CFG 5, 7, 9, 11
- Comparez les résultats
- Ajustez autour de votre préférence
Cela vous montre rapidement la plage optimale pour votre invitation spécifique.
Stratégie 2 : Adapter le CFG au Contenu
- Photos réalistes : CFG bas (5-7)
- Illustrations : CFG moyen (7-10)
- Art graphique : CFG élevé (9-12)
- Abstrait : Variable (expérimentez !)
Stratégie 3 : Ajuster à la Complexité de l'Invitation
- Invitations simples : Peuvent gérer un CFG bas
- Invitations complexes : Peuvent nécessiter un CFG élevé pour inclure tous les éléments
- Invitations très spécifiques : CFG élevé, mais attention aux artefacts
CFG et Autres Paramètres
CFG vs. Étapes
Ces éléments interagissent considérablement :
- Un CFG plus élevé bénéficie souvent de plus d'étapes pour résoudre les détails
- Un CFG bas peut souvent utiliser moins d'étapes sans perte de qualité
- Si vous augmentez le CFG, envisagez d'augmenter légèrement les étapes aussi
CFG vs. Échantillonneur
Les différents échantillonneurs ont des sensibilités différentes au CFG :
- Euler : Réponse standard du CFG
- DPM++ 2M : Fonctionne bien avec un CFG modéré
- DDIM : Peut gérer un CFG élevé avec moins d'artefacts
CFG vs. Modèle
Chaque modèle a sa propre plage de CFG optimal :
- Lisez la documentation du modèle pour les recommandations
- Les modèles sur mesure peuvent avoir des besoins spécifiques en CFG
- Lorsque vous changez de modèle, ne supposez pas que votre CFG habituel fonctionnera
Avancé : CFG Dynamique
Certains flux de travail avancés utilisent un CFG variable tout au long de la génération :
- CFG élevé au début : Établit la composition et les éléments clés
- CFG plus bas plus tard : Permet le développement de détails naturels
Cela peut produire des images à la fois précises par rapport à l'invitation et d'apparence naturelle. Des outils comme ComfyUI le prennent en charge via des nœuds personnalisés.
Exemples Pratiques
Photographie de Portrait
Invitation : "Portrait professionnel d'une femme d'affaires, éclairage studio, fond neutre"
- CFG 5 : Éclairage doux et naturel, légère variation de l'invitation
- CFG 7 : Éclairage studio clair, conforme à l'invitation
- CFG 12 : Éclairage dur, teintes de peau potentiellement non naturelles
- Meilleur choix : 5-7
Illustration Fantastique
Invitation : "Dragon épique perché sur une montagne de cristal, coucher de soleil, style art fantastique"
- CFG 5 : Atmosphérique mais les détails peuvent être vagues
- CFG 8 : Dragon et montagne clairs, bon équilibre
- CFG 12 : Éléments très définis, couleurs intensifiées
- Meilleur choix : 7-10
Prise de Vue Produit
Invitation : "Baskets blanches sur fond blanc, photographie de produit, éclairage propre"
- CFG 5 : Peut ne pas atteindre l'aspect de propreté du produit
- CFG 8 : Aspect propre et professionnel
- CFG 12 : Risque de sur-affûtage et d'artefacts
- Meilleur choix : 7-9
Conclusion
L'échelle CFG est votre levier le plus puissant pour contrôler la qualité de la génération d'images IA. Trop bas et vos images s'éloignent de votre vision ; trop élevé et elles deviennent artificielles et dures.
Les idées clés :
- 7-8 est un point de départ sûr pour la plupart des modèles et des invitations
- Ajustez en fonction du type de contenu – réaliste = plus bas, stylisé = plus haut
- Faites attention aux signes révélateurs – flou signifie trop bas, croquant signifie trop élevé
- Les différents modèles ont des points doux différents – consultez toujours la documentation
- En cas de doute, encadrez – testez plusieurs valeurs et comparez
Maîtrisez l'échelle CFG et vous aurez beaucoup plus de contrôle sur vos images générées par IA. C'est la différence entre combattre l'IA et collaborer avec elle.