Hérault

Z-Image Base vs Z-Image Turbo : Le « Grand Frère » est arrivé. Faut-il changer nos habitudes ?

Depuis plusieurs mois, la communauté s’est habituée à utiliser Z-Image Turbo, une version « distillée » (allégée et optimisée) qui a fait ses preuves. Mais le paysage vient de changer avec la sortie très récente de Z-Image Base.

Considéré comme le « grand frère » de la version Turbo, ce modèle complet promet de changer la donne pour les créateurs exigeants. Mais est-il vraiment supérieur ? Vaut-il le coût en temps de calcul ? Voici notre analyse complète basée sur les premiers tests.

1. Turbo vs Base : Le comparatif technique

La première chose à comprendre, c’est que Z-Image Turbo est issu de Z-Image Base via un processus de distillation. La famille compte aussi le futur Z Omnibase et une version Z-Image Edit pour la retouche.

Voici les différences fondamentales entre la version Base et la version Turbo :

Le contrôle (CFG et Prompts Négatifs) : C’est le grand retour du contrôle. Sur la version Base, vous pouvez enfin utiliser le CFG Scale (pour doser l’adhérence au prompt) et les prompts négatifs. Ces fonctionnalités sont inopérantes sur la version Turbo.

La vitesse (Steps) : Turbo porte bien son nom avec seulement environ 8 étapes (steps) nécessaires. La version Base est beaucoup plus gourmande, demandant entre 28 et 50 steps.

La diversité et l’entraînement : La version Base offre une diversité de génération qualifiée de « très élevée » et permet le fine-tuning (l’entraînement du modèle), ce qui est impossible avec Turbo.

Le paradoxe de la qualité : Curieusement, la documentation officielle annonce une qualité « Haute » pour la version Base, mais « Très Haute » pour la version Turbo. Qu’en est-il réellement à l’œil nu ?

2. Le verdict visuel : La bataille du détail

Les tests comparatifs révèlent deux philosophies très différentes :

La richesse des textures : Z-Image Base écrase son petit frère sur les détails. Que ce soit le grain d’un papier, la texture d’un rocher ou les détails de la peau, la version Base offre beaucoup plus de « matière ». À l’inverse, Turbo a tendance à lisser l’image, donnant parfois un aspect un peu « plastique » aux paysages.

Le respect du texte et du prompt : La version Base suit mieux les instructions complexes. Par exemple, elle réussit à placer du texte dans un rectangle transparent là où Turbo échoue. Les textes générés sont aussi plus lisibles et moins sujets aux « glitchs », même si pour les textes longs, aucun des deux ne vaut un modèle spécialisé.

Attention au contraste : C’est le point faible de la version Base par défaut. Elle produit des images très contrastées, avec des ombres parfois trop noires. Il est vivement conseillé de baisser le CFG (entre 4 et 6) pour adoucir le rendu.

3. La bonne surprise : Les LoRAs

C’est peut-être l’argument massue pour passer à la version Base. Non seulement les LoRAs créés pour Z-Image Turbo sont compatibles avec Z-Image Base, mais ils donnent de meilleurs résultats sur ce dernier.

Un test réalisé avec un LoRA de « photos imparfaites » montre que la version Base récupère des nuances, du grain et des détails que la version Turbo (pour laquelle le LoRA avait pourtant été créé) n’arrive pas à restituer.

4. Guide Pratique : Installation et Configuration

Attention, Z-Image Base est un poids lourd. Le modèle de diffusion pèse 12 Go (paramètres BF16) et l’encodeur de texte complet pèse 8 Go.

Le Workflow recommandé :

1. Mettez à jour ComfyUI.

2. Allez dans « Crow Template » et sélectionnez le workflow Z-Image (ne pas confondre avec Turbo).

3. VRAM limitée ? Si vous manquez de mémoire, téléchargez les versions allégées de l’encodeur de texte (FP8 ou FP4) disponibles sur Hugging Face.

Les réglages optimaux :

Résolution : Le modèle encaisse jusqu’à 2048×2048.

Steps : Entre 30 et 50.

CFG : Gardez-le bas, entre 4 et 7, pour éviter l’excès de contraste.

Sampleurs : Pour éviter l’effet « pâte à modeler » et obtenir le meilleur piqué, l’utilisation des nœuds custom « Rise for Life » est recommandée à la place des sampleurs standards.

Conclusion

Le choix est finalement assez simple. Si vous voulez de la vitesse et une image « propre » immédiatement, gardez Z-Image Turbo.

En revanche, si vous êtes un « power user » qui souhaite utiliser ControlNet précisément, exploiter des prompts négatifs, obtenir des textures réalistes ou tirer le meilleur parti de vos LoRAs, Z-Image Base est incontournable. Prévoyez simplement une machine solide : avec une RTX 4090, une image prend environ 30 secondes à générer.