Midjourney a-t-il trouvé son rival ultime avec Flux.1 ?
Depuis son arrivée surprise et discrète sur le marché des modèles text-to-image, certains considèrent Flux.1 comme le « Midjourney killer » ultime et le digne successeur de Stable Diffusion.
Mais avant d'enterrer le champion, voyons si ce nouveau venu mérite vraiment son titre ou si c'est juste une autre belle promesse du monde merveilleux de l'IA.
Flux.1 : un trio de modèles texte-image signé Black Forest Labs
Black Forest Labs, l'entreprise derrière Flux.1, est composée d'experts qui ont déjà marqué l'industrie avec des projets tels que VQGAN, Latent Diffusion, et surtout Stable Diffusion.
Ce n'est donc pas une équipe d'amateurs à son premier coup d'essai.
Grâce à un financement de 31 millions de dollars1, ils ont développé non pas un, mais trois versions distinctes pour faire profiter tout le monde :
- Flux.1 [Pro] : Le caviar du lot. Si tu as un gros projet et un budget conséquent, cette version est pour toi. Elle est disponible via API. Une version récente Flux.1.1 [Pro] est désormais disponible.
- Flux.1 [Dev] : Une version open source pour les développeurs, les bidouilleurs, ceux qui aiment personnaliser leurs trucs sans casser la tirelire.
- Flux.1 [Schnell] : Une version léger « vite fait bien fait » accessible sous licence apache pour ceux qui veulent tester l'IA sans vendre un rein.
Sous le capot : Qu'est-ce qui rend Flux.1 si costaud ?
Sous son allure tranquille, Flux.1 embarque de la pure puissance. Imagine un Stable Diffusion mais sous stéroïdes :
Voici les points techniques qui font toute la différence :
- 12 milliards de paramètres : Un vrai mastodonte dans le domaine de la génération d'images IA. Plus il y a de paramètres, plus le modèle peut générer des images détaillées et répondre de manière précise aux requêtes complexes.
- Correspondance de flux : Une meilleure gestion des prompts, ce qui signifie que Flux.1 suit les instructions avec plus de précision pour ne pas surprendre avec des créations bizarres.
- Encodages positionnels rotatifs : Un peu de jargon technique pour dire qu'il comprend mieux les formes et géométries des objets. Fini les erreurs comme des mains à six doigts ou des chaises à trois pieds.
- Couches d'attention parallèles : Une architecture optimisée pour la rapidité. Plus besoin d'attendre une éternité pour obtenir des résultats de qualité.
Midjourney peut-il se faire du souci ?
Alors, Flux.1, le modèle qui alimente le générateur d'images controversé de Grok, l'assistant AI d'Elon Musk est-il vraiment un challenger2 crédible pour Midjourney ?
C'est là que ça devient intéressant.
Qualité d'image : coude à coude
Les deux modèles produisent des images époustouflantes, avec un sens du détail et une maîtrise des textures remarquables.
Flux.1 se distingue par sa capacité à :
- Créer des mains et des doigts réalistes et naturels.
- Reproduire avec fidélité et finesse des détails complexes.
- Représenter le texte dans les images. Il ne mélange pas les lettres.
Compréhension des prompts : Flux.1 a l'avantage
C'est sur ce terrain que Flux.1 pourrait bien faire la différence.
Par rapport à Midjourney, le modèle de Black Forest Labs respecte mieux les consignes données par l'utilisateur, même quand elles sont complexes ou nuancées.
Rapidité : Midjourney garde une longueur d'avance
Midjourney reste pour l'instant champion en termes de vitesse de génération.
Mais avec sa version « rapide », Flux.1 pourrait bien combler son retard dans un futur proche.
Accessibilité : Deux mondes différents
Midjourney est plus accessible au public puisqu'il s'utilise sur Discord ou via son interface web.
Flux.1, de son côté, prend un chemin plus technique, avec une approche open source sympa pour les développeurs, mais pas vraiment user-friendly pour tout le monde.
Et avec ses 24 Go de VRAM requis pour une utilisation optimale, autant dire que ce n'est pas à la portée de tous.
Comment accéder à Flux.1 ?
Heureusement, des solutions existent avec le cloud et des partenaires3 qui permettent de profiter de ce générateur d'images:
- Freepik : Si tu as un abonnement Premium, tu peux générer des images via Flux.1 Pro directement sur le site.
- Hugging Face : Pour les développeurs qui aiment mettre les mains dans le cambouis avec les versions Dev et Schnell.
- Together.ai : te permet d'accéder à toutes les versions de Flux.1, avec des crédits offerts à l'inscription, un bonus appréciable.
- Mystic.ai : Une autre plateforme qui permet de peaufiner les images avec la version Pro.
Midjourney : Un vrai challenger ou juste du bruit ?
Si on devait comparer Flux.1 à un restaurant à la mode, c'est celui dont tout le monde parle, avec des critiques élogieuses.
Mais, reste à savoir si ça tiendra dans le temps ou si c'est juste un coup de buzz.
Pour l'instant, il y a de solides arguments : qualité d'image, suivi des prompts, et gestion des détails. Cependant, la vitesse et l'accessibilité restent des terrains sur lesquels Midjourney conserve un avantage.
Si Flux.1 continue de s'améliorer, il pourrait bien se faire une place au soleil, mais pour l'instant, Midjourney n'a pas à trembler… encore.
Black Forest Labs4 ne compte pas en rester là. Leur prochain projet ? Rivaliser avec les meilleurs générateurs de vidéos du marché. Mais est-ce qu'ils réussiront encore à nous surprendre ou est-ce qu'ils commenceront à surjouer. L'avenir nous dira.
Références
- Stable Diffusion creators launch Black Forest Labs, secure $31M for FLUX.1 AI image generator.VentureBeat, du 21 Août 2024. Consulté le 1er Août 2024.
↩︎ - FLUX.1 vs MidJourney : découvrez le duel des meilleures IA d'images. LeBigData, du 21 Août 2024. Consulté le 22 Août 2024.
↩︎ - 5 plateformes pour tester Flux AI, la nouvelle alternative à Midjourney. BDM, du 19 octobre 2024. Consulté le 23 octobre 2024.
↩︎ - Announcing Black Forest Labs.Black Forest Labs, du 1er Août 2024. Consulté le 20 Août 2024. ↩︎