Des images et des agents
Salut les cyborgs, bienvenue dans cette nouvelle édition de GENERATIVE. Cette semaine, ça bouge pas mal du côté de la génération d’images et de l’agentique. Avec Caro, on vous raconte tout ce que vous devez savoir, maintenant !
Si vous ne deviez retenir que 3 infos cette semaine :
1 - Magnific sort Agents
2 - Ideogram 4 est sorti
3 - Reve 2.0 génère en 4K
On vous raconte tout en détail, c’est parti, let’s go !
Let’s go !
Si tu es nouveau par ici, je suis Gilles Guerraz, réalisateur publicitaire devenu expert en outils créatifs GEN AI. J’ai fondé NEXTREND, organisme de formation spécialisé en outils créa IA et BANGGER, société de production audiovisuelle IA et hybride.
Avec Caroline Thireau (AI Creative Technologist), nous te proposons une plongée hebdomadaire dans la marmite bouillonnante de l’actualité de l’IA générative !
Si on t’a transféré cette lettre, abonne-toi en un clic ici.
Ma prochaine session de formation CPF aura lieu à Paris les 8 et 9 juillet prochains ! Toutes les infos sont ICI
Si ce n’est pas déjà fait, tu peux aussi :
Découvrir mes formations IA pour les créateurs, 100% finançables par le CPF. Les inscriptions se font ici.
Former tes équipes à l’IA générative grâce à nos formations entreprise finançables par ton OPCO
Nous contacter directement pour discuter de ton projet IA générative
Me suivre sur LinkedIn, YouTube ou TikTok pour ne rien rater.
Et c’est parti ! 🚀
🔹 Agents, MCP et Flows pour la création collaborative dans Magnific
Magnific (Freepik) annonce Agents, MCP et Flows, dans la continuité de ses Spaces. L’enjeu n’est pas seulement une solution agentique mais aussi la structuration du travail créatif en équipe comme annoncé lors de l’Upscale Conf à San Francisco cette semaine : organiser les étapes, automatiser certaines actions et collaborer autour de workflows partagés.
🔹 Ideogram 4.0 en 2K
Ideogram 4.0 débarque avec :
- une résolution native 2K
- un meilleur rendu typographique
- la prise en charge des prompts JSON.
Fidèle à ce qui le démarque, ce modèle vise surtout les usages centrés autour du texte : affiches, visuels de marque, mockups ou compositions graphiques.
Cette version 4.0 est aussi présentée comme un modèle image ouvert, poids téléchargeables, fine-tuning possible sur ses propres données et exécution sur son propre matériel.
Déjà disponible sur plusieurs plateformes dont Krea, Flora et Leonardo entre autres pour tester par vous-même.
🔹 Reve 2.0 en 4K
Reve 2.0 est présenté comme un modèle image 4K pour générer et éditer des visuels à partir de layouts précis. Gros point fort sur le contrôle de composition.
Avis de Caro : Au delà de la très bonne qualité éditoriale 4K, c’est le système de layers/objets éditables (qu’on voit en dessous) qui offre un vrai plus pour sélectionner, déplacer, redimensionner et reprompter n’importe quel élément individuellement sans régénérer l’image entière.
🔹 Octo Dreamina
Dreamina sort ce quils appellent “le compagnon parfait pour Seedance 2.0 “ : Dreamina Octo, un agent IA. A vous la Vibe Creation.
🔹 Grok Imagine 1.5 Preview
Grok Imagine 1.5 Preview est annoncé disponible dans Runware et via l’API de xAI. Gilles a testé, c’est plutôt pas mal :
🔹 ElevenCreative &Flows Agent
ElevenLabs lance Flows Agent, un agent qui crée un workflow complet à partir d’une simple description : c’est la grande tendance du moment.
Avis de Caro : une belle évolution de la plateforme nodale d’ElevenLabs depuis les beta lors de l’événement du Théâtre de l’IA il y a quelques mois.
🔹 Krea 2 : cohérence de style avec références et moodboards
Krea 2 met en avant sa version Turbo qui vise surtout l’itération rapide, avec références de style et cohérence visuelle.
Krea 2 Turbo arrive aussi sur Fal et Flora avec un positionnement orienté concept art, mode et éditorial.
Avis de Caro : à travers mes tests, l’option Medium offre souvent une meilleure adhérence que la version Large.
🔹 Fal et NVIDIA Cosmos3-Super
NVIDIA s’associe aussi à Fal en y proposant Cosmos3-Super. On sait que ce modèle de génération d’images s’inscrit dans le cadre des “world models” Cosmos de Nvidia, réunissant des outils de raisonnement visuel, de modélisation du monde et de prédiction d’actions. Mais bon… je vous laisse juger la qualité des images dans la vidéo ci-dessous :
🔹 Plugins créatifs Fal dans OpenAI Codex
Fal lance “Assets”, une bibliothèque pour regrouper images, vidéos, fichiers audio et modèles 3D créés sur la plateforme grâce à une recherche sémantique sur les assets et formats. Fal devient aussi partenaire de lancement des nouveaux plugins métier dans OpenAI Codex. L’intégration permet d’utiliser modèles, assets et workflows fal directement dans une session Codex.
🔹 Motionfly Editor
Motionfly Editor est présenté comme un éditeur vidéo piloté par agents IA, dans l’esprit d’un “Cursor pour le montage”. Il promet d’ajouter zooms, motion design, B-roll, sous-titres, coupes des blancs, détection de hooks et styles de montage viraux.
🔹 Martin Scorsese conseiller créatif deBlack Forest Labs FLUX
Le buzz de la semaine, c’est Black Forest Labs qui accueille Martin Scorsese. L’icône semble découvrir l’intérêt de la génération d’images en tant qu’outil de prévisualisation de ses plans.
Peut on y voir un signal fort envoyé à l’industrie du cinéma ? Vous avez deux heures.
🔹 TwelveLabs Rodeo
TwelveLabs Rodeo est un copilote vidéo capable d’analyser les rushes en comprenant l’image, le son et le contexte. Il permet de retrouver un moment à partir d’une description en langage naturel, puis d’assembler des extraits en pré-montage exportable vers Premiere, Final Cut Pro ou DaVinci Resolve. A tester par ici.
🔹 Dernières fonctionnalités Lovart AI
Lovart présente trois fonctions pour aider les petites équipes à produire une identité visuelle plus cohérente : Brand Kit pour verrouiller les styles, Font Generator pour créer une typographie, et Create Skill pour transformer des échanges efficaces en workflows réutilisables.
🔹 frame.md : vidéo et motion design
frame.md de Heygen est présenté comme une feature pensée pour les agents vidéo et motion design avec pour mission de traduire une charte visuelle en règles animées : rythme, cadrage, mouvement, style graphique et cohérence de marque.
🔹 UTOPAI PAI 2.0
PAI 2.0 est le modèle vidéo d’Utopai pensé pour maintenir le contexte narratif et la cohérence des personnages sur des séquences étendues. Le point intéressant : le modèle ne traite pas seulement l’apparence mais également tout le contexte.
🔹 HeyGen Cinematic Avatar API
HeyGen annonce l’API Cinematic Avatar. Elle permet de conserver la ressemblance d’un avatar tout en ajoutant une mise en scène plus cinématique, intégrable dans un pipeline vidéo via un agent de code.
🔹 Plugin Higgsfield Figma
Après Adobe la semaine passée, Higgsfield lance son plugin Figma pour générer des images, créer des SVG, produire des mockups, détourer des fonds, appliquer des étalonnages et remplacer des visages avec conservation de la scène.
🔹 P-Video-Replace
Pruna AI revient cette semaine avec P-Video-Replace pour cette fois-ci remplacer un personnage dans une vidéo existante à partir de 1 à 4 images de référence et d’un prompt, en 720p et 1080p.
Et c’est déjà dans Scenario et Runware.
Chez WaveSpeed ils intègrent à peine le P-Video-Animate de la semaine dernière.
🔹 AI Studio Hasbro
Hasbro préparerait un AI Studio permettant à des entreprises de licencier ses personnages pour créer des contenus avec IA. L’annonce suggère une approche encadrée autour de ses franchises. Article complet ici.
🔸 ByteDance Bernini : génération et édition vidéo open source
ByteDance présente Bernini comme un framework open source de génération et d’édition vidéo. Une alternative à Gemini Omni ?
🔹 Deutsche Telekom
La pépite de la semaine est cette pub pour Deutsche Telekom réalisée par Simon Meyer. J’ai particulièrement apprécié le soin apporté au découpage.
Cette édition est terminée, merci de l’avoir lue jusqu’ici ! Si elle vous a plu, vous pouvez la partager en cliquant juste ici :
Vous pouvez également me suivre sur LinkedIn (Caroline est par ici) et activer la cloche 🔔, je poste régulièrement sur l’intelligence artificielle générative. Vous pouvez également me contacter pour toute proposition de création, intervention, conférence, projet, formation liée à l’intelligence artificielle générative.
Et n’oubliez pas de vous abonner pour ne rien rater des prochaines éditions 👇







