Et l'IA Krea 2

mai 15, 2026

Salut les vacanciers, bienvenue dans cette 156e édition de GENERATIVE. De bonnes news cette semaine, à commencer par la sortie d’un nouveau modèle de génération d’images avec lequel il faudra désormais compter !

Temps de lecture : 6mn45 environ

Si vous ne deviez retenir que 3 infos cette semaine :

1 - Krea.ai sort le modèle Krea 2

2 - Google Deepmind leak “Gemini Omni”, qui préfigure Veo 4

3 - Runway a lui aussi sorti son agent !

On vous raconte tout en détail, c’est parti, let’s go !

Si tu es nouveau par ici, je suis Gilles Guerraz, réalisateur publicitaire devenu expert en outils créatifs GEN AI. J’ai fondé NEXTREND, organisme de formation spécialisé en outils créa IA et BANGGER, société de production audiovisuelle IA et hybride.

Avec Caroline Thireau (AI Creative Technologist), nous te proposons une plongée hebdomadaire dans la marmite bouillonnante de l’actualité de l’IA générative !

Si on t’a transféré cette lettre, abonne-toi en un clic ici.

Ma prochaine session de formation CPF aura lieu à Paris le 28 et 29 mai prochains !

Si ce n’est pas déjà fait, tu peux aussi :

Découvrir mes formations IA pour les créateurs, 100% finançables par le CPF. Les inscriptions se font ici.
Former tes équipes à l’IA générative grâce à nos formations entreprise finançables par ton OPCO
Nous contacter directement pour discuter de ton projet IA générative
Me suivre sur LinkedIn, YouTube ou TikTok pour ne rien rater.

Et c’est parti ! 🚀

🔹 Krea 2
Krea 2 est le premier modèle image développé en interne par Krea. Il se positionne comme un foundation model pensé pour la direction artistique plutôt que pour le simple prompt texte.

Son point fort est le style control : l’utilisateur peut guider les rendus avec des références visuelles et des moodboards pour cadrer palette, texture, composition, ambiance et langage graphique, comme dans Midjourney. Mais K2 propose une adhérence au prompt supérieure à celle de MJ, avec de belles surprises dès qu’on commence à générer à partir d’un moodboard cohérent.
Voilà ce que j’ai obtenu à partir d’un moodboard basé sur des images anamorphiques :

On pourrait les croire extraites d’un film d’espionnage des années 70 ! Je suis très fan des rendus, même si je dois reconnaitre avoir obtenu pas mal de déchets dans mes tentatives.

D’un point de vue technical specs, Les générations sont annoncées en 15 secondes ou moins.

Les moodboards Krea expliqués :

Caro a fait un comparatif avec 3 autres modèles par ici.

🔹 Gemini Omni : nouveau modèle vidéo qui annonce Veo 4 ?
Des rumeurs autour de Veo 4 circulent, mais c’est Gemini Omni qui a été leaké le 1er, en attendant une plus grosse annonce. Google met en avant la cohérence du texte à l’image et la lisibilité des éléments affichés, un point encore fragile dans beaucoup de vidéos générées. La riposte est en marche.

Attention aux faux raccords de spaghetti !

🔹 Ponder : agent de montage vidéo
Ponder se présente comme un éditeur vidéo “agentique”, pensé pour faire collaborer des agents créatifs et des humains dans le process chronophage du montage de films. L’annonce mentionne aussi une levée pre-seed de 2,5 M$, menée par Liu Jiang de Sunflower, avec plusieurs investisseurs et créateurs cités. On a hâte de tester.

🔹 VEED & API de sous-titres automatiques
VEED développe son offre autour de l’automatisation vidéo avec une API dédiée aux sous-titres. L’objectif est de générer et intégrer des sous-titres directement dans des workflows, sans montage manuel. La qualité reste à surveiller : précision de transcription, ponctuation, rythme, lisibilité, placement du texte et rendu visuel.

🔹 Viggle PINOC
Avec PINOC, Viggle lance un outil de mocap (motion capture) à partir d’une simple vidéo de mouvement. Objectif : récupèrer une animation de squelette en .fbx ou .glb, exploitable dans Blender, Maya ou un pipeline 3D classique. L’outil ajoute aussi un import d’image de personnage pour générer un modèle en 3D Gaussian Splatting et prévisualiser l’animation dessus.

Avis de Caro : Intéressant de voir comment les techniques 3D s’utilisent de plus en plus pour donner de la consistance et une notion de gravité à certaines gestuelles.

🔹 Runway Agent & son assistant créatif
Runway présente Runway Agent, un assistant IA conçu pour aider à concevoir et produire des vidéos à partir d’une conversation. En 2 mots, Runway suit la tendance Agentique.

On salue le génie stratégique de Runway qui, ne pouvant lutter sur le terrain de la puissance des modèles, recentre ses efforts sur la construction d’un écosystème ergonomique et performant, qui intègre les modèles les plus performants du marché.

🔹 Higgsfield Supercomputer
Higgsfield vient de lancer Supercomputer. Un agent IA qui unifie tous les modèles, outils et flux de travail créatifs en un seul système. Il peut rechercher, écrire, concevoir, générer des vidéos et déployer des campagnes de bout en bout. Génial sur le papier. Dans les faits, qui testera saura.

🔹 Topaz : Speed Update avec NeuroStream 2
Topaz annonce une mise à jour centrée sur la vitesse. NeuroStream 2 (une technologie logicielle propriétaire d’optimisation de l’inférence IA qui réduit fortement l’usage de VRAM et accélère l’exécution locale des modèles sur des machines existantes) permet de rendre les images localement jusqu’à 4 fois plus vite. La version ajoute aussi Face Recovery 3, un sharpening sensible au bruit, de nouveaux modèles pour AMD et Mac, ainsi qu’un plugin Nuke.

Topaz cette semaine, c’est également l’ajout d’une extension UXP pour Adobe Premiere. Elle permet d’envoyer des clips vers le traitement cloud Topaz sans quitter Premiere, pour l’upscale, la réduction de bruit, le ralenti et l’interpolation d’images. Les clips améliorés reviennent automatiquement sur une nouvelle piste dans la séquence.

🔹 ElevenCreative Templates
ElevenCreative ajoute des Templates, des workflows créatifs préconfigurés pour produire plus vite des assets. On importe un contenu, choisit un template, puis on génére des packshots, mockups, transferts de style ou character sheets… sans reconstruire tout le workflow à chaque fois.

Avis de Caro : Depuis la sortie de ElevenCreative, le suite continue à délivrer régulièrement des nouveautés pour faciliter la duplication de workflows.

”

🔹 L’Oréal Luxe x DATALAND
L’Oréal Luxe collabore avec DATALAND, le musée d’art IA fondé par Refik Anadol et Efsun Erkılıç, pour l’exposition Machine Dreams: Rainforest à Los Angeles le mois prochain. Le projet associe visualisation de données par IA et création olfactive humaine. Les parfumeurs L’Oréal ont conçu 12 « senteurs vivantes » qui réagissent en temps réel aux œuvres.

🔹 ImagineArt : Campaign Director
ImagineArt lance Campaign Director, un système qui transforme un brief, une photo produit ou un moodboard en “vidéo de campagne” exportable en MP4. Le résultat final ressemble davantage à du snack content qu’à une vidéo de campagne digne de ce nom, mais l’automatisation est clairement la tendance 2026.

🔹 Recraft modèle V4.1
Recraft lance V4.1 dans Recraft Studio. Le modèle propose des images plus photoréalistes, avec des rendus humains plus naturels, des dégradés plus travaillés et de nouveaux styles d’illustration. (Egalement dans le test comparatif de Caro)

Avis de Caro : un modèle qui a son propre ADN et qui propose un style vraiment intéressant (également dans le test comparatif cette semaine).

🔹 Omma AI et 3D interactive par IA
Un chien 3D complet a été généré par IA, avec squelette, organes et rig. Le modèle réagit au curseur en temps réel grâce au suivi de la tête et au mouvement de la queue. Le workflow combine GPT Images 2 pour garder une cohérence visuelle, puis Omma AI pour créer le maillage 3D et le code en Three.js.

🔹 FLORA : node sharing
Flora ajoute le partage de nœuds dans ses workflows. La fonction permet d’envoyer un seul élément d’une toile (prompt, image, génération, étape technique ou choix visuel) sans partager tout le pipeline.

Avis de Caro : un intérêt surtout collaboratif pour partagés des éléments ciblés tout en gardant le contrôle sur le reste du projet.

🔹 LTX Studio vidéo en vidéo
LTX Studio ajoute du video-to-video avec LTX-2.3. L’outil permet de conserver la pose, la profondeur ou les contours d’une vidéo de référence, puis de changer le décor, le personnage ou le produit avec une image de départ et un prompt… même principe que Kling Motion Control. LTX recommande une image d’entrée identique, en 1080p maximum, avec des sujets humains pour mieux détecter les poses.

🔹 Zombie Scavenger
Ce court-métrage IA réalisé par un mystérieux Artiste IA chinois adopte les codes du film post-apocalyptique sous influence Fallout. Le film a été très remarqué sur les réseaux non seulement pour ses qualités techniques mais aussi pour la qualité de son découpage et de sa réalisation. On vous laisse juger.

Pour la version non censurée, ce sera par là :

Cette édition est terminée, merci de l’avoir lue jusqu’ici ! Si elle vous a plu, vous pouvez la partager en cliquant juste ici :

Partagez Generative

Vous pouvez également me suivre sur LinkedIn (Caroline est par ici) et activer la cloche 🔔, je poste régulièrement sur l’intelligence artificielle générative. Vous pouvez également me contacter pour toute proposition de création, intervention, conférence, projet, formation liée à l’intelligence artificielle générative.

Et n’oubliez pas de vous abonner pour ne rien rater des prochaines éditions 👇

Generative

Discussion à propos de ce post

Tout à fait prêt. Qu'avez-vous pour moi ?