Okay Google !

mai 23, 2025

Salut les enthousiastes, les excités, les inquiets, les blasés, les rageux et tous les geeks qui liront cette 111ème édition de Générative.

Nous vous le disions la semaine dernière, tout était trop calme, cela cachait une tempête à venir.

La tempête de cette semaine s'appelle Google. La firme de Richmond a fait plusieurs annonces significatives lors de sa conférence annuelle I/O.

Parmi lesquelles Imagen 4 et Veo 3.

Alors ? ~~Evolution~~ ou Revolution ?

La réponse est dans la question.

Accrochez vos ceintures : après cette édition, la création audiovisuelle ne sera plus jamais la même.

🔹 Formez vous à l’IA avec moi !
J’aurai le plaisir d’animer une nouvelle session de formation à la génération d’images et vidéos à Paris, les 19 et 20 juin prochains. On espère y manipuler Google Veo 3 !
Vous pouvez me contacter pour les infos prigramme, tarif, etc…
Pour vous inscrire, c’est ICI.

🔷 Google strikes hard !
Comme on pouvait s’y attendre, lors de sa conférence annuelle I/O, les annonces et nouveautés de Google tournaient essentiellement autour de l’IA.
Si Gemini s’infiltre peu à peu dans tout l’écosystème Google, les news qui ont retenu notre attention étaient bien sûr à trouver du côté de la génération d’image et de vidéo.

🔹 Imagen 4 – Génération d’images plus détaillées, mais pas toujours cohérente
Côté images, la nouveauté s’appelle Imagen 4. Elle est déjà disponible en France, notamment chez Seelab et Freepik.
Cette 4e mouture est censée surpasser Imagen 3 dans tous les domaines clés : vitesse de génération, compréhension du langage, précision du rendu. Dans les faits, nous avons trouvé la cohérence inégale : Meilleur qu’Imagen 3 pour la génération de typo mais pas forcément globalement meilleur.

A gauche Imagen 3, à droite Imagen 4, sur un prompt de mon talentueux ami Jean-Michel Falciasecca

🔹 Flow – Studio IA tout-en-un pour vidéastes
Flow réunit Veo (vidéo), Imagen (visuel) et Gemini (narration) dans un seul outil de création. Il permet de créer des clips scénarisés avec audio intégré, scènes récurrentes, personnages cohérents (comme dans Gen-4 Reference) et narration pilotée par prompt. Interface fluide, références d'entités et timeline facilitent le montage. Pour les créateurs visuels, Flow agit comme un studio virtuel modulable, pilotable à la voix ou au texte. Officiellement indispo encore en Europe.

🔹 Veo 3 – Le changement de paradigme
Depuis que je suis l’actualité de l’IA générative, il y a peu d’innovations qui m’ont chamboulé. En regardant en arrière, il y a eu :
- la V5 de Midjourney qui était une progression spectaculaire par rapport à la v4
- la première démo de Sora mi-février 2024
- les premières démos de Veo2

Depuis mardi soir, mes feeds Linkedin, Instagram et X sont remplis de vidéos généres avec Veo 3. Certaines me sidèrent littéralement.

Mais avant de creuser le sujet, quelques vidéos démo.
Dans la vidéo ci-dessous, les personnages et leurs voix ont tous été générés avec Veo 3 :

Regardez cette vidéo, on dirait un vrai reportage. les attitudes des “gens” sont assez sidérantes de réalisme :

Tout cela me fascine autant que ça m'effraie.
Regardez également cette vidéo de Laszlo Gaal :

Pourquoi filmer quelqu’un si, à partir de sa photo et de son témoignage écrit, je peux générer une interview crédible, sincère en apparence, émotionnellement juste ?

Que devient la captation réelle dans ce contexte ?
Quelle valeur donner à la réalité lorsqu'elle peut être reproduite de manière si troublante ?
Si la vidéo générée devient indiscernable d’un témoignage capté, la vérité devient-elle une esthétique plutôt qu'une preuve ?

Vous l’aurez compris, Veo 3 me questionne beaucoup.
D’autres clips pour la route…

🔹 Weavy – Plateforme créative IA modulaire
Weavy ai est un outil en bêta privée qui combine des modèles IA pour générer textes, images et vidéos via une interface ”nodes”. Il prend en charge des modèles comme Ideogram, Imagen, Runway ou Veo. L’interface est simple, les rendus rapides et les workflows personnalisables. Inscription sur liste d’attente : weavy.ai.

🔹 Comfy Vibe Coding – Automatisation créative
ComfyUI évolue en un agent universel d'automatisation, transformant les idées en logiciels grâce à l'IA. Cette approche vise à simplifier la création de contenu en automatisant les tâches répétitives.

🔹 Hedra
Hedra Studio propose désormais de sélectionner la personne qui parle dans une vidéo grâce au nouvel outil de sélection de visage. Il suffit de faire glisser le sélecteur vers la face droite et de générer. Comparé à toutes les vidéos Veo 3 qu’on voit depuis quelques jours, ça nous fait tout de suite moins d’effet.

🔹Freepik Throwback
A l’occasion de son “upscale conference”, Freepik a publié cette vidéo qui revient sur TOUTES les innovations et intégrations d’outils IA sur la plateforme. Regardez, ça donne le tournis :

🔹 Arcana – Court-métrage généré par IA
"Echo Hunter" est un court-métrage techniquement prometteur, entièrement généré par IA, réalisé par le talentueux Kavan The Kid et produit par Arcana et Phantom X. Sa sortie est prévue le 27 mai, mettant en vedette des acteurs comme Breckin Meyer et Danielle Bisutti.

🔹 Viggle Live – Vidéo IA en temps réel
Viggle Live permet de générer des vidéos en temps réel en capturant les mouvements via webcam. Applications : V-tubing, prévisualisation VFX, réunions avec avatar IA. Un mois d'accès gratuit est offert pour le lancement. Disponible sur viggle.ai/live.

🔹 FLUX – Intégration dans Azure AI Foundry
Les modèles FLUX, reconnus pour leur génération d'images efficace, sont désormais intégrés aux offres de Microsoft dans Azure AI Foundry, renforçant leur position dans la génération de médias.

🔹 Flora – Cohérence des personnages avec LoRA
Flora permet de maintenir la cohérence des personnages en entraînant un LoRA personnalisé sur fal.ai et en l’important sous fichier .tensor pour générer des images et vidéos dans un style uniforme. Toujours avec un système de nodes qui rappelle Comfy dans une version plus digeste.

Avis de Caro : Attention avec les 500 crédits d’entrée, cet entrainement vous en coûtera 420. Pas quoi aller très loin dans le workflow par la suite mais des options intéressantes pour conserver la consistance produit sur un packshot par exemple. (comme ici dans l’exemple de Gizem Akdağ)

🔹 ImagineArt Shorts – Génération de vidéos sans visage
ImagineArt propose "Imagine Shorts", permettant de créer des vidéos sans visage à partir d'une simple invite. Fonctionnalités : narration stylisée, clips B-roll générés par IA, et styles variés comme Ghibli ou Claymation. Essayez sur bit.ly/4dul1xd.

🔹 Udio – Disponibles sur l'App Store
Udio, une application de création musicale par IA, est désormais disponibles sur l'App Store.

🔹 Le petit poucet Letz AI n’est pas mort, il bouge encore
Letz AI a fort à faire face à la concurrence. Il propose la fonctionnalité "Fix Skin" pour améliorer les détails de la peau sur les portraits IA, réduisant l'aspect plastique. Il esty possible d'inclure ou d'exclure des zones spécifiques comme les yeux ou la bouche. Disponible sur letz.ai.

🔹 StableGen – Texturation 3D automatisée
StableGen est un plugin open-source pour Blender qui applique automatiquement des textures réalistes à des objets 3D en un clic, simplifiant le processus de texturation.

🔹Curious Refuge - Une bande-annonce de jeu vidéo sans moteur de jeu
Un tutoriel explique comment réaliser une bande-annonce de jeu vidéo sans coder ni utiliser de moteur. À partir d’un thème viking, Ludovit Nastisin combine MidJourney pour les visuels (cartes, sprites), Freepik, After Effects pour l’animation et Photoshop pour les finitions. Attention : pas de 3D et des personnages séparés du décor pour un rendu cohérent et une animation fluide.

🔹Krea.ai – Animation labiale avec Hedra
Krea.ai a été dans les premiers à avoir annoncé l’intégration de Imagen 4 après les annonces Google cette semaine. Et vendredi dernier, leur nouvelle fonction lipsync basée sur Hedra pour générer une vidéo à partir d’une image et d’un texte ou audio, est sortie juste après notre édition précédente ! Bienvenue dans le monde du FOMAI (ndlr : Fear Of Missing Out AI )! A tester sur : krea.ai/lipsync

🔹 Stable Video 4D 2.0 – Amélioration des vidéos 4D
Stability AI a mis à jour son modèle Stable Video Diffusion en version 4D 2.0, améliorant la qualité des sorties 4D générées à partir de vidéos centrées sur un objet unique.

🔹 Google Vids – Avatars IA pour vidéos
Google Vids introduira bientôt des avatars IA capables de livrer des scripts écrits par les utilisateurs, facilitant la création de contenus vidéo professionnels pour des présentations ou des annonces. Plus d'informations sur goo.gle/3S4OIuY.

🔹 L’Agent 007 is back
Un face-à-face inattendu signé Fredrik Sargent alias Artaifx : Pierce Brosnan contre Jeff Bezos, dans ce trailer 100 % IA généré avec Veo3
. Les avis sont partagés sur X et TikTok.

Vous en pensez quoi vous, on achète ?

L’autre pépite de la semaine, c’est “Donclave”, réalisé par Ari Kischner.
Donald Trump au Vatican, un sujet original et très bien réalisé :

Cette édition est terminée, merci de l’avoir lue jusqu’ici ! Si elle vous a plu, vous pouvez la partager en cliquant juste ici :

Partagez Generative

Vous pouvez également me suivre sur LinkedIn et activer la cloche 🔔, je poste régulièrement sur l’intelligence artificielle générative. Vous pouvez également me contacter pour toute proposition de création, intervention, conférence, projet, formation liée à l’intelligence artificielle générative.

Et n’oubliez pas de vous abonner pour ne rien rater des prochaines éditions 👇