WE ARE BANANAS !
Salut mes petites nano bananes, cette semaine est placée sour le signe de la sortie de la 2e version du générateur d’images de Google, j’ai nommé “Nano Banana Pro”.
On vous en parle en détails, de ça et de tout le reste.
Black Friday oblige, n’hésitez pas à faire le tour des popotes de TOUS vos éditeurs préférés, certains vont vous faire des offres que vous ne pourrez pas refuser.
Let’s go !
Si tu es nouveau par ici, je suis Gilles Guerraz, réalisateur publicitaire devenu expert en outils créatifs GEN AI. Avec Caroline Thireau (AI Creative Technologist), nous te proposons une plongée hebdomadaire dans la marmite bouillonnante de l’actualité de l’IA générative !
Si on t’a transféré cette lettre, abonne-toi en un clic ici.
Ma prochaine session de formation CPF aura lieu à Paris les 18 et 19 décembre prochains !
Si tu es salarié.e ou indépendant.e, et que tu souhaites monter en compétence sur la génération d’images et de vidéo, tu es le/la bienvenue.e !
La session est 100% finançable par le CPF. Les inscriptions se font ici.
Si ce n'est pas déjà fait, tu peux aussi :
Découvrir mes formations IA pour les créateurs, 100% finançables par le CPF. Les inscriptions se font ici.
Former tes équipes à l'IA générative grâce à nos formations entreprise finançables par ton OPCO
Nous contacter directement pour discuter de ton projet IA générative
Me suivre sur LinkedIn, YouTube ou TikTok pour ne rien rater.
Et c'est parti ! 🚀
🔹 NANO BANANA PRO
Sorti officiellement jeudi dans l’après midi, il a enflammé les internets, impressionnant par ses capacités techniques et son impressionnante adhérence au prompt.
Si Midjourney demeure le King de l’esthétique, vous pourrez désormais faire “tout le reste” avec Nano Banana Pro.
Basé sur Gemini 3, le modèle impressionne par sa compréhension fine, et par sa capacité à générer tous types de contenus visuels. Il génère et édite en 1K, 2K et 4K, vous pouvez varier les angles, modifier la lumière, le cadre , etc… avec un prompt simple, créer des infographies, des carrousels, des typographies…
Et comme à chaque game changer, la course à l’intégration a repris de plus belle
🔹 Intégration des bananes au carré
Freepik active Nano Banana Pro avec 1 semaine d’illimité sur les sorties 1K et 2K ; la 4K reste à crédits. Accès réservé aux plans Premium+ et Pro.
🔹 Adobe grand seigneur
Dans Firefly, Nano Banana pro est illimité jusqu’au 14 janvier.
🔹 Pletor
Selon les Frenchies de Pletor, qui met à disposition un benchmark spécifique sur Nano Banana 2, c’est sa capacité à reformater des publicités entières avec texte multilingue sans erreurs qui fait la différence. On a vu des stagiaires moins fiables.
Higgsfield propose l’accès complet au modèle, incluant 4K illimitée, avec une forte réduction tarifaire de 70% et génération sans limite de volume. Vraiment ?
Egalement disponible sur :
• Minimax :
Letz AI :
• Weavy :
🔹 NANO BANANA PRO ID
Sirio Berati, de Enhancor, a publié un post indisuant que NBP lui avait généré un faux document d’identité en déduisant âge, nationalité et couleurs officielles sans détails fournis. Le système semble avoir utilisé des informations web via recherche intégrée, y compris via API. On a fait nos classe à Générative, on a testé pour vous.
On vous laisse admirer le résultat :
Non, l’IA ne mettra pas tout de suite les faussaires au chômage.
🔹 SIMA 2 : Agent 3D interactif
Google Deepmind toujours ! SIMA 2 est un agent capable d’interagir dans des environnements 3D en comprenant texte, voix et images. Alimenté par Gemini, il exécute des actions plus complexes et réagit aux changements de scène. Cette version se rapproche d’un véritable assistant capable d’agir dans des mondes virtuels en continu.
🔹 HIGGSFIELD : bad taste
Autant on aime bien les features d’Higgsfield, comme cette nouvelle fonctionnalité qui transforme une simple URL produit en contenu vidéo publicitaire. Autant on n’aime pas leur communication délibérément clivante.
Avis de Caro : peut être qu’un bon brief avec des équipes reste nécessaire pour éviter ce genre d’erreur.
… et récidive !
Effet d’annonce ou réel, repenti, 2 jours plus tard une nouvelle communication était partagée sur les réseaux. Un goût douteux semble devenir la marque de fabrique de leur stratégie de communication.
🔹 LEONARDO : Imagination Fund et artistes sélectionnés
Autre ambiance, Leonardo parie sur cinq artistes pour montrer ce que l’IA peut inspirer plutôt que remplacer. Des projets singuliers, un peu surréalistes, qui rappellent qu’il reste des gestes humains derrière les modèles.
🔹 IMAGINEART 1.5 : Classé #3 au LMArena
ImagineArt 1.5 atteint la troisième place mondiale en photoréalisme et la sixième place globale en génération image selon Artificial Analysis. Le modèle dépasse plusieurs solutions reconnues comme Midjourney V7 , Firefly 5 ou Imagen 4. L’équipe souligne avoir atteint ces résultats avec une structure légère et autofinancée.
(Note de Gilles : je n’ai jamais compris les critères de ce classement dans lequel Midjourney occupe toujours une place hors du top 10 alors que c’est lui le King de l’esthétique)
🔹 FLORA v2
Flora lance sa V2…
Et guess what ? La plateforme intègre aussi Nano Banana Pro pour renforcer la stabilité d’identité, la cohérence spatiale et la continuité entre plusieurs images.
🔹 ELEVEN LABS : Image & Vidéo unifiés
ElevenLabs réunit dans une seule interface ses modèles audio et des modèles image/vidéo comme Veo, Sora, Wan et Seedance. On peut générer un visuel puis ajouter voix, musique ou effets sonores sans changer d’outil. La plateforme applique une réduction de 22 % pendant une semaine sur la génération multimédia !
Avis de Caro : pas étonnant ce revirement, mais un discours complètement différent de ce qu’ils prônaient à Vivatech 2025 ! Auraient-ils succombé au FOMO ?
And guess what ? Ils ont Nano banana 2 :
🔹 PIXVERSE V5 Fast
PixVerse améliore la vitesse de génération vidéo jusqu’à 40 %, tout en conservant la même qualité. Un clip 1080p peut être rendu en moins de 43 secondes (et pas 44 !!), ce qui réduit considérablement les temps d’attente pour les tests rapides. Le modèle reste compatible avec les workflows existants.
🔹 EasyPeasyEase
Cette application gratuite permet de moduler automatiquement la vitesse d’une vidéo en entrée et en sortie. Tout est traité localement dans le navigateur, ce qui convient aux créateurs utilisant des boucles IA ou des plans courts.
A tester ici si vous êtes courageux : on n’a trouvé ça pas très convaincant.
🔹 Prototype d’une app nodale
En utilisant Gemini 3 Pro dans AI Studio, Tianyu Xu détourne Gemini 3 pour créer un prototype d’app nodale en quelques minutes. L’application propose des nodes texte/image, de la génération, de l’édition et un outil de recadrage pour maintenir des ratios adaptés aux modèles vidéo. (Caro est clairement jalouse !)
🔹 OpenArt : Upscaling Generalist V2
Cette nouvelle version améliore la stabilité au-delà de 4K grâce à DyPE, qui aide le modèle à mieux interpréter les grandes structures. Une LoRA SRPO ajoute des micro-détails sans dégrader l’image. Les sous-graphes sont réorganisés pour une utilisation plus simple dans ComfyUI. Dispo par ici.
🔹 VEED Background Expand vidéo jusqu’à 1 minute
VEED.IO propose un outil qui étend automatiquement les bords d’une vidéo pour changer son format sans recadrage. Les créateurs peuvent ainsi adapter un même contenu à différentes plateformes sans perdre d’informations. L’entreprise fournit aussi un guide gratuit pour accompagner cette fonction.
🔶 CÔTÉ OPEN SOURCE
🔸 META : SAM 3D
Meta publie SAM 3D, un système open source capable de reconstruire objets et corps à partir d’images 2D. Les modèles fournissent des volumes utilisables en AR, design ou visualisation. Le rig Momentum Human est distribué sous licence Apache-2, pour simplifier la pose, le montage et l’animation. Pour en savoir plus, c’est par ici.
🔸 Workflow de la semaine : 3D x IA
Un workflow hybride combine volumes 3D pour définir la structure et IA pour générer textures, atmosphère, animation et lumière. Cet exemple du T-Rex montre un rendu réaliste obtenu rapidement grâce à ComfyUI. Stéphane Davi finalise ensuite l’image pour stabiliser l’ensemble et lui donner un aspect cinématographique.
🔸 QWEN Edit 2509 : Rééclairage multi-angles
Qwen Edit 2509 permet de rééclairer une scène à partir d’une carte de luminance externe, avec des angles variés (face, côté, dessus). Le modèle se base sur Qwen Edit Plus et utilise la carte comme profondeur pour appliquer l’éclairage, ce qui rapproche le procédé d’un ControlNet dédié. Démo ici.
🔸 WAN 2.2 Holo-Cine
Merci à notre camarade NebSh d’avoir partagé les infos sur Holo-Cine, fine-tune de Wan 2.2 qui améliore la cohérence entre plans, la continuité émotionnelle et la compréhension des instructions cinématographiques. Le modèle maintient personnages et environnements sur plusieurs plans et produit des séquences plus fluides que la plupart des alternatives open source actuelles. Infos disponibles sur Github.
🔸 Time-to-Move
Arcade introduit une méthode où l’utilisateur trace approximativement un mouvement pour guider l’animation générée. Le système utilise ce geste pour ajuster les déplacements de caméra ou d’objets tout en conservant l’aspect de la scène. Cette approche fonctionne sans réentraînement mais semble encore à affiner. Accessible sur Github.
Les Ressources Humaines Strike Back
Stefan Busser, réalisateur et artiste 3D connu sous le nom de SAV, nous a gratifié de ce fan film Star Wars ultra réaliste et surtout très drôle.
Il confesse avoir utilisé Kling 2.5 et Veo 3.1, regardez :
Cette édition est terminée, merci de l’avoir lue jusqu’ici ! Si elle vous a plu, vous pouvez la partager en cliquant juste ici :
Vous pouvez également me suivre sur LinkedIn (Caroline est par ici) et activer la cloche 🔔, je poste régulièrement sur l’intelligence artificielle générative. Vous pouvez également me contacter pour toute proposition de création, intervention, conférence, projet, formation liée à l’intelligence artificielle générative.
Et n’oubliez pas de vous abonner pour ne rien rater des prochaines éditionsons 👇











