Bangg Bangg Bangg !!
Salut les épuisés ! Courage, l’été approche… avec sa pause estivale.
Cette semaine a été RELATIVEMENT calme au vu de l’agitation des semaines précédentes. Quelques news d’importance ont tout de même vu le jour, on vous en parle tout de suite maintenant.
Parmi les grosses news en ce qui me concerne, j’ai annoncé mardi la création de BANGGER, le société de production vidéo IA que j’ai cofondée avec Gaëlle Jaine, une productrice que je connais depuis presque 10 ans.
Nous avons le plaisir de représenter des réalisateurs très talentueux, tous issus du Prompt Club. N’hésitez pas à visiter le site de Bangger.
Let’s go !
Si ce n'est pas déjà fait, tu peux aussi :
Découvrir mes formations IA pour les créateurs, 100% finançables par le CPF. Les inscriptions se font ici.
Former tes équipes à l'IA générative grâce à nos formations entreprise finançables par ton OPCO
Nous contacter directement pour discuter de ton projet IA générative
Me suivre sur LinkedIn, YouTube ou TikTok pour ne rien rater.
Et c'est parti ! 🚀
🔹Seedream 3.0 : génération d’images précise et rapide
Seedream 3.0, intégré à Freepik AI, permet de générer des images avec un niveau de qualité/réalisme parmi les meilleurs du marché. Le modèle s’adapte à différents styles visuels, tout en gardant des objets nets, une anatomie cohérente et un texte lisible, y compris pour des usages comme l’affiche ou le packaging.
🔹 Kling 1.6 – Kling AI
Lancé le 19 décembre 2024, Kling AI améliore sa version 1.6 en y ajoutant la fonction “Motion Control”. Pour faire simple, vous pouvez extraire le mouvement d’une vidéo et de l’appliquer à une image personnalisée, ce qui vous donne de la précision dans le contrôle de l’animation. Si le temps de latence est un peu long, cela pourrait vite se débloquer avec les versions supérieures 2.0, 2.1 et 2.1 Master. Wait & see ! Pour patienter, illustration avec la démo de Eugenio Fierro.
🔹 Voice Design v3 – ElevenLabs
On vous en parlait déjà dans les éditions précédentes, Voice Design v3 d’ElevenLabs permet de créer des voix réalistes via des prompts. On ajoute des balises relatives à l’âge, le genre, le ton, l’émotion, etc… directement dans le texte pour enrichir l’interprétation vocale . Toujours en mode alpha, quelques améliorations sont apportées au fur et à mesure depuis le lancement. Sur GENERATIVE, on vous partage le lien des Best Practices de la plateforme et vous rappelle leur offre web à -80 % disponible jusqu’à la fin du mois ! Tic tac Tic Tac…
🔹Higgsfield Soul : modèle photo IA et nouveau pack d’effets visuels
Higgsfield Soul est le nouveau générateur d’images de Higgsfield, plutôt orienté style UGC réaliste (à droite sur la démo video plus bas).
Avec plus de 50 préréglages, voici quelques recommandations de Caro :
• Le style choisi influence le rendu : “Realistic” optimise les prompts, tandis que “General” offre plus de contrôle et la possibilité d’expérimenter davantage ;
• Les prompts courts restent comme souvent les plus efficaces sur la plateforme ;
• Pensez à activer le mode “High Quality” pour un meilleur niveau de détail.
Cette sortie s’accompagne aussi d’un nouveau pack de 5 nouveaux effets visuels : Powder Explosion, Clone Explosion, Black Tears, Paparazzi, Earth Zoom Out. (à gauche sur la démo juste en dessous).
🔹Gen-4 References : mise à jour avec meilleure cohérence
La nouvelle version de Gen-4 References de Runway améliore la cohérence visuelle des objets et la fidélité aux prompts. Sur Dreambench++, un benchmark de personnalisation d’image et dépasse à la fois la version précédente et d’autres références fondées sur la diffusion.
🔹11ai : assistant IA vocal polyvalent
11ai est un assistant personnel IA centré sur la voix, compatible avec le protocole MCP ou des serveurs MCP personnalisés. Il aide à préparer des réunions, lancer des recherches via Perplexity, traiter mails, Slack ou tickets Linear… Bref, il combine notamment texte et voix, détecte la langue et utilise le RAG, avec une latence minimale. Une fois inscrit, on choisit une voix, connecte ses outils… et on parle.
🔹Le comparatif de la semaine : MiniMax 2.0 VS Seedance dans Weavy
C’est le camarade Luka Tisler qui nous partage ses retours cette semaine avec MiniMax 2.0 et ByteDance Seedance qui produisent des vidéos 1080p à 24 ips. Si MiniMax offre une meilleure fidélité aux prompts, il reste lent. Seedance est beaucoup plus rapide. Dans ce test, les visuels viennent de Midjourney, le son de Suno, le tout assemblé dans la plateforme Weavy dont on vous parle de plus en plus régulièrement et qui permet un flux de travail centralisé, sans changer d’outil à chaque étape.
🔹HeyGen Video Agent : production vidéo IA simplifiée
HeyGen Video Agent automatise chaque étape de la création vidéo : analyse du contenu, écriture du script, choix des visuels, sélection d’un avatar et montage final. Il permet de produire rapidement des vidéos prêtes à diffuser (pubs, démos, contenus pédagogiques) à partir de simples documents ou phrases. La promesse de Heygen ? Un outil conçu pour remplacer une équipe de production sur des formats standardisés. Pour rejoindre la waitlist et nous en assurer, c’est par ici !
🔹 FLUX.1 Kontext [dev]
Black Forest Labs lance FLUX.1 Kontext [dev] , son modèle open-source pour l’édition d’images, avec un rendu proche des solutions propriétaires. Il fonctionne sur du matériel standard, propose des poids en accès libre pour un usage non commercial, et offre des licences commerciales simplifiées. Validé par des benchmarks, il est optimisé pour et par NVIDIA Blackwell et reste disponible via Hugging Face, Replicate, ComfyUI et autres.
🔹L’open-source de la semaine : Wan Multi Talk
Le lipsync continue de progresser dans les sphères de l’Open Source avec Wan MultiTalk. regardez cette démo de Matt Hallett :
🔹 Open Source, suite : Wan2.1_14B_FusionX
Wan2.1_14B_FusionX est un projet en cours de recherche qui permet de transformer une vidéo existante à partir de texte, d’images ou de repères de mouvement, tout en conservant l’animation d’origine. Il fonctionne localement via ComfyUI, en open-source (licence Apache 2.0). Le mode “fantôme” permet des rendus plus abstraits. Développé collectivement, il réunit plusieurs contributeurs. Plus d’infos sur Hugging Face et une démo ici :
🔹Le documentaire IA de Brut.
Brut. raconte l’histoire des Apaches, bandes violentes du Paris 1900, à travers un documentaire animé par IA. Archives d’époque restaurées, voix de synthèse et effets visuels (CapCut, Eleven Labs, Veo-3, PixVerse…) donnent vie au récit. Si certains pointent une surcharge visuelle, le mélange d’esthétique contemporaine et de narration historique reste efficace. Un format audacieux, pensé pour un public numérique. Merci au camarade Mathieu Cruq pour ce parta
🔹Krea gre Hunyuan3D-2.1
Hunyuan3D-2.1 permet de générer des objets 3D photoréalistes avec textures PBR (comprendre avec des rendus basés sur la physique), simulant des matériaux comme le métal ou le cuir. Il combine forme et texture avec un rendu jusqu’en 4K. Si le modèle est à l’origine open-source, il est maintenant également disponible sur la plateforme Krea AI pour un usage simplifié visant à produire des assets 3D.
🔹DOGSTUDIO/DEPT® : portraits parlants IA en temps réel
DOGSTUDIO/DEPT® crée des portraits parlants capables d’échanger en direct avec l’utilisateur. Ces visages fictifs ou historiques perçoivent les émotions, comprennent le langage et réagissent à ce qu’ils voient. Le système s’appuie sur plusieurs briques technologiques (LLM, synthèse vocale, WebRTC) et chaque interaction est unique, sans script prédéfini. La V2, plus aboutie, arrive bientôt… Un projet qui n’est pas sans nous rappeler les Van Gogh et Napoléon de Jumbo Mana il y a 2 ans.
🔹La Trend JO animaliers avec Hailuo‑02
Après les “starter packs” et la trend Ghibli, le modèle Hailuo‑02 de Minimax alimente une nouvelle tendance où des animaux participent à des épreuves des JO. Prompts simples, rendu efficace : la formule séduit sur les réseaux et devient virale…. Mais pourrait vite lasser. Voici une compilation par Leo Kadieff.
🔹Vidéos IA style jeu : mondes simulés à la 3ᵉ personne
Leo nous a également partagé cette video de créateurs qui génèrent des scènes façon jeu vidéo, en vue 3ᵉ personne. pas encore exploitable dans le gaming mais cela donne un bon aperçu de ce que l’IA peut simuler visuellement sans moteur de jeu. Preuve en images… et vidéo !
🔹Humour et pub avec IA : l’exemple Task Rabbit
Billy Boman nous propose cette spec Ad pour Task Rabbit, spécialisé dans l’amélioration de l’habitat, qui montre comment l’IA permet de transformer une simple idée en campagne visuelle tout au long du processus créatif. L’humour y est subtil, loin des clichés surjoués. Le slogan "When the job gets weird, we don't flinch" incarne ce ton décalé mais maîtrisé. (Note de Caro : Je suis fan !)
🔹BBC Studios & IA : réflexion collective sur la création
Ça se structure dans l’IA… BBC Studios a réuni Wonder Studios, Freepik et ElevenLabs pour explorer des usages créatifs de l’IA à travers les outils, des idées et des échanges. Une démarche ouverte portée par la curiosité, loin du discours promotionnel. D’autres étapes prévues à priori. To be continued…
🔹L’animé de la semaine
Ce projet de Jason Zada (ou de quelqu’un de son équipe qui n’a pas été mentionné au générique - private joke) réalisé avec Midjourney vidéo, est un mélange d’esthétique cyberpunk et de récit spéculatif. “Golden Sekai” imagine donc un Tokyo dystopique où les néons cachent une ville gangrenée par les Yakuza. Une force bienveillante issue d’une technologie interdite veille en secret, espérant rétablir l’équilibre. L’esthétique est intrigante, quelque part entre Katsuhiro Ôtomo et GTA 6…
🔹 La video de la semaine
Le talentueux Stéphane Benini, membre du Prompt Club et représenté par Bangger, vient de réaliser un court métrage full IA d’une très grande beauté visuelle. Le film fait référence aux origines du personnage “Silver Surfer”, issu de l’univers Marvel.
Ce qui m’a le plus impressionné, au delà de la très grande qualité des visuels, c’est la proposition très forte d’une approche de cinéma d’auteur (au sens noble du terme) sur une IP Marvel.
Stéphane réussit à livrer un récit presque contemplatif là où 99,99% des autres réalisateurs IA se seraient vautrés dans une tentative de reproduction de l’action frénétique des films hollywoodiens… Regardez :
Cette édition est terminée, merci de l’avoir lue jusqu’ici ! Si elle vous a plu, vous pouvez la partager en cliquant juste ici :
Vous pouvez également me suivre sur LinkedIn et activer la cloche 🔔, je poste régulièrement sur l’intelligence artificielle générative. Vous pouvez également me contacter pour toute proposition de création, intervention, conférence, projet, formation liée à l’intelligence artificielle générative.
Et n’oubliez pas de vous abonner pour ne rien rater des prochaines éditions 👇