IT’S BLACK FR.AI.DAY !!!

nov. 30, 2024

Bonjour à tous les stakhanovistes de l’IA générative, les veilleurs de nuit, ceux du jour, les cyborgs, les droïdes, le clones et toutes les machines qui liront cette édition.

Je le répète chaque semaine, c’est la vérité vraie : l’actualité GEN AI est infernale.
Au moins autant que mes semaines actuelles, où je passe plus de temps en déplacement que chez moi, à donner des formations le jour et travailler sur des projets vidéo IA la nuit. J’ai besoin d’un clone ou de repos, probablement les deux.

Heureusement, Caroline Thireau est là, fidèle au poste et à sa veille rigoureuse, je la remercie pour la curation et la rédaction de la majeure partie des news de cette édition qui, sans elle, serait parue le 24 décembre à minuit.

Cette semaine c’est le Black Friday, mais l’actu IA, elle, ne fait pas de promo.

Au sommaire

🔷 LES NEWS DE LA SEMAINE

🔷 LES PEPITES DE LA SEMAINE

🔷 LE DOSSIER DE LA SEMAINE : SORA A FUITÉ !

“L’IA, c’est comme une jungle avec des cheveux” (Citation d’origine inconnue) - Kling

🔷 Runway Expand Video : Changez de format
Un upgrade sorti vendredi dernier, JUSTE APRÈS la publication de la dernière édition, on s’est demandés si Runway ne l’avait pas fait exprès. Arrêtez tout, Expand Video est un Game Changer. Il s’agit d’outpainting video, a.k.a. la possibilité d'étendre vos vidéos en générant des zones supplémentaires pour changer leur format, comme Photoshop.
Terminé les tournages relou parce que les clients veulent du format 9:16 en plus du 16:9. Vous pourrez désormais les regarder dans les yeux d’un air confiant, et leur répondre négligemment : “aucun problème, on verra ça en post-prod”.

🔹Frames : Quand Runway sort ses pinceaux cinématographiques
Chaud comme la braise, Runway lance également Frames, un générateur d’images qui promet de rendus ultra cinématographiques à en juger par les premières images. La déploiement est progressif, on vous en dit plus dès qu’on en sait davantage.

🔹Dream Machine : Tout créer, sans changer d’outil
Luma AI fait peau neuve avec la mise à jour de Dream Machine. Nouvelle interface, nouvelles fonctions : modèle d’images, références de style, brainstorming, ajustement de mots-clés et création vidéo. La nouvelle interface ~~simplifiée~~ demande un temps d’adaptation et permet de passer de l’idée à la vidéo et de collaborer, le tout sans quitter l’outil. Merci à Yigit Kirca pour le partage de cette démo.

🔷 Google fait progresser la vidéo IA
Google DeepMind a publié un article sur Generative Omnimatte, un outil capable de segmenter, inpainter et éditer n'importe quelle vidéo à la perfection. Aucune date de sortie n’a été annoncée, et il se peut qu'il ne soit pas publié sous licence open source.
Ce qui est intéressant ici, c’est la technologie qu’on devrait voir apparaitre en 2025.

🔷 ElevenLabs : bienvenue dans la Podcast fever
Après NotebookLLM (génération de text-to-podcast ultra rapide mais limité à 2 voix standards) et Playnote (avec davantage de formats et des options vocales variées dont le clonage de votre propre voix, par contre généré en 10 min.), c’est au tour d’ElevenLabs d’entrer dans la course des text-to-Podcasts.

Le modèle d’Eleven Labs propose de transformer articles, PDF et ebooks en podcasts audio personnalisés via son application ElevenReader. Des voix IA réalistes animent le contenu. C’est disponible en 32 langues, excusez du peu.

🔷 Kaiber 2.0 : Un studio IA pour les créateurs audacieux
Nous n’en avions pas encore parlé, Kaiber 2.0 intègre désormais la génération d’images et de vidéos grâce à Flux et Stable Diffusion 3.5. Parmi les autres nouveautés, le Superstudio se distingue avec son canvas, rappelant des outils comme Recraft ou Visual Electric. L’utilisateur peut y combiner modules et outils, organiser ses créations en collections et affiner ses projets pour donner vie à sa vision.

L’outil est à tester gratuitement ici : Kaiber Superstudio

🔷 DINO-X : L’IA qui détecte
C’est un modèle qui allie IA et Computer vision, ce qui le rend capable de détecter des objets sur lesquels il n’a pas nécessairement été entrainé. Il accepte les inputs textes comme visuels et génère des résultats très variés. Par exemple, il peut repérer des objets, les encadrer, les segmenter, les compter ou même mettre des légendes. Grâce à ses "perception heads" (comme des super yeux et oreilles virtuels), il analyse tout en détail pour tout expliquer clairement.

🔸 LTXV : La vidéo IA en open source
Gilles en parlait juste après avoir sorti l’édition précédente, Lightricks dévoile LTX Video (LTXV), un modèle open-source qui génère des vidéos en temps réel (allez, 5 secondes !) grâce une optimisation des GPU et un entraînement sur une large base de données vidéos. Concrètement, c’est pas mal “pour de l’open source” (comprendre que ça fonctionne moins bien que les cadors du marché mais c’est gratuit alors on ne se plaint pas)

Fal AI
Hugging Face
ComfyUI en local

Pro tip qu’on vous remet ici : faites des prompts de plus de 50 mots, sinon le modèle vous demandera de revoir votre copie.

🔸JoyVASA : Faites parler tous vos personnages
JoyVASA propose du lip-sync via LivePortrait pour créer un visage 3D, wav2vec2 pour comprendre les mouvements à partir d’un son et un modèle de diffusion peaufine ensuite les détails. Résultat : On progresse mais tout ça reste encore un peu trop figé. Tant mieux pour les victimes potentielles de deeepfake. Les créatifs, eux, attendront une version plus aboutie. A tester via Gradio sur GitHub.

🔸Kling Virtual Try On
Kling lance une nouvelle fonctionnalité qui permet de changer de vêtements dans n'importe quelle vidéo en utilisant simplement une photo de la tenue. Autant de nouvelles perspective potentielles qui s’ouvrent pour les créateurs, les marques et le commerce électronique…

Enfin, la pub IA de la semaine est cette astucieuse campagne de Suzuki qui n’essaye pas de reproduire maladroitement la réalité comme c’est ce qui avait reproché à la dernière campagne de pub Coca Cola que nous vous présentions dans l’édition précédente. Suzuki assume pleinement l’usage de l’IA et en fait un ressort de comédie pour ce film techniquement imparfait mais néanmoins très réussi.

HEAT Extended
Depuis une semaine que Runway a sorti la fonctionnalité “Extend Video” dont nous vous parlons en ouverture de cette édition, tout internet s’en est emparé et certains n’hésitent pas à “remixer” certains films, suscitant aux passages des réactions très contrastées. Certains trouvent l’exercice très ludique, d’autres crient au crime de lèse Majesté.
On vous laisse vous faire votre opinion avec ce remix du film HEAT (Michael Mann, 1995) par Phil Langer connu pour ses portraits d’êtres hybrides.

Et Phil a récidivé avec “Silence of The Lambs” (Jonathan Demme, 1991)

🔷 Sora : la rébellion des testeurs et la saga continue

Alors qu’on parle navigateur de recherche pour Open AI, son modèle vidéo Sora, encore en phase alpha, a brièvement fuité sur Hugging Face, à priori suite à une action de testeurs mécontents. Ces AI artists dénoncent le manque de reconnaissance et l’exploitation gratuite de leur travail. Bien que retiré en 2 heures d’ici, cela confirmerait que le modèle serait presque prêt. Alors, coup de buzz ou livraison prévue sous le sapin ? ~~Qui vivra Sora~~ To be continued…

Et bien on n’aura pas attendu longtemps puisque nouveau rebondissement ce jeudi -on se croirait au Board de Open AI- une nouvelle video circule avec les Sora Leak et un petit démenti officiel sur Hugging Face :

Pour faire court, quelques heures après la “fuite” annoncée, OpenAI a révoqué l'API et retiré les vidéos générées. Seule une archive (87 vidéos et 83 prompts) a été sauvegardée sous licence publique. Et contrairement aux rumeurs, Sora n'aurait pas "fuité" : seuls des accès test étaient compromis, pas le modèle lui-même.

On vous laisse avec les dernières génération de Sora, toujours aussi impressionnant !

Cette édition est terminée, merci de l’avoir lue jusqu’ici ! Si elle vous a plu, vous pouvez la partager en cliquant juste ici :

Partagez Generative

Vous pouvez également me suivre sur LinkedIn et activer la cloche 🔔, je poste régulièrement sur l’intelligence artificielle générative. Vous pouvez également me contacter pour toute proposition de création, intervention, conférence, projet, formation liée à l’intelligence artificielle générative.

Et n’oubliez pas de vous abonner pour ne rien rater des prochaines éditions 👇

Generative

IT’S BLACK FR.AI.DAY !!!

Discussion à propos de ce post