L'ami artificiel te parle

sept. 29, 2024

Salut à toustes et bienvenue dans cette nouvelle édition de GENERATIVE, la grosse newsletter qui sélectionne et vous résume les éléments les plus intéressants de l’actualité ~~infernale~~ bouillonnante de l’IA générative.

Encore un grand merci à Caroline pour sa veille quotidienne et la co-gestion de la rubrique news !

Cette semaine a été ULTRA CHARGÉE professionnellement avec pas moins de 5 sessions de formation à Paris et 2 events IA. On tâchera de publier vendredi la semaine prochaine, c’est promis !

La digestion des semaines précédentes n’est toujours pas terminée, j’ai encore des fonctionnalités à tester, des outils à benchmarker, et beaucoup trop de projets en cours pour les journées de 24 heures d’un seul homme.

Et si on montait une boite tous ensemble ? Une “billion dollar company” augmentée par l’IA. Avec plein de projets créatifs et de trucs automatisés. Ça aurait de la gueule.

Bref, let’s dive into the sommaire (pardon my french)

🔹 Les news
🔹 Les events IA de la semaine
🔹 Les vidéos de la semaine
🔹 Et toi, tu fais quoi avec l’IA ? Interview de Romain Gingembre de Birth

Les news de la semaine

🔹 VoiceGPT 2.0
La grosse news de la semaine, c’est ChatGPT qui déploie enfin le mode vocal avancé qui avait fait couler beaucoup d’encre dans les premières vidéos de présentations de chatGPT 4-o il y a quelques mois.
Disponible pour les abonnés ChatGPT Plus et Team, elle introduit de nouvelles voix plus naturelles et beaucoup plus réactives. Toutefois, son accès en Europe reste en attente, à moins que… à moins qu’on ne vous explique comment contourner cette limitation. Merci à l’ami Nicolas Guyon pour ce tips de qualité.
Voici le step-by-step :

1 - installer un VPN sur son smartphone
2 - se localiser aux US
3 - se déconnecter de l’app chatGPT
4 - se reconnecter à l’app
5 - Valider l’update et choisir une voix
6 - Enjoy

Je l’ai installé et je confesse avoir eu 2 phases : une première phase semi déceptive ou je trouvais que les voix avaient toutes un accent peu naturel (en français) et me racontaient peu ou prou la même chose que les voix précédentes.
Suivie par une seconde phase beaucoup plus enthousiaste, en majeure partie grâce à la sidérante vitesse de latence, qui donne un sentiment unique, à la fois grisant et très étrange, de converser avec un “ami artificiel” très sympa et intelligent.

Le camarade Mathieu Crucq a réalisé une vidéo de test plutôt réussie, regardez :

🔹 Mystic v2 x Magnific AI

Le célèbre upscaler génératif Magnific AI a intégré Mystic v2, la nouvelle version del’un des générateurs d’image les plus impressionnants du moment. Concrètement, vous pouvez désormais générer des images avec Mystic v2 directement dans Magnific AI.

La qualité d’image est impressionnante, bien qu’à la limite de “l’oversharpening” (excès de netteté).
J’ai sorti mes prompts “afrofuturism” du placard pour tester l’engin :

Une image trop nette est une image qui manque de naturel. Regardons ça de près :

l’oversharpening crée des artefacts peu naturels sur la peau

Mais ne faisons pas la fine bouche, la qualité reste tout de même exceptionnelle et fait de Magnific AI un outil de génération et d’upscaling (quasi) complet.
Le jour où il proposera une fonctionnalité d’inpainting, il sera totalement incontournable.

🔹 Runway distille les nouvelles fonctionnalités

Runway a lancé un paquet de nouvelles fonctionnalités :
Tout d’abord, la génération de vidéos verticales via le mode Gen-3 Alpha Turbo. Les créateurs peuvent utiliser des images ou des prompts pour générer des vidéos en 768x1028, parfaites pour YouTube et Facebook.

Ensuite, le “Time Edit” fait son apparition lorsque vous utilisez “extend” des vidéos.
Vous pouvez ainsi :
• Raccourcir des clips depuis le début ou depuis la fin
• Ajuster la vitesse de 25 à 400 % par rapport à l’original
• Lire la vidéo en sens inversé

Enfin, Runway sort une fonctionnalité “New Style Stream” pour des effets en temps réel. Entre vous et moi, je peine à imaginer des “real life use cases” :
Streamer la coupe du monde de foot en pâte à modeler ?

🔹 Le mercato de la semaine

Alors que la CTO Mira Murati quittait le board d’open AI ce mercredi , James Cameron, réalisateur qu’on ne présente plus et pionnier des effets spéciaux, rejoint le conseil d'administration de Stability A de son côté. Sa vision technologique, combinée à sa créativité, promet d'ouvrir de nouvelles possibilités pour les créateurs visuels. Stability AI, notamment connue pour Stable Diffusion, espère ainsi renforcer son rôle dans la transformation des médias visuels.

🔹T’as pas 100 balles ?

D’ailleurs amis réalisateurs, scénaristes, créatifs en tout genre, c'est le moment de faire une OPA sur Runway ! Leur Hundred Film Fund s’engage à soutenir 100 projets qui utilisent l'IA, avec des financements allant de $5K à plus de $1M pour vous aider à concrétiser vos idées. Peu importe le format, si vous avez besoin d’un coup de pouce, postulez et faites partie de la prochaine vague de films qui seront peut être un jour des collectors ou des références du genre !

🔹 Audible se met à l'IA pour les recommandations

Audible, la plateforme bien connue d'audiobooks, s'essaye aux nouvelles technologies et teste actuellement des fonctionnalités basées sur l'IA. L’objectif ? Personnaliser les recommandations de livres audio pour chaque utilisateur. Avec ces suggestions sur mesure, Audible espère améliorer l'expérience de lecture et rendre chaque écoute encore plus captivante. On attend de voir si l’algorithme saura deviner nos goûts avec justesse !

P.S. Je vous avais déjà dit que j’ai réalisé une pub télé (sans IA) pour Audible il y a quelques années ?

🔹 La rumeur de la semaine

Jony Ive, l'ex-gourou du design d'Apple, s'associe à OpenAI pour créer un smart device inédit. Imaginé comme le futur rival de l'iPhone, cet appareil mystère incarne la vision d'Ive pour une technologie à la fois innovante et esthétiquement séduisante. J’ai le pressentiment que quelque chose de grand (et probablement très beau) se trame dans les coulisses !

a futuristic sleek AI device --ar 2:1 --s 250 --style raw

🔹 Dataland, un musée IA à L.A.

Refik Anadol, un pionnier dans l'art IA, ouvrira en 2025 “Dataland”, le premier musée d'art IA au monde à Los Angeles. Ce musée, situé dans le complexe conçu par Frank Gehry, mettra en avant des œuvres créées par un modèle IA inédit, le Large Nature Model, alimenté par des données issues d'institutions prestigieuses. Dataland se distingue par son engagement envers l’IA éthique et l’utilisation d’énergies renouvelables.

Refik Anadol’s giant LED wall — "Living Paintings Immersive Editions” - Refik Anadol Studio

🔹 On a retrouvé google VEO !

YouTube a annoncé plusieurs innovations lors de l’événement Made on YouTube. Parmi elles, l'arrivée de Veo, un outil d’IA de Google pour générer des vidéos à partir de prompts. Des doublages automatiques dans différentes langues faciliteront l’audience internationale. D’autres fonctionnalités incluent un outil de brainstorming, le système de soutien Hype (?), ainsi que l’envoi de cadeaux virtuels pour encourager l’engagement des fans.
fermez les yeux et visualisez les cadeaux virtuels que je suis en train de vous envoyer.

🔹 Et Meta dans tout ça ?

Meta a présenté plusieurs innovations lors de sa conférence annuelle “Connect”. Le nouveau casque Quest 3S, version abordable du Quest 3, sera disponible dès octobre à 300 dollars. Les lunettes Ray-Ban reçoivent des mises à jour, incluant la traduction en temps réel et une édition limitée transparente.
L'entreprise a également dévoilé Llama 3.2, son nouveau modèle d'IA, et des améliorations pour Meta AI, dont la synchronisation labiale pour les traductions vidéo.
Le projet phare, Orion, est un prototype de lunettes holographiques utilisant des projecteurs Micro LED. Selon Zuckerberg, cette technologie, en développement depuis une décennie, représente l'avenir de la réalité augmentée.

🔹 Crash Test de la semaine by Caro

Je vous présente un workflow coup de coeur. Suite à un post de Rory Flynn, j'ai exploré par itérations dans Midjourney différents styles visuels d'écriture (ici sketch, lettering, graffiti parce que je connais bien les codes ce qui permet d’affiner mes prompts).
Attention à ne pas laisser trop de liberté à l’IA dans les paramètres !
Ensuite, lancement de Runway avec les meilleurs visuels en fin de séquence. Création musicale Suno + GPT 4o, Edit rapide avec capcut (pardon Gilles !). Runway m’a fait de bonnes blagues avec une vue aérienne des graffeurs sur le mur de briques vertical, sans parler des bombes de peintures qui explosent …

🔹 IA, animation & 3D

On a 2 chouchous dans la bannette des tests à effectuer prochainement avec Gilles

> Consistent character AI pour créer des fiches de personnages de qualité avec un contrôle précis des poses. Apparemment encore quelques soucis de cohérence.

> MIMO, développé par Alibaba, pour créer des vidéos 3D réalistes sans captures multi-vue, avec des mouvements complexes rendus simples. Le système utilise des estimateurs de profondeur pour diviser la scène en couches (humain, environnement, objets), offrant un contrôle total sur les interactions et les mouvements des personnages en milieu réel.

🔹 La Rubrique Maison Deco AI

On a observé une petite tendance toute discrète cette semaine mais qui en combinant plusieurs outils d’IA peut s’avérer intéressante (même si cela reste sujet à quelques améliorations) :

Object Mover Tool de Finegrain pour réarranger la déco https://editor.finegrain.ai/editor (ordi only !)
Decorify pour des pièces sur mesure en choisissant son style préféré et acheter instantanément le mobilier proposé dans les rendus Decorify - Transforming Spaces with AI Interior, Exterior & Landscaping Design Solutions

🔹 Photo Avatar 3.0

Heygen sort Photo Avatar 3.0, la dernière itération de sa technologie qui permet d’animer et de faire parler vos photos. Comme une démo vaut lieux que 1000 mots, j’ai testé pour vous :

🔹 Le quizz de la vidéo IA du NY Times

Le NYTimes vous propose de déceler l’AI or not sur 10 séquences et on sait qu’ici et sur Linkedin, on vous challenge déjà beaucoup. Un bon indicateur du niveau actuel de la vidéo IA : il est très difficile de faire un sans faute !
Même Gilles n’a scoré que 9 sur 10. Pourrez vous battre son score ?

Le lien : https://www.nytimes.com/interactive/2024/09/09/technology/ai-video-deepfake-runway-kling-quiz.html

🔹 Runway Gen:48 Winners

Et puisqu’on parle de vidéo IA, les vainqueurs de la 3e édition du Runway Gen:48 (compétition de court-métrages réalisés en 48 heures par Runway) ont été annoncés.
De beaux objets cinématographiques que je vous invite à visionner ici :
https://runwayml.com/gen48

🔹Hedra x Flux

Il faudra s’affranchir d’un abonnement pour profiter de la version bêta suite à la nouvelle intégration Flux sur Hedra. Directement intégré à l’interface habituelle, l’utilisation reste la même… Et les personnages générés ultra-réalistes en quelques minutes ne feront pas que ressembler à des humains, ils parleront aussi avec des voix beaucoup plus naturelles.

🔹L’IA DU MÂÂÂL

Chris Weitz, réalisateur du film American Pie, repasse derrière la caméra avec un film d’épouvante (comme on disait avant) qui met en scène une IA personnelle maléfique. Parce que tout ça fleure bon le gros nanard, je vous mets une bande annonce en VF :

P.S. Si ce genre de film vous inspire, sachez que Curious Refuge organise un concours d’”AI Horror Film”

🔹Des events IA à la pelle

Cette semaine, j’ai participé non pas à un mais à 2 meetups IA, dans 2 villes différentes, qui dit mieux ? (Et ça aurait pu faire 3 si la SNCF ne m‘avait contraint à annuler, la mort dans l’âme, la 2e édition de MASSIL.IA pour cause de retard de 2h40 du TGV Paris-Marseille.)
Il y a d’abord eu l’incontournable Comptoir IA de Nicolas Guyon, dans les beaux locaux de Publicis Live.

La soirée a débuté avec Le Club des Bernards et Hedy Magroun, qui ont animé une séance humoristique barbue autour du traditionnel “OpenPrompting”.
Sane Lebrun, d'Upmynt, a présenté les atouts de l'IA pour les entreprises, notamment sa capacité à prédire les tendances et à améliorer le storytelling. Et il m’a même dédicacé un exemplaire de son livre, que demande le peuple ?

En embuscade,; Yohann de Roeck, de Sezam.ai

Adrien Molto a présenté son « Train Audio Guide », capable de vous donner de l’information en temps réel sur les sites que vous traversez lors de vos trajets de train.
Enfin, Serge Alleyne a présenté Glovy, une app au potentiel intéressant, qui mélange génération d’images et social network. Et enfin Ethan Safar (que j’ai interviewé il y a quelques semaines et dont il faut que je publie l’interview) a partagé son parcours extraordinaire avec le GPT Store. Son GPT “Gradient” est le 5e GPT le plus utilisé au monde !

Et Comptoir IA, c’est toujours l’occasion de retrouver les “copains de l’IA” : Nicolas Guyon, Stéphane Knecht, Emmanuel Vivier, Sane Lebrun, Stéphane Gallieni, Caroline Thireau, Hedy Magroun, Thierry Chovanec, PPC et son fils Alexandre, John-Edwin Graf, Jean-Yves Le Moine, Ghislain Labay, Christian Riedi, Elisabeth Gravil … Désolé pour ceux que j’oublie. Coeur avec les doigts.

mon clone, et ceux d’Emmanuel Vivier et de PPC

Le 2e event est “l’IA Café Club”, il a eu lieu à Asnieres-sur-Seine, une ville, dans les locaux de “The Good Experience”, une société spécialisée en “création d'espaces de communication innovants et durables.”
Ambiance feutrée et très sympathique, avec une grosse livraison de pizzas à la fin. J’ai eu le plaisir de faire un état de l’art de la vidéo IA en septembre 2024 devant une salle curieuse et attentive, ma configuration préférée. Merci à Loic Boutet et Anthony Quinchon pour l’invitation.

Merci à Hamza Lamrani et Stéphane Knecht pour les vidéos !

🔹Les vidéos IA de la semaine

La vidéo qui a le plus buzzé cette semaine est le dernier clip de Snoop Dogg, réalisé avec de l’IA par les Dor Brothers assistés de 8 artistes IA indépendants. Il a fallu 2 mois de travail et 10 personnes pour réaliser ce clip. De quoi faire voler en éclat les rengaines fallacieuses rabâchées de manière récurrente sur les réseaux : “Avec l’IA, j’ai fait en 2h dans mon salon tout en jouant aux échecs en regardant Netflix”.
Quand on fait du travail soigné, ça prend du temps. IA ou pas.
Il faut préciser que ce clip n’est pas Full IA. Les séquences “GTA Snoop”, “Clay Snoop” et “Space Snoop” sont un mix de 3D et d’IA.

BATTALION
Après un paquet de fausses pubs et de clips en IA, je trouve rafraichissant de découvrir des formats narratifs, comme ce court métrage de5mn de Dave Clark qui évoque un pan de l’histoire des Etats Unis. L’histoire évoque le 320th Barrage Balloon Batallion, la seule unité composée entièrement de soldats afro-américains à prendre d’assaut la plage le jour du débarquement, et les échos de cet épisode dans la suite de la vie du personnage principal, ensuite confronté à la ségrégation raciale.
Dave Clark confie avoir utilisé pas moins d’une douzaine d’outils IA : Kling, Runway Gen-3, Luma Labs, Minimax, Midjourney, Magnific AI, Eleven Labs, chatGPT, Udio, ComfyUI et Live portrait.

J’espère que tout ça vous a donné envie de faire du lipsync dans ComfyUI.
Ça a l’air friendly, regardez :

Aucune description alternative pour cette image

Et toi, tu fais quoi avec l’IA ?

Cette semaine j‘interviewe Romain Gingembre, le’s go !

Salut Romain, peux-tu te présenter ?

Bonjour, je m’appelle Romain Gingembre et je suis Head of Post Production chez Birth.tv, une boite de prod essentiellement tournées vers le marché publicitaire. En gros je gère toute la partie technique, artistique et financière de la post production (donc tout ce qu’il se passe après le tournage).

Evidemment j’interviens aussi en début et tout le long du projet afin de donner ma vision technique sur la façon de réaliser les séquences dans le but de rester dans nos objectifs tant en terme budgétaire que qualitatifs.

Comment as-tu découvert les outils d'intelligence artificielle générative ?

Un peu comme tout le monde, lorsque que ChatGPT est arrivé ça a fait un gros buzz un peu partout. Et en ce qui concerne Midjourney un graphiste m’a fait des tests de design sur un vaisseau spatial sur un projet à l’été 2022, c’est à cette époque que j’ai commencé à m’intéresser au sujet.

Qu'est-ce qui t'a motivé à les intégrer dans ton processus artistique ?

J’ai tout de suite senti le potentiel de ces outils dans l’industrie de la production de film.
Je me suis donc renseigné sur les outils existants et depuis je fais une veille permanente des nouveautés.
J’ai d’abord fait des recherches pour les taches techniques, comme des outils de rotoscopie, du sous titrage automatique, ou de la post synchronisation de voix, mais j’ai découvert que les possibilités étaient bien plus vaste.

Comment ces outils d'IA ont il fait évoluer ton processus créatif et tes workflows ?

Créativement je vais dire que pour le moment, on utilise plutôt les IA génératives d’images pour créer des concepts, faire des références, voire des storyboards. Mais on commence aussi à utiliser ces outils pour créer des matte painting digitaux, des éléments a compositer dans nos images, voir des asset digitaux en full IA.

Aujourd'hui, quels sont les outils d'IA que tu utilises le plus ?

Bizarrement, je n’utilise pas moi-même beaucoup l’IA dans mes tâches quotidiennes, mais j’utilise quand même régulièrement Chat GPT et Midjourney.

Peux tu nous parler de ton dernier projet pour Charal ? A quel moment tu t'es dit "faisons le en IA" ?

C’est un peu notre actualité du moment, lorsque nous avons reçu le projet, j’ai pensé faire un robot en CGI avec des clean plates, mais au fur et mesure du dépouillement et de nos recherches de partenaires VFX nous avons fait le constat que cette option ne pouvait ni tenir dans le planning de tournage ni dans le budget client.

J’avais repéré un Talent qui avait réalisé une superbe vidéo avec un robot jouant au ping pong, le joueur réel était remplacé l’aide d’une IA.
Je me suis dit que l’on pourrait utiliser la même technique avec un robot faisant du skate. On a fait des tests et ça a marché ! Nous étions du coup la seule société de production à proposer cette solution et à rentrer dans le budget. L’agence et les clients ont eu le courage de nous faire confiance et je les en remercie.

Quel serait ton "dream project" ?

Aujourd’hui un film avec des humains totalement photoréaliste en vidéo me parait un peu ambitieux, mais je pense sincèrement que nous sommes prêt à faire des films de voitures par exemple en full AI ou même les professionnels se poseront la question Réalité ou 3D ou… AI ?

Quelles sont les avancées que tu attends le plus pour 2025 ?

Je pense ne pas être au bout de mes surprises alors joker !

Merci Romain !

Cette édition est terminée, merci de l’avoir lue. Si elle vous a plu, vous pouvez la partager en cliquant juste ici :

Partagez Generative

Vous pouvez également me suivre sur LinkedIn et activer la cloche 🔔, je poste régulièrement sur l’intelligence artificielle générative. Vous pouvez également me contacter pour toute proposition de création, intervention, conférence, projet, formation liée à l’intelligence artificielle générative.

Et n’oubliez pas de vous abonner pour ne rien rater des prochaines éditions 👇

Generative