La déferlante de la vidéo IA
Bonjour les machines (et les autres), bienvenue dans cette nouvelle édition de GENERATIVE la (grosse) newsletter qui résume l’immanquable de l’actu de l’intelligence artificielle générative, vous présente les événements, les outils et les acteurs de cet écosystème.
Je commence une nouvelle fois avec des excuses pour le retard dans la parution, normalement prévue le vendredi midi. Je confesse une TRES grosse semaine avec pas moins de 4 sessions de formation IA, deux gros events IA, des repérages en vue de non pas un mais de deux tournages publicitaires la semaine prochaine, des visios à la pelle (merci Fireflies.ai pour les comptes rendus sans les mains), des rendez vous professionnels et des livrables à fournir en urgence-sinon-c’est-moins-drôle.
J’ai essayé d’arrêter le sommeil mais je n’ai pas encore réussi.
#OnlyHuman
Je tenterais bien le clonage mais dans l'attente, il faudrait que je me penche sur l’automatisation d’une partie de la rédaction de cette newsletter, sans en perdre le ton. Un nouveau challenge pour 2024.
Cette semaine, comme toutes les autres depuis le mois de novembre 2022, l’actu est riche. Et puisqu’on parle de novembre 2022, saviez vous que nous fêtons cette semaine le 1er anniversaire de chatGPT, le programme conversationnel qui, en attirant 180 millions d'utilisateurs à travers le monde et traitant plus de 2 milliards de requêtes, a placé l’intelligence artificielle générative sous les feux de tous les projecteurs et sans lequel cette newsletter n’existerait probablement pas ?
Happy birthday buddy !
Sans transitions aucune, regardons ensemble le sommaire de cette édition :
✔️ Les news de la semaine
✔️ Des events comme s’il en pleuvait
✔️ Dossier : la déferlante vidéo IA
✔️ RaiseLab : luxe et vidéo IA
Les news de la semaine
is AGI coming ?
Dans une récente interview au média The Verge, Sam Altman, CEO d’OpenAI, a confirmé implicitement l’existence du projet de super intelligence Q*, dont je vous parlais la semaine dernière. Cette info a cela d’intéressant que l’existence de Q* avait été brièvement démentie entre temps.
OperIA
Le navigateur Opera s’enrichi d'intelligence artificielle générative, avec un assistant personnel dénommé Aria. Intégré au navigateur, ses fonctionnalités comprennent la recherche d'informations, la génération de texte, la synthèse et la reformulation. Aria utilise les modèles d'OpenAI, principalement GPT-3.5, et est connecté à Google Search pour des informations à jour.
Opera propose aussi un générateur de texte personnalisé, permettant de choisir le ton du contenu. Cependant, la qualité du texte généré reste basique et laisse un peu à désirer. On attend un potentiel passage à GPT-4 pour de meilleurs résultats
Des débats et des droits
Le monde culturel français s'alarme de la position du gouvernement sur la protection des droits d'auteur à l'ère de l'IA. Critiquant un manque de défense de la propriété intellectuelle, des acteurs culturels s'inquiètent de la législation peu contraignante pour les fournisseurs d'IA, notamment sur la transparence des données d'entraînement. Ils craignent une utilisation non rémunérée de leurs œuvres par l'IA, en opposition aux approches plus strictes de pays comme la Chine, le Royaume-Uni et les États-Unis. Ce débat soulève des questions sur l'équilibre entre innovation et droits d'auteur.
Sports AI illustrated
Sports illustrated, sous la direction de The Arena Group, est impliqué dans une controverse pour avoir publié des articles rédigés par IA et attribués à des journalistes fictifs, une pratique révélée par le site US Futurism.
Ces articles, marqués par des erreurs et des plagiats, ont été publiés sans indication de l'usage de l'IA. Face à l'indignation, The Arena Group a supprimé ces profils, sans toutefois aborder directement l'emploi de faux auteurs, ravivant des questions éthiques sur l'utilisation de l'IA en journalisme.
Elon prédit, le monde écoute
Lors d'une interview controversée, le PDG de Tesla et SpaceX a fait une prédiction audacieuse concernant l'intelligence artificielle générale (AGI). Selon Elon Musk, le monde est à moins de trois ans de créer une AGI qui aura la capacité "d'écrire un roman aussi bon que J.K. Rowling, de découvrir de nouvelles lois de la physique ou d'inventer de nouvelles technologies".
Cette déclaration optimiste contraste fortement avec les prédictions de nombreux experts en IA qui estiment qu’une AGI au niveau humain pourrait prendre des décennies à se développer.
Après le no-code : le “draw n’ code”
Une nouvelle technologie révolutionnaire permet de transformer instantanément un simple dessin réalisé sur son téléphone en une application web fonctionnelle. Basée sur GPT-4 Vision et la bibliothèque PencilKit, cette techno convertit n'importe quel gribouillis en code HTML. Il suffit ensuite d’un peu de clics pour générer sa propre application.
(IN)Stability
Stability AI, créateur du générateur d'images Stable Diffusion, se retrouve dans une situation financière précaire après l'échec d'une importante levée de fonds. La start-up britannique, en conflit avec son principal investisseur, cherche désormais un repreneur. Bien que la société ait levé 101 millions de dollars l'année dernière, sa trésorerie s'épuise rapidement, aggravée par les coûts de fonctionnement et le recrutement intensif de chercheurs. De plus, Stability AI fait face à des accusations de violation de propriété intellectuelle et à la démission de figures clés de son équipe, ajoutant à son instabilité.
SDXL Turbo
C’est dommage parce qu’ils sont bons chez Stability. Malgré leurs soucis financiers, ils ont dévoilé un nouveau modèle de génération d'images intitulé “SDXL Turbo”. Grâce à une technique novatrice, le modèle génère des visuels de qualité en un seul passage, contre 50 auparavant. Les capacités en temps réel de SDXL Turbo sont assez incroyables, comme en atteste la vidéo ci dessous :
Vous pouvez l’essayer sur la plateforme Clipdrop.
PANDA contre le cancer
Un outil d'apprentissage profond, PANDA, révolutionne la détection du cancer du pancréas via des scanners CT sans contraste. Le carcinome pancréatique ductal adénocarcinome (PDAC), un cancer très mortel, est souvent détecté tardivement. Les méthodes de dépistage traditionnelles sont limitées en raison de la faible prévalence et du risque de faux positifs. PANDA surmonte ces défis, en montrant une grande précision dans la détection et la classification des lésions pancréatiques. Il a été entraîné sur 3 208 patients et validé dans plusieurs centres impliquant plus de 6 000 patients. De manière significative, il a surpassé les performances moyennes des radiologues et a montré son potentiel pour le dépistage à grande échelle.
Source : https://www.nature.com/articles/s41591-023-02640-w
”L’avenir est ailleurs”
Figure de proue mondiale de l'intelligence artificielle, le Français Yann LeCun ne considère pas ChatGPT comme une avancée majeure. Bien qu'il ait contribué à des avancées comme les générateurs de textes et d'images, il les considère déjà dépassés. Lauréat du prix Turing en 2018, il reste critique envers l'IA actuelle, la qualifiant d'inefficace. Pour lui, le véritable progrès résidera dans l'amplification de l'intelligence et de la créativité humaines grâce à l'IA.
Amazon passe la seconde
Lors de sa conférence re:Invent cette semaine, Amazon a dévoilé deux nouveaux outils d'IA destinés aux entreprises. Le générateur d'images Titan permettra d'intégrer des visuels générés par IA dans ses plateformes, dotés de filigranes invisibles. Le chatbot Amazon Q pourra quant à lui répondre aux questions des employés en accédant aux données internes des sociétés, grâce à une connexion aux outils de productivité.
Amazon souhaite rattraper son retard sur ses concurrents, qui proposent déjà leurs propres assistants virtuels et outils de génération d'images.
Shopping Muse
A l’approche de Noël, Mastercard lance Shopping Muse, un service de recommandations personnalisées par intelligence artificielle pour faciliter les achats de Noël. Basé sur l'historique client, Shopping Muse suggère des produits et accessoires adaptés via un chatbot. Mastercard mise ainsi sur l'IA pour optimiser l'expérience d'achat, augmenter la satisfaction client, et booster les ventes des détaillants.
Microsoft Paint 3.0
L’application historique Microsoft Paint intègre désormais l'intelligence artificielle (dans Windows 11). Paint s'enrichit d'un générateur d'images IA baptisé Paint Cocreator. Optimisé par DALL-E 3, il générera automatiquement trois propositions d'illustrations à partir d'un prompt fourni par l'utilisateur. Pour l'instant réservé aux testeurs, cet outil s'inscrit dans la course à l'IA menée par Microsoft face aux autres géants technologiques.
Régulation de l'IA en Europe
Les négociations autour du projet de loi européen sur l'intelligence artificielle achoppent sur la régulation des modèles génératifs comme ChatGPT. La France, l'Allemagne et l'Italie prônent l'auto-régulation de ces systèmes au lieu de règles contraignantes. Mais les eurodéputés, la Commission européenne et de nombreux chercheurs critiquent cette approche jugée insuffisante. Faute d'accord d'ici fin décembre, ce texte crucial pour encadrer l'IA risque d'être enterré avant les élections européennes de 2024.
Inflection vs GPT
La startup Inflection (éditrice du robot conversationnel Pi, concurrent de ChatGPT) a annoncé son nouveau modèle de langage, Inflection-2, prétendant surpasser ses concurrents directs tels que Google PaLM-2 et Claude 2, et se placer juste derrière GPT-4. Ce modèle est nettement plus puissant que son prédécesseur, Inflection-1, et offre une meilleure connaissance factuelle, un meilleur contrôle du style et un raisonnement amélioré. Inflection-2 excelle dans les tests de performance AI standard, mais reste en retrait par rapport à GPT-4 pour les tâches de codage et de mathématiques. Inflection prévoit de l'utiliser pour son chatbot Pi et de développer des modèles encore plus grands.
Avatars IA : les influenceurs 2.0 ?
Une agence d'influenceurs en Espagne a créé Aitana Lopez, un modèle IA de 25 ans aux cheveux roses, pour contourner les difficultés liées au travail avec de vrais influenceurs.
Avec plus de 142 000 abonnés sur Instagram et un succès auprès des annonceurs, Aitana gagne jusqu'à 1 000 $ par publicité. Face à cette forte demande, l'agence envisage de créer davantage de modèles IA, inaugurant potentiellement une nouvelle tendance pour les marques. Je crois que je dois être trop vieux pour comprendre ce genre d’”innovation.”
Deepfake éléctoral
Lors de l'élection argentine, les camps de Javier Milei et Sergio Massa ont utilisé des images générées par intelligence artificielle pour caricaturer leur adversaire. Milei a notamment publié un montage montrant Massa en militaire communiste. Selon des experts, ces deepfakes électoraux inquiétants se multiplient à l'international. Ils brouillent les frontières entre vrai et faux et menacent la démocratie. Certains pays préparent une régulation pour que les publicités politiques intégrant de l'IA soient clairement identifiées. Mais en Argentine, aucune proposition n'a encore émergé.
Des events IA comme s’il en pleuvait
Lorsque j'ai démarré mon aventure dans l'intelligence artificielle générative il y a quelques mois, j'étais loin d'imaginer qu'un jour je me retrouverai en position d'intervenir pendant l'AIM, le plus gros événement consacré à l'IA dans la région Sud, et ce, dans l'enceinte du mythique stade Vélodrome à Marseille, ma ville d’adoption depuis quelques mois 🌞
L'affiche était presque aussi belle que l'équipe de l'OM championne d’Europe en 1993, avec des intervenants tels que Thierry Breton, Laurent Daudet, Rédouane BELLEFQIH, Yannis Daubin, Aliette Mousnier-Lompré, Xavier PERRET, Stephan Hadinger, Kristina Cambefort, ou encore Arthur Mensch, CEO et cofondateur de Mistral AI.
Je remercie donc chaleureusement le média La Tribune, Comptoir IA et mon ami Nicolas Guyon de m'avoir donné cette opportunité.
Au delà du plaisir de partager ma passion et mes travaux avec l'IA générative et d'intervenir en compagnie de mes talentueux camarades Neïla Romeyssa et Rémi Rostan (dont j’ai parlé dans des éditions récentes de GENERATIVE), c'est la découverte d'un écosystème local qui m'enchante et ouvre des perspectives excitantes pour l'avenir.
Le mercredi suivant, j’étais à Paris pour l’incontournable rendez vous du dernier mercredi du mois, a.k.a. le meetup de Comptoir IA, dont j’affectionne toujours autant l’ambiance, la ligne éditoriale axée création et inventivité et la qualité répétée des intervenants. Cette semaine ne dérogeait pas à la règle avec des présentations de
Tristan Lécuyer, Fondateur de The IFC, une plateforme qui rassemble des joueurs du jeu vidéo FIFA.
The IFC utilise l’IA pour extraire à la volée les scores et stats des rencontres, et même de faire du matching de joueurs de niveau équivalent et elle peut aussi coacher les joueurs sur la composition optimale de leurs équipes. Impressionnant.
Charlotte Cohen, co-founder de l’agence Braand Studio, a montré comment elle a co-créé avec Thierry Chovanec une vidéo entièrement en IA générative en combinant 12 outils IA différents, du talent et de l’ingéniosité.
J’étais ravi de retrouver Rémi Rostan, avec qui j’avais partagé la Tribune marseillaise au Vélodrome quelques jours plus tôt. Rémi est l’auteur du LHC (Les Heures Claires), généré à "99% par l'IA", que je vous avais présenté ICI.
Max Guerois et Maxime- Berthelot ont raconté la création du #ZeroClub, axé sur la longévité humaine, et ont discuté du blueprint de Bryan Johnson, ce milliardaire américain qui dépense 2 millions de $ par an pour inverser sa sénescence.
Alexandre Lavallee a monté en quelques prompts le squelette d'un documentaire IA sur Jean Moulin. Il a aussi fait la démo de son prochain produit "Short Maker History" qui avec un sujet et quelques lignes de contexte est capable de propose un scénario et un moodboard sur n’importe quel sujet. Alexandre sera l’un des prochains invités de la rubrique “Et toi, tu fais quoi avec l’IA ?”.
Argil continue d’enchainer les nouveaux cas d'usage, ce mois-ci Laodis Menard a simplifié à l'aide de ChatGPT Vision, le pensum ultime des développeurs : la documentation du code. Les screenshots et la description sont générés en deux minutes. Et son associé Brivael Le Pogam m’a soufflé dans l’oreillette que de nouvelles fonctionnalités sont à attendre du côté de la vidéo chez Argil. A suivre de très près.
Et merci à Sane Lebrun, auteur de l’excellente newsletter IA marketing Upmynt, d’avoir co-animé avec moi la traditionnelle session d’open prompting, dont l’objectif était de comparer Midjourney à Musavir.
Jeudi, je participais aux Gen AI days, un événement dense avec des intervenants de grande qualité, dont je vous reparlerais très prochainement ici
La déferlante de la vidéo IA
J’en parle très régulièrement ici, si l’IA générative progresse à pas de géants dans de nombreux domaines, les avancées parmi les plus spectaculaires ont lieu dans le domaine de la vidéo.
Balbultiante en début d’année 2023, avec des générations saccadées aux résultats très aléatoires, la génération de vidéos par l’IA générative a connu récemment des progrès fulgurants qui présagent de rendus photoréalistes pour le premier trimestre 2024, au doigt mouillé.
Revenons sur les récentes annonces et mises à jour des principaux outils du marché. J’espère que vous êtes prêts et bien assis : les news sont nombreuses et assez impressionnantes. C’est parti :
Runway a ouvert le bal dès la semaine dernière avec une nouvelle fonctionnalité appelée “motion brush”, qui permet d’animer une partie d’une image fixe. Regardez :
Dans la foulée, Runway a annoncé des contrôles avancés dans la génération de vidéo, qui permettent de réaliser des “mouvements de caméras” virtuels de plus en plus avancés.
La startup krea.ai, qui propose un outil avec lequel j’ai beaucoup joué ( qui permet entre autres, d’intégrer des logos à des visuels générés par l’IA), a encore fait parler d’elle avec une nouvelle fonctionnalité : un upscaling génératif (qui améliore la résolution et la qualité d’une image en générant de la matière neuve).
Cette nouveauté intervient quelques jours après l’annonce d’une fonctionnalités intéressante dont je vous ai parlé récemment, le “Real Time Generation” :
Puisqu’on parle d’upscaling, la semaine dernière est sorti Magnific.ai, un logiciel IA spécialisé dans l’upscaling. Les résultats sont spectaculaires. Lara Croft approuve ce message :
Un nouveau venu dans la vidéo générative apparait avec PixVerse. Accessible depuis Discord, il suffit de taper /create et de prompter vos idées. Les résultats sont étonnants pour une v1. Vous pouvez vous inscrire ici.
La start-up américaine HeyGen vient de lever 5,6 millions de dollars et lance « Instant Avatar », une technologie révolutionnaire permettant de créer un avatar personnalisé ultra réaliste en seulement 5 minutes de selfie vidéo avec un smartphone.
Alibaba Research a dévoilé une technologie révolutionnaire qui permet d'animer presque tout type de personnage à partir d'une simple photo. Adaptée aux personnages 3D, humains réels, photos de mode et personnages d'anime, cette innovation bientôt accessible promet des animations de haute qualité indiscernables des créations humaines.
Martin Haerlin, le créatif expert de Runway Gen-1 dont je vous parlais encore récemment a sorti une nouvelle vidéo qui lorgne ostensiblement vers le monde publicitaire. Le résultat est spectaculaire :
Et parce que vous êtes aussi curieux de moi de comprendre les secrets de fabrication de ce type de contenus, voici le making of de la vidéo :
Enfin, très récemment c’est Pika Labs qui vient de jeter un énorme pavé dans la mare avec l’annonce de Pika Art 1.0, dont la bande annonce est probablement ce qu’on a vu de plus spectaculaire depuis le début que l’IA est capable de générer de la vidéo. Vous n’êtes pas prêts, moi non plus, regardez moi cette démo :
Mon sentiment est une accélération vertigineuse des progrès de l’IA générative en matière de génération de vidéo. Nous sommes de plus en proches de pouvoir générer des contenus de qualité professionnelle avec quelques prompts.
Ceci sonne t-il le glas de la création audiovisuelle ? Question récurrente à laquelle je réponds “Non”.
Les outils facilitent, démocratisent, élargissent le champ des possibles, optimisent les process et accélèrent les workflows.
Mais in fine, quels sont les contenus les plus intéressants ? Ceux qui sortent du lot ? Ce sont ceux qui ont été conçus avec des vraies idées et une bonne exécution. Deux éléments indispensables que l’IA n’est pas encore en mesure de générer de manière autonome.
Humains, la création a encore besoin de vous.
Paris accueille la Révolution Gen AI dans le Luxe
Le 11 décembre prochain, le camarade Stéphane Galliéni organise le RAISELAB, un événement parisien consacré à l'IA dans le luxe, la mode et la beauté.
De 08h30 jusqu'à la fin de journée, des conférences, masterclasses et ateliers réuniront experts et passionnés pour explorer l'impact de l'IA dans les industries créatives. J’avais prévu de participer, mais un impératif professionnel m’en empêchera. Ce n’est que partie remise pour la prochaine édition.
Toutes les infos ici :
https://blstkart.mailchimpsites.com/
Cette édition est maintenant terminée. Si elle vous a plu, vous pouvez la partager en cliquant juste ici :
Vous pouvez également me suivre sur LinkedIn et activer la cloche 🔔, je poste régulièrement sur l’intelligence artificielle générative. Vous pouvez également me contacter pour toute proposition de création, intervention, conférence, projet, formation liée à l’intelligence artificielle générative.
Et n’oubliez pas de vous abonner pour ne rien rater des prochaines éditions 👇