Salut aux humains et les chatbots qui nous lisent, et surtout bienvenue dans cette 40e édition de GENERATIVE, la newsletter qui résume l’actu de la Gen AI, vous présente des outils et des hommes de cet écosystème en ébullition technologique et médiatique depuis un peu plus d’un an.
Et bienvenue aux 303 (!) nouveaux lecteurs qui nous ont rejoint ce mois-ci. Merci à Yoann Lopez d’avoir cité GENERATIVE parmi ses sources d’infos FR préférées sur l’IA générative dans l’une des dernières éditions de sa célèbre newsletter Snowball.
Merci également à Sane Lebrun d’Upmynt et à Emmanuel Vivier pour les mentions sur Linkedin. GENERATIVE a désormais dépassé les 1000 abonnés, et compte un peu plus de 1600 lecteurs hebdomadaires ⚡⚡⚡
Au sommaire cette semaine, des news et pas des moindres, avec le réveil du géant Google qui semble avoir trouvé le moyen d'égaler de dépasser ChatGPT… du moins sur le papier et dans les vidéos démo.
Je vous présente également un outil de recherche augmenté par l’IA ainsi que mes dernières expérimentations visuelles en haute définition.
Let's go !
Si vous appréciez la lecture de cette newsletter hebdomadaire gratuite, la meilleure manière de soutenir mon travail, c'est de le faire découvrir à plus de personnes :
Au sommaire cette semaine :
✔️ Les news de la semaine
✔️ Un nouvel épisode de IATUS en ligne !
✔️ Perplexity.ai : la recherche internet augmentée
✔️ Magnific.ai et Krea.ai : l’upscaling génératif arrive !
Les news de la semaine
Google Gemini, le chatGPT Killer ?
Contrairement aux rumeurs de la semaine dernière qui parlaient de suspension, Google lance officiellement Gemini, un modèle d'intelligence artificielle ambitieux, pour rivaliser avec OpenAI et Microsoft. Ce modèle multimodal sera décliné en 3 versions : Nano, Pro, et Ultra. Nano fonctionnera sur les smartphones Android, tandis que Pro, déjà utilisé dans Google Bard, sera disponible pour les professionnels le 13 décembre, mais uniquement en anglais et hors Europe.
La version Ultra, prévue pour 2024, est en attente de vérifications de sûreté. Gemini promet des performances supérieures à GPT-4, notamment dans l'analyse de textes, sons, codes, images, et vidéos. Dire que nous sommes impatients de prompter la bête serait un doux euphémisme.
Je vous invite à visionner ne serait-ce que le début de cette vidéo pour un aperçu des capacités spectaculaires de Gemini. Attention toutefois, restons méfiants vis à vis de ces démos “too good to be true”. Regardez pour vous faire une opinion :
Et un comparatif fourni par Google, comme par hasard :
Je danse le MIA
Le ministère de l'Éducation nationale en France annonce le déploiement de "MIA" (Modules interactifs adaptatifs), une application d'IA développée pour les élèves de seconde. Disponible en septembre 2024 pour 800 000 élèves, MIA offre des outils d'approfondissement en français et mathématiques. Elle adapte les exercices aux besoins de chaque élève via un algorithme de renforcement, permettant une progression personnalisée. L'application comprend des modes variés, dont des tutoriels vidéo et un tableau de bord pour les enseignants. Son utilisation ne sera pas obligatoire, mais il y a de quoi avoir envie de revenir au Lycée.
Quels métiers les plus impactés par l’IA ?
Une étude du Département de l'Éducation du Royaume-Uni indique que l'IA pourrait avoir un impact plus significatif sur certaines professions que d’autres. Les consultants, comptables et psychologues seraient les plus vulnérables, tandis que les sportifs, couvreurs et ouvriers du bâtiment seraient parmi les moins affectés. L'étude met en évidence une disparité géographique et éducative dans l'impact de l'IA, les individus plus éduqués à Londres et dans le Sud-Est étant plus susceptibles d'être touchés (c’est une étude britannique).
Source : The Telegraph
Une IA qui a du nez
Des chercheurs ont développé une IA capable d'identifier l'origine géographique d'un vin avec une précision de 100%, en exploitant sa signature chimique. Ce procédé, testé sur 80 vins de Bordeaux, utilise le machine learning pour “analyser les chromatogrammes complexes des vins, réduisant leurs données en deux coordonnées pour identifier des signatures chimiques uniques à chaque domaine” (tout le monde suit ?). Cette avancée promet des applications dans la préservation de l'identité des vins et la lutte contre la contrefaçon.
Régulons… mais pas trop
Le ministre français du numérique, Jean-Noël Barrot, défend une régulation légère des modèles d'IA à usage général dans le projet de règlement européen sur l'intelligence artificielle, l'AI Act. Ce projet vise à encadrer les systèmes d'IA à risques élevés avec des audits et une transparence accrue. La France et d'autres pays européens s'opposent à des régulations plus strictes pour protéger leurs start-ups nationales. Le ministre souligne l'importance de créer des « champions européens » de l'IA et envisage des modifications législatives futures pour équilibrer la protection des droits d'auteur et le développement de l'IA en Europe.
Le cercle des poètes réapparus
Le projet Oupoco, dirigé par Thierry Poibeau, utilise l'intelligence artificielle pour créer des poèmes à partir d'une collection de 4872 sonnets de 760 auteurs. Ce projet, inspiré par l'Oulipo de Raymond Queneau, combine des vers en fonction des rimes et des structures de sonnets. Oupoco illustre l'équilibre entre créativité humaine et technologie, questionnant la notion de créativité chez les machines. Les modèles d'IA comme ChatGPT, basés sur de grands modèles de langue, permettent cette avancée technologique. Le laboratoire Lattice explore l'utilisation de l'IA pour l'analyse automatique de textes littéraires, en collaboration avec des chercheurs en littérature et en informatique.
Paresse cognitive
Une étude menée par Alain Lacroux de l'université Paris-I Panthéon-Sorbonne et Christelle Martin-Lacroux de l'université Grenoble-Alpes révèle que, face à des recommandations contradictoires entre un humain et une IA lors du recrutement, les recruteurs ont tendance à suivre les conseils de l'IA. Malgré une confiance initiale plus forte envers l'expert humain, cette tendance surprenante suggère une "paresse cognitive" des recruteurs, optant pour les suggestions algorithmiques. Cette découverte met en lumière non seulement les biais des algorithmes mais aussi ceux des recruteurs dans le processus de recrutement assisté par l'IA.
Et vous ? Quel est votre niveau de confiance en chatGPT ?
Microsoft muscle Copilot avec de l’ADN d’Open AI
Pour célébrer la première année d'existence de Copilot, Microsoft annonce de nouvelles fonctionnalités à venir pour son assistant virtuel, dont la prise en charge de GPT-4 Turbo. Outre DALL-E 3, Copilot intégrera également une fonction de réécriture de texte sur Microsoft Edge et une recherche approfondie sur Bing. Enfin, l'interpréteur de code de ChatGPT sera ajouté pour améliorer les calculs, l'analyse de données, et le codage informatique. Ces nouveautés renforcent Copilot dans les outils Microsoft, créant une expérience unifiée.
PornFakes
Le journal Le Monde rapporte l'augmentation alarmante des deepfakes pornographiques, exacerbée par les avancées de l'IA. Les victimes, souvent des femmes et des créatrices de contenu, sont représentées dans des situations érotiques sans leur consentement. Ces contenus sont largement diffusés sur des sites pornographiques, des forums et des réseaux sociaux. Pour lutter contre cette cyberviolence, un amendement français vise à pénaliser la diffusion de ces images, avec des sanctions sévères. Les plateformes sont également appelées à modérer ces contenus, soulignant l'urgence d'agir face à cette menace croissante.
Grok is here
Grok, le chatbot lancé par Elon Musk sur X (ex-Twitter) est enfin disponible. Réservé aux utilisateurs américains pour le moment, vous pouvez y accéder via un VPN (si vous avez un abonnement Premium +). Grok se démarque par sa capacité à accéder à des informations en temps réel, contrairement aux autres LLM.
Il sera intéressant de voir comment xAI, la startup à l’origine de Grok dirigée par Elon Musk, déploiera des méthodes innovantes pour filtrer les contenus dans Grok, en utilisant les tweets les plus populaires et les feedbacks communautaires pour distinguer les vraies infos des fakes news, parmi la quantité de données qui alimenteront le modèle en temps réel.
Video to 3D
La startup Move AI lance Move One, une app capable de transformer des vidéos en animations 3D. A première vue, ça a l’air très réussi :
IA Anti Gaspi
Orbisk, une start-up néerlandaise créée en 2019 et active dans 25 pays, propose une solution innovante pour réduire le gaspillage alimentaire. Déjà en place dans plusieurs grandes chaînes hôtelières en France, Orbisk utilise une technologie basée sur l'IA pour identifier et analyser les déchets alimentaires. Leur système, « Orbi », permet aux établissements de peser et d'enregistrer les déchets pour optimiser les processus de cuisine. Un accompagnement personnalisé est fourni pour maximiser la réduction du gaspillage, atteignant jusqu'à 60% la deuxième année. Orbisk cible principalement les grandes chaînes hôtelières et la restauration collective.
Une info importante lorsque que l’on sait que les pays “riches” jettent 30% de la nourriture qu’ils produisent. Trente Pour Cent. Abyssal.
Fin de grève à Hollywood
Après des mois de grève, les acteurs de Hollywood ont ratifié un accord avec les studios. 78% des membres du SAG-AFTRA, ayant participé au vote, ont approuvé ce contrat, qui inclut une hausse des salaires minimums, un système de primes pour les succès en streaming, et plus d'un milliard de dollars de compensations. L'accord aborde aussi l'encadrement de l'IA, avec une obligation d'informer le syndicat lorsque cette technologie est utilisée, permettant de négocier des compensations pour les acteurs impactés. Toutefois, certains acteurs restent critiques, craignant que l'IA ne finisse par remplacer les acteurs humains. Pour l’image, ce nest pas encore d’actu, mais pour le son (comédiens voix off et doublage), le sujet est réel. Nous l’avons abordé avec ma camarade Laura Ghazal dans…
IATUS
Avec Laura, nous vous avons préparé un nouvel épisode de IATUS, notre podcast qui démystifie et explique l'Intelligence Artificielle Générative.
Cette semaine nous parlons d'IA générative dans le domaine de la voix : clonage, doublage, voix off, métiers du son. Un sujet sensible mais nécessaire.
IATUS est disponible sur toutes les plateformes.
Bonne écoute !
PERPLEXITY.AI
Cette semaine, nous nous intéressons à un outil dont on parle relativement peu lorsqu’il s’agit d’intelligence artificielle générative et qui mérite pourtant le détour : Perplexity.ai
Perplexity AI, qu’est-ce que c’est ?
Perplexity AI est un moteur de recherche de style chatbot qui permet aux utilisateurs de poser des questions en langage naturel. Il utilise la technologie IA pour collecter des informations à partir de plusieurs sources sur le Web et fournir des réponses. Les utilisateurs peuvent poser des questions de suivi pour obtenir plus d'informations, et Perplexity répondra en fonction du contexte des interactions précédentes.
fondée en août 2022 par Denis Yarats, Aravind Srinivas, Johnny Ho et Andy Konwinski, se distingue dans le domaine des moteurs de recherche avec son produit phare, Perplexity Ask. Cette interface de recherche est propulsée par GPT 3.5 et Microsoft Bing.
Contrairement aux moteurs de recherche classiques qui fournissent des liens, Perplexity Ask résume les résultats pour offrir une réponse directe, complétée par des citations pour vérifier les informations. Son intégration d'informations en temps réel la rend particulièrement adaptée aux requêtes qui nécessitent des mises à jour fréquentes.
Un autre avantage majeur de Perplexity Ask est sa capacité à intégrer des informations en temps réel, surpassant ChatGPT qui limite ses données jusqu'à septembre 2021 pour la version gratuite (janvier 2022 pour chatGPT Plus)
Ainsi, Perplexity est capable de fournir des informations récentes, comme la date de sortie des derniers MacBook M3 par exemple.
La fonctionnalité de Perplexity Ask rappelle les réponses de Google à certaines requêtes avec une pop-up d'explication. Toutefois, Perplexity se rapproche de ChatGPT en permettant aux utilisateurs d'affiner et d'itérer les requêtes comme lors d'une conversation réelle. Malgré ses avantages, Perplexity Ask n'est pas à l'abri d’halluciner (fournir des informations inexactes), mais elle offre au moins la possibilité de vérifier les résultats grâce aux citations fournies.
En décembre 2022, Perplexity AI a lancé Bird SQL, une interface de recherche Twitter. Bird SQL, utilisant OpenAI Codex pour convertir le langage naturel en SQL (un langage de requête de bases de données), et qui permet aux utilisateurs sans expérience préalable en SQL d'accéder à des réponses basées sur la vaste base de données de Twitter. Bird SQL se distingue des moteurs de recherche traditionnels par sa capacité à visualiser, résumer et présenter les résultats avec des statistiques et graphiques générés à partir du langage naturel.
Parmi les avantages de Perplexity AI, on peut citer sa gratuité, la précision de ses réponses, sa convivialité, sa capacité à comprendre le contexte des questions et sa polyvalence pour différents types d'utilisateurs et de tâches.
Perplexity dispose d'une formule payante Pro avec encore plus de fonctionnalités. Cependant, la version gratuite est déjà extrêmement complète, je vous encourage à l’essayer généreusement avant de penser à souscrire une version payante.
Comparé à ChatGPT, Perplexity AI est évidemment beaucoup plus axé recherche. ChatGPT reste le Big Daddy indétrônable (“Attends donc de tester Gemini !” diront les GoogleFans) de la génération de texte de qualité.
En résumé, Perplexity AI mise sur l'alliance d'un moteur de recherche et d'un agent conversationnel pour fournir des réponses à la fois précises et itératives. Reste à voir si cette approche permettra à la start-up de s'imposer face aux mastodontes de la tech, tous lancés à pleine vitesse dans la course effrénée de l’IA générative.
Des générations en haute définition
Entre 15 visioconférences, 2 tournages publicitaires et des livrables à rendre juste avant des deadlines très serrées, j’ai trouvé cette semaine le temps de faire un peu de création visuelle, l’une de mes activités favorites sur cette planète.
L’une de mes quêtes avec l’IA générative, c’est le photoréalisme. De la même manière que la simulation d’une intelligence humaine me fascine chez un chatbot, le photoréalisme me fascine chez les générateurs d’images et de vidéos.
J’ai donc eu l’idée d’utiliser Musavir, l’outil de génération d’images le plus réaliste du marché, que je vous ai présenté récemment ici.
Et d’upscaler mes générations avec deux outils du moment : magnific.ai et Krea.ai.
Nous en avons parlé rapidement dans l’édition précédente : Magnific.ai et Krea.ai proposent une fonctionnalité d’upscaling génératif assez spectaculaire, regardez :
Du coup, je me suis demandé ce que ça pouvait donner appliqué aux visuels très réalistes générés par Musavir. Je suis parti d’un prompt exhumé d'un de mes tiroirs et j'ai cliqué sur “Generate” :
(Spoiler Alert : dans les mots clés du prompt il y avait “black and white”, “high contrast”, “man in suit” et “cat”).
Hormis quelques phalanges manquantes à la main gauche, un soupçon de 6e doigt à la main droite et un global manque de piqué (il s’agit d’une génération “standard”, pas d’un upscale 4k), je trouve le résultat plutôt réussi.
J’ai ensuite passé l’image à la moulinette Magnific.ai pour voir. Et (nouveau spoiler alert) je n’ai pas été déçu :
Si vous lisez ce passage sur votre smartphone, je vous invite à ouvrir la page sur votre ordinateur pour vous rendre à l'évidence : le niveau de détails est phénoménal. Et Magnific.ai a même corrigé le doigt en trop et les phalanges manquantes. Même la fourrure du chat est sensiblement plus détaillée.
Seule sa montre est devenue atypique et, avouons-le, un peu bizarre, mais globalement, je suis très impressionné.
J’ai ensuite modifié le prompt de sorte à tester la façon dont Musavir s’en sortirait sur le sujet de la diversité ethnique, un terrain où les générateurs d’images ne sont pas très à l’aise, la faute à une surreprésentation d’individus de type caucasien dans les datasets d’entrainement des modèles.
(Les 2 dernières images ont été upscalées avec Krea.ai. Toutes les autres avec Magnific.ai)
Le résultat brut, avant les retouches nécessaires à corriger les quelques bugs anatomiques et ajuster le niveau d'exposition et de contraste, est saisissant. Ces outils d’upscaling mettent les images IA à un tout autre niveau.
Cette édition est terminée. Si elle vous a plu, vous pouvez la partager en cliquant juste ici :
Vous pouvez également me suivre sur LinkedIn et activer la cloche 🔔, je poste régulièrement sur l’intelligence artificielle générative. Vous pouvez également me contacter pour toute proposition de création, intervention, conférence, projet, formation liée à l’intelligence artificielle générative.
Et n’oubliez pas de vous abonner pour ne rien rater des prochaines éditions 👇
"Des chercheurs ont développé une IA capable d'identifier l'origine géographique d'un vin avec une précision de 100%, en exploitant sa signature chimique".
Dommage de ne pas avoir une référence ou une publication, le nom des chercheurs... Merci en tous cas pour Générative. On y trouve des choses intéressantes !