Bardera, bardera pas ?
Bonjour les humains augmentés, bienvenue dans cette nouvelle édition hebdomadaire de GENERATIVE, la newsletter qui parle d’intelligence artificielle générative, de ses outils et de ses usages.
Au sommaire cette semaine :
La traditionnelle avalanche de news, caractéristique de l’ébullition actuelle du monde de l’IA générative
Zoom outil IA : FullJourney. Images, Video, Audio all-in-one
Google Bard est en fin disponible en France ! Que vaut-il comparé à chatGPT ?
“Layers”, mon (très) court métrage réalisé avec l’intelligence artificielle
C’est parti !
Les news de la semaine
La grande truanderie
Dans une lettre ouverte publiée dans le journal "Libération", le journaliste Erwan Cario critique sévèrement ChatGPT qu'il qualifie d'"escroquerie".
Cario souligne que ChatGPT n'a aucune capacité de compréhension et ne peut être ni fiable ni éthique. Il ne fait que générer des réponses crédibles, qui “feignent le réel”, sans tenir compte du sens ou de la véracité. De plus, il a absorbé les pires biais et discriminations humaines sans pouvoir les identifier. Pour éviter des réponses scandaleuses, OpenAI a dû ajouter des couches de contrôle pour lisser les propos de ChatGPT.
Enfin, Cario critique l'illusion d'humanité que ChatGPT crée, générant une attention et une empathie disproportionnées. Il conclut en affirmant que le danger des IA n'est pas l'émergence d'une super-intelligence, mais plutôt la médiocrité de la simulation de pensée qu'elles proposent.
Un point de vue intéressant, qui ouvre la porte au débat.
Restons naturels
Continuons de bâcher chatGPT avec cette campagne d’affichage pour la marque Loué, sortie mercredi et visible dans les abribus de France.
La campagne buzze bien sur sur les réseaux, au point de se faire elle aussi bâcher.
Des procès
L'humoriste Sarah Silverman et les écrivains Chris Golden et Richard Kadrey ont intenté une action en justice contre OpenAI et Meta, les accusant d'avoir illégalement formé leurs IA sur du contenu sous droit d'auteur. Ils soutiennent que ces entreprises ont utilisé d'importantes bibliothèques en ligne pour entraîner leurs systèmes. Ces poursuites, problématiques pour les firmes technologiques, pourraient redéfinir les limites du droit d'auteur et prendre des années à résoudre. Il est probable que OpenAI et Meta invoquent l'usage équitable, arguant qu'ils utilisent les livres pour créer des résumés, pas pour reproduire le texte original.
A suivre…
Discrimination
Selon une étude récente, les programmes informatiques utilisés pour détecter les travaux générés par l'intelligence artificielle, tels que les dissertations et les demandes d'emploi, pourraient discriminer les personnes dont l'anglais n'est pas la langue maternelle.
Les chercheurs ont testé sept détecteurs de texte IA populaires et ont constaté que les articles rédigés par des personnes non anglophones étaient souvent à tort signalés comme étant générés par l'IA.
Les programmes examinent ce qu'on appelle la "perplexité du texte", qui est une mesure de la surprise ou de la confusion d'un modèle de langage génératif lorsqu'il essaie de prédire le mot suivant dans une phrase. Les chercheurs mettent en garde contre les implications sérieuses de ces détecteurs pour les étudiants, les universitaires et les demandeurs d'emploi non natifs et appellent à une réflexion pour éviter les situations de discrimination.
Med-PaLM2
Google teste son outil d'intelligence artificielle dédié à la santé, Med-PaLM 2, dans des hôpitaux de recherche depuis avril.
Med-PaLM 2 est une variante de PaLM 2, le modèle de langage qui sous-tend Bard de Google. Google estime que Med-PaLM 2 peut être particulièrement utile dans les zones du Monde où l'accès aux médecins est plus limité.
L'outil a été formé sur un corpus de données médicales, ce qui, selon Google, le rend plus efficace pour les conversations de santé que les chatbots généralistes comme Bard, Bing et ChatGPT. Cependant, une étude a révélé que les médecins ont trouvé plus d'inexactitudes et d'informations non pertinentes dans les réponses fournies par Med-PaLM et Med-PaLM 2 que celles d'autres médecins.
Malgré cela, Med-PaLM 2 a performé aussi bien que de vrais médecins sur presque tous les autres critères, tels que la démonstration de raisonnement ou la fourniture de réponses soutenues par un consensus.
La Chine régule
La Chine a publié jeudi des mesures pour gérer son industrie d'intelligence artificielle générative en plein essor. Les nouvelles règles, décrites comme "intérimaires", entreront en vigueur le 15 août. Elles sont moins contraignantes que celles esquissées dans un projet d'avril.
L'Administration du Cyberespace de Chine a déclaré que seuls les fournisseurs souhaitant offrir des services au public devront soumettre des évaluations de sécurité.
Quid des développements non publics, comme les projets militaires par exemple ?
La Chine voit l'IA comme un domaine où elle veut rivaliser avec les États-Unis et a pour objectif de devenir un leader mondial d'ici 2030.
La Chine toujours , sur le front des prompt-to-image
Alibaba, le géant chinois du commerce électronique, a récemment fait sensation lors de la conférence mondiale sur l'intelligence artificielle en Chine. L'entreprise a dévoilé un générateur d'images basé sur l'intelligence artificielle, nommé Tongyi Wanxiang.
Selon Alibaba, ce nouvel outil pourrait rivaliser avec DALL-E et MidJourney.
Tongyi Wanxiang sera dans un premeir temps disponible en version bêta pour les clients de l'entreprise.
Cette annonce soulève également des questions sur la manière dont le gouvernement chinois pourrait réagir. En effet, il est possible que des restrictions majeures soient imposées à l'utilisation de cette technologie, compte tenu de la tendance croissante à la régulation de l'IA à travers le monde. En clair, verra t-on un jour Xi Jinping en doudoune de grand couturier ? La question est lancée.
Comme un CHARM
L'intelligence artificielle continue de révolutionner la médecine avec CHARM, un outil capable d'aider les médecins à traiter les tumeurs cérébrales en identifiant rapidement leurs caractéristiques.
Moins précis que les tests génétiques actuels, CHARM compense par sa rapidité, offrant des prédictions presque instantanées qui peuvent accélérer le traitement. Actuellement, le profilage génétique d'un gliome peut prendre plusieurs jours ou semaines. CHARM, entraîné sur des images d'échantillons chirurgicaux, distingue les cellules tumorales malignes des bénignes et détermine la gravité de la tumeur.
L'impact de CHARM est considérable. La possibilité d'obtenir des résultats quasi instantanés est déjà un changement de paradigme. Il est stimulant d'imaginer où nous en serons dans les dix prochaines années avec les progrès futurs de l'IA dans le domaine médical.
IA militaire
Le Pentagone expérimente l'IA générative dans les opérations militaires, testant actuellement cinq modèles de langage de grande taille (LLM). Supervisés par le bureau numérique et d'IA du Pentagone, avec des hauts gradés et alliés des États-Unis, ces modèles, dont le Donovan de Scale AI, utilisent des informations opérationnelles classifiées. L'un d'eux a répondu à une demande d'informations en 10 minutes, contre plusieurs heures ou jours auparavant.
L'objectif est de moderniser l'armée américaine via l'IA. Cependant, des préoccupations persistent sur les biais, les erreurs d'information et les vulnérabilités aux cyberattaques. Je sens que le domaine militaire augmenté par l’IA va devenir un sujet particulièrement sensible dans les années à venir.
Elon Musk et l’IA : “je t’aime, moi non plus”
Elon Musk, le célèbre entrepreneur à la tête de Tesla et SpaceX, a officiellement lancé sa nouvelle entreprise d'intelligence artificielle, X.AI (xAI Corp), le 12 juillet dernier.
L'objectif de cette entreprise est de développer une IA "maximalement curieuse", capable de comprendre la véritable nature de l'univers, selon Musk. Il a également affirmé que cette IA serait "pro-humanité". Pour réaliser ce projet ambitieux, Musk a recruté des ingénieurs ayant travaillé chez DeepMind, la filiale IA d'Alphabet, maison mère de Google.
X.AI collaborera étroitement avec d'autres entreprises de Musk, dont Twitter et Tesla. Cette annonce intervient dans un contexte où Musk et d'autres professionnels de l'IA ont récemment exprimé leurs inquiétudes quant aux risques que l'IA pourrait représenter pour l'humanité.
l’IA prédictive pour sauver les forêts et les vies humaines
Pano AI, une startup spécialisée dans l'intelligence artificielle, vient de lever 17 millions de dollars en série A pour aider à sauver des vies en détectant les premiers stades des incendies de forêt.
L'entreprise installe des caméras haute définition contrôlables à distance dans les zones à risque, dont les images sont contrôlées par l'IA. La technologie alimentée par l'IA est capable d'alerter les pompiers et de les envoyer sur les lieux plusieurs heures plus tôt que ce qui est fait actuellement.
Il s'agit là d'un excellent exemple d'utilisation vertueuse de l'IA pour le bien de l'humanité. Alors que la crise actuelle des incendies de forêt au Canada continue de s'aggraver chaque année, l'utilisation de l'IA pour aider à la détection précoce est un grand pas en avant dans la prévention.
IA géologique
Bill Gates, via son fonds Breakthrough Energy Ventures (BEV), a investi 20 millions de dollars dans GeologicAI, une entreprise canadienne spécialisée dans les technologies minières. Fondée en 2013, GeologicAI se concentre sur l'offre d'analyses de roches pour l'exploitation minière moderne, utilisant l'intelligence artificielle pour créer des robots géologues.
La technologie de GeologicAI permet d'analyser des échantillons de roches et d'identifier des ressources minérales précieuses bien en dessous de la surface de la Terre. C'est une avancée à un moment où le monde est confronté à une pénurie d'approvisionnement en minerais, en raison de la demande croissante de technologies énergétiques “propres”.
Claude M.C.
Anthropic, une start-up fondée par d'anciens membres seniors de l'équipe OpenAI, a lancé Claude 2, un concurrent de ChatGPT. Accessible au public via un site bêta et une API, Claude 2 est une IA générative qui a démontré des performances impressionnantes dans divers tests, y compris l'examen du barreau et le test de codage Python. Il peut également répondre à des questions beaucoup plus longues - aussi longues que "Cent ans de solitude" (460 pages tout de même).
Bien que ses performances soient légèrement inférieures à celles de GPT-4, qui alimente ChatGPT, Anthropic cherche à se distinguer par son engagement envers une utilisation “plus responsable et éthique de l'IA”.
Pour accéder à Claude 2, les utilisateurs aux États-Unis et au Royaume-Uni peuvent s'inscrire gratuitement sur le site web d'Anthropic. Pour vous et moi, il reste les VPN.
Je teste très prochainement !
Zoom outil IA : FullJourney
J’ai eu récemment connaissance d’un outil de génération d’images et de vidéos par intelligence artificielle qui s’appelle “FullJourney” (gros clin d’œil à qui vous savez). L’ambition est de proposer une “suite complète de création audiovisuelle”. En effet, on peut y créer des images, des vidéos ou encore de l’audio.
La prise en main est ultra simple si vous êtes déjà familiarisés avec les serveurs Discord.
Depuis le channel “video generation”, vous avez accès à plusieurs commandes dont :
/video - Pour créer une vidéo AI à partir d'un texte
/movie - Pour créer un film AI avec de l’audio à partir du texte saisi.
Les résultats sont assez… aléatoires. Parfois effrayants, parfois impressionnants, et globalement assez amusants.
Quelques exemples dénichés sur le serveur :
”Zinedine Zidane eating spaghettis”
“Romance in ancient Persia”
”Breakdancing in the Forest”
Le générateur d’images est plutôt performant, probablement meilleur que celui de Blue Willow, dont je parlais ICI.
Les commandes sont nombreuses :
/make <prompt> - Génère une grille d'images 2x2 basée sur le prompt fourni.
/adjust - Ajuste des éléments tels que les expressions, les émotions ou les détails d'une image.
/describe - génère un prompt basé sur une image uploadée par l’utilisateur, comme dans Midjourney.
/upscale - Augmente la taille d'une image jusqu'à quatre fois sa taille actuelle.
/blend - Mélange deux images pour créer une nouvelle image unique.
/vector - Génère un fichier SVG vectoriel zoomable à l'infini de votre image.
Quelques résultats glanés sur le serveur :
Encore plus fort, FullJourney peut également réaliser des musiques (la qualité n’est pas dingue mais c’est encourageant pour la suite) et aussi des deepfakes assez grossiers, auxquels on ne peut pas faire tenir de propos polémiques ou offensants (et c’est tant mieux).
Au final, un outil surprenant, dont je suis curieux de suivre les évolutions futures.
Si vous voulez essayer, c’est par ici : https://discord.gg/rrpFJU8q
Google Bard officiellement disponible !
TLDR : Si vous êtes pressés
Google Bard vs. ChatGPT : Explication des principales différences
ChatGPT est entraîné avec des textes de diverses sources, dont Common Crawl, livres, articles, documents, Wikipedia, et internet, mais ses informations sont limitées à celles publiées jusqu'en septembre 2021.
Bard, en revanche, collecte des données en temps réel sur internet.
Les deux chatbots IA sont gratuits.
ChatGPT propose une version payante, ChatGPT Plus, qui coûte 20 $/mois et offre des avantages tels que l'accès à chatGPT4, de meilleurs temps de réponse, l’utilisation des plugins et un accès rapide aux nouvelles fonctionnalités.
A l’usage, Bard est agréable mais globalement moins performant que chaGPT
3 mois après le “reste du Monde”, Google a lancé jeudi 13 juillet son outil de conversation basé sur l'intelligence artificielle, Bard, en France et dans 40 autres langues, couvrant ainsi environ 230 pays et territoires. Bard est un outil de conversation qui utilise l'intelligence artificielle pour générer des réponses à des questions ou des idées.
Pour résumer : C’est le chatGPT de Google.
Pour y accéder, il vous suffit de vous rendre sur le site officiel de Bard et de vous connecter avec votre compte Google. Vous aurez alors immédiatement accès au chatbot.
Bard s’utilise dans une interface distincte de celle du moteur de recherche de Google. Contrairement à son grand concurrent, ChatGPT, Bard est connecté à Internet, ce qui lui permet de fournir des informations à jour, de résumer des articles en ligne, etc…
En Europe, Google a pris des mesures pour se conformer aux réglementations sur la protection des données. Les utilisateurs seront informés de la collecte de leurs données et pourront choisir d'utiliser le produit avec ou sans la sauvegarde des conversations pour leur compte Google. Cette mesure vise à assurer la transparence et à donner aux utilisateurs le contrôle de leurs données.
Alors, faut il enterrer chatGPT ?
Pas si vite papillon ! Etudions Bard plus en détails.
TESTONS LA BÊTE
Malgré sa connexion à Internet, Bard peut parfois donner des réponses fantaisistes à certaines questions d'actualité. Un exemple :
Si les Denver Nuggets ont effectivement gagné le championnat NBA en 2023, c’est le premier titre de l’histoire de la franchise et non le deuxième. La deuxième information est également fausse, le français Tony Parker a lui aussi été élu MVP des finales en 2007 (et aussi le Nigérian Hakeem Olajuwon, l’Allemand Dirk Nowitzki, et le Grec Giannis Antetokounmpo en 2021). Ça fait beaucoup d’informations fausses pour répondre à une question simple et factuelle.
Le bon côté des choses, c’est que Bard est poli 😄
Google insiste sur le fait que Bard est encore en phase d'expérimentation et encourage les utilisateurs à donner leur avis sur Bard afin d'aider à améliorer le modèle.
Résumer des textes
Pour résumer des textes ou des articles, je trouve Bard moins performant que chatGPT. Lorsque je lui demande un résumé en 160 mots, il en rédige 350. Et quand je lui ai demandé de me faire un résumé qui fasse la moitié de la taille d’un article de 2 pages, il a rédigé 3 lignes 😅
ChatGPT est beaucoup plus précis dans cet exercice.
J’ai comparé les deux sur le terrain de la vulgarisation de connaissances scientifiques.
N.B. Par soucis d’équité, je compare Bard à la version gratuite de chatGPT (la 3.5)
De part l’usage qu’il fait des métaphores, je trouve chatGPT plus pédagogue et plus engageant dans ses réponses que Google Bard, en dépit d’une réponse un peu trop longue à mon goût. Et vous ?
Allons maintenant sur le terrain de la créativité. D’abord chatGPT :
Puis Bard :
Là aussi, y’a pas photo. ChatGPT respecte la consigne (avec des propositions pas géniales certes) là où Bard tombe à côté en proposant des pistes hors du registre de la comédie.
Testons les talents des chatbots en stratégie marketing. Voici le prompt :
Agis comme un directeur marketing. Créé le plan stratégique d’une campagne pour promouvoir une marque d'équipements de boxe anglaise. À toi de me fournir : les contours du public cible, les messages clés, un slogan phare, qui intègre les codes du public cible.
La réponse de Bard
ChatGPT
Je trouve ici aussi chatGPT plus pertinent que Bard dans son argumentation. Et vous ?
Ce que j’ai aimé en revanche avec Google Bard, c’est sa vitesse d’exécution. Ses réponses sont très rapides et s’affichent d’un coup, pas en mode “machine à écrire” comme chatGPT 3.5 en version gratuite (chatGPT est beaucoup plus rapide en version payante).
J’ai aimé également la fonction audio : Bard est capable de lire ses réponses, c’est à la fois surprenant et agréable. Il existe très probablement des domaines dans lesquels bard est plus à son aise que chatGPT. J’espère en trouver au fil de mon utilisation.
Pour conclure, je vous invite toutes et tous à tester Bard pour votre culture personnelle, et à le comparer avec chatGPT dans vos usages, afin de choisi l’outil qui convient le mieux à vos besoins.
LAYERS
Cette semaine, j’ai participé à un concours de court-métrages. Une sorte de retour aux sources pour moi qui ai commencé ma carrière de réalisateur en participant à des concours de court-métrages tournés les soirs et les week-ends.
Pour celui-ci, Les contraintes étaient une durée comprise entre 8 et 12 secondes (ce qui est EXTREMEMENT court) et de le réaliser avec un ou plusieurs outils d’intelligence artificielle.
J’ai saisi l’occasion pour utiliser une idée de court métrage SF que j’ai eue il y a plusieurs années, à un moment où j’étais assis dans un bus parisien qui traversait un quartier dans lequel j’avais mes habitudes lorsque j’étais étudiant.
L’endroit m’était si familier, que je pouvais presque me revoir assis en terrasse, avec les copains. De là m’est venue l’idée d’une personne qui se verrait elle-même. Comme si la fenêtre de ce bus ouvrait sur une réalité alternative, avec une temporalité différente.
J’ai écrit un petit bout de texte sur mon app de prise de notes, puis j’ai cherché une voix sur le site resemble.ai que personnellement je préfère à ElevenLabs, pourtant plus populaire. J’ai saisi mon texte dans l’app, qui m’a généré une voix off. J’ai choisi une voix chuchotante, pour retranscrire l’idée d’une pensée personnelle et intime.
La mise en images a été réalisée avec Gen-2, mon outil préféré de “prompt-to-video”.
On décrit une scène, et il la matérialise sous forme de vidéo, c’est toujours une expérience bluffante.
J’ai pas mal itéré avec certains plans pour lesquels je ne parvenais pas à obtenir exactement ce que je voulais.
J’ai ajouté quelques notes de musiques générées par Boomy, l’IA que j’ai utilisée pour créer le jingle de notre podcast IAtus. J’ai monté le tout à la main dans Adobe Premiere Pro.
Ce qui m'a le plus impressionné durant le process, c'est sa durée. Entre le moment où j'ai eu l'idée et le moment où j'ai exporté la vidéo finalisée, il s'est écoulé 2 heures. SI j’avais dû réaliser ce court de la manière traditionnelle, cela m’aurait pris plusieurs semaines (en incluant les demandes d’autorisation de la RATP pour pouvoir filmer dans un bus). Et je ne parle pas des coûts associés.
Le “AI Filmmaking” représente un changement de paradigme pour les jeunes (et moins jeunes) réalisateurs en herbe qui débordent d’idées mais manquent de moyens.
Layers
Cette longue édition est maintenant terminée, bravo de l’avoir lue jusqu’au bout ! Si la lecture vous a plu, un super moyen de m’en remercier est de partager GENERATIVE en cliquant ici 👇
Je vous souhaite un excellent week end prolongé du 14 juillet.
N’hésitez pas à me suivre sur LinkedIn et activer la cloche 🔔 pour être tenu informé des prochains posts, à consulter mon compte instagram dédié à la création assistée par l’IA, ni à me contacter pour toute proposition d’intervention, conférence, projet, formation liée à l’intelligence artificielle générative. Et bien sûr, à vous abonner à la Newsletter 👇