Idéogrammes, avatars et conférences
Salut les humanoïdes sentients, bienvenue dans cette nouvelle édition de GENERATIVE, la newsletter qui vous présente l’actu internationale de l’intelligence artificielle générative, ses outils et ceux qui l’utilisent.
Au sommaire :
Les news de la semaine
l’outil de la semaine : ideogram.ai
Theia, un avatar divin généré par l’IA et par mes petites mains
Les news de la semaine
Amazon lit dans la paume de la main
Amazon One est une technologie qui utilise l'intelligence artificielle pour permettre aux clients de payer, présenter une carte de fidélité, ou entrer dans un lieu simplement en utilisant la paume de leur main.
Amazon One est actuellement en cours de déploiement dans plus de 500 magasins Whole Foods et divers autres lieux. La technologie utilise la lumière infrarouge pour scanner les lignes uniques et les veines de la paume, créant ainsi une "signature de paume" unique avec un taux de précision revendiqué de 99,9999%.
Le système serait également conçu pour protéger la vie privée des clients, ne pouvant pas percevoir le genre ou la couleur de la peau. L’expérience utilisateur a toujours été le cheval de bataille d’Amazon. Devons nous nous attendre à un développement exponentiel de solutions IA qui utilisent les données biométriques ?
ChatGPlagié
Jane Friedman, une autrice reconnue, a découvert que six livres signés de son nom (mais qu’elle n’a pas écrit) étaient en vente sur Amazon et Goodreads. Elle soupçonne que ces ouvrages ont été générés par une IA imitant son style.
Friedman a dû lutter pour faire retirer ces faux livres. L'Authors Guild, une organisation de défense des auteurs, appelle à une législation pour protéger les écrivains contre cette usurpation. Plus de 10 000 auteurs ont signé une lettre ouverte demandant aux entreprises d'IA d'obtenir le consentement des auteurs pour utiliser leur travail. Amazon a retiré les faux livres et enquête sur l'affaire.
“Cher ChatGPT, quels champignons me conseilles tu de consommer ?”
Dans un registre proche, des experts mettent en garde contre des livres de cueillette de champignons vendus sur Amazon, qui semblent avoir été écrits par des chatbots IA.
Ces guides contiennent des conseils dangereux et imprécis. Originality.ai, une entreprise spécialisée dans la détection de contenu généré par IA, a confirmé que ces livres avaient un score de 100% en matière de détection d'IA. De son côté Amazon a déclaré prendre cette affaire au sérieux et examine actuellement ces livres.
A l’heure qu’il est, les services informatiques d’Amazon doivent très probablement être en train de développer des IA détecteurs de contenus générés par l’IA…
L’économie du discernement
Dans un article paru récemment, Usbek et Rica abordent l'essor des intelligences artificielles (IA) génératives comme ChatGPT et Midjourney qui soulève des questions sur la vraisemblance et la réalité. Ces technologies, en imitant de près la réalité, brouillent les frontières entre le vrai et le faux, mettant à l'épreuve notre capacité de discernement. L'article d'Usbek & Rica explore cette "industrie de la vraisemblance", qui ne se limite pas à l'IA mais englobe également des phénomènes comme le complotisme. Ces pratiques partagent une caractéristique commune : elles offrent des réponses simples à des questions complexes, créant ainsi une réalité alternative.
Face à cette situation, l'article propose l'avènement d'une "économie du discernement". Il s'agit d'un appel à développer notre capacité à identifier les sources, à comprendre le contexte socio-culturel dans lequel émerge l'IA, et à distinguer ce qui a de la valeur pour le raisonnement. Le discernement n'est pas inné; il doit être cultivé et stimulé par un environnement propice.
Et vous ? Quelles seraient vos idées et propositions pour alimenter une “économie du discernement” ?
Canva et chatGPT
Un plugin Canva est désormais disponible pour ChatGPT. L’objectif est de faciliter la recherche de templates pour les utilisateurs. Disponible pour les abonnés de la version payante de ChatGPT, ce plugin permet de recevoir des suggestions de modèles pour diverses créations, allant des bannières de réseaux sociaux aux CV en passant par les reels instagram et les overlays Twitch.
Une fois le plugin installé, il suffit de faire une demande simple à ChatGPT pour recevoir jusqu'à cinq suggestions de modèles, chacune avec un lien vers Canva pour la personnalisation. J’ai rapidement testé, et ma première analyse c’est : “bof”
C’est moi ou c’est pas foufou ? J’étais parti avec l’idée de gagner du temps en sollicitant chatGPT pour m’orienter dans Canva, j’ai eu le sentiment de perdre plus de temps avec ce plugin que lorsque j’utilise Canva directement.
Et vous ?
Camarade chatbot
La Chine a lancé son premier chatbot "aux valeurs socialistes" nommé Ernie, développé par Baidu. Ce chatbot a connu un succès fulgurant, atteignant un million de téléchargements en seulement 19 heures après son lancement, surpassant ChatGPT d'OpenAI qui avait atteint ce seuil en cinq jours.
Ernie Bot peut générer du texte, des images, du son et de la vidéo. Il parle également plusieurs dialectes chinois et a acquis des compétences dans plus de 200 genres d'écriture. Baidu a investi 17,7 milliards d'euros en R&D au cours des dix dernières années. La Chine accélère le développement de l'IA avec une réglementation provisoire pour assurer la sécurité nationale et les intérêts publics.
Biotech et IA
Bayer, le géant pharmaceutique et biotechnologique, s'associe à Google Cloud pour intégrer l'intelligence artificielle dans ses activités principales. Le partenariat vise à optimiser les essais cliniques et la découverte de médicaments en utilisant les unités de traitement tensoriel (TPU) de Google Cloud. Pour simplifier, les TPU sont des ordinateurs très rapides pour qui servent à entrainer les modèles d’IA.
Ces TPU accéléreront les calculs de chimie quantique, offrant de nouvelles perspectives à Bayer, qui envisage également d'utiliser l'IA pour transformer le domaine de la radiologie. Ce qui me fait penser à mon interview d’Eric, mon ami radiologue, accessible ici
Un morceau IA aux Grammy Awards !
Vous vous souvenez probablement du titre fictif, "Heart on my Sleeve", créé par un auteur anonyme nommé “Ghostwriter” (J’en parlais ICI) et utilisant les voix de Drake et The Weeknd. Et bien ce titre est en lice pour les prochains Grammy Awards.
Le morceau est jugé éligible car "écrit par un humain", selon Harvey Mason Jr., PDG de la Recording Academy. Le titre est en compétition pour les distinctions de meilleure chanson rap et meilleure chanson de l'année. Le morceau a dû surmonter des obstacles juridiques, ayant été retiré de Spotify et Apple Music pour violation des droits d'auteur, avant de devenir viral sur les réseaux sociaux. Si le morceau était primé, cela soulèverait des questions importantes sur l'avenir de l'industrie musicale.
Ainsi soit il
L'intelligence artificielle s'invite dans le domaine de la foi avec le lancement de trois outils d'IA "catholique". Magisterium AI, Catholic.chat et Caté GPT sont des initiatives privées qui visent à répondre aux questions liées à la foi, aux sacrements et à l'histoire de l'Église.
Contrairement à ChatGPT, ces outils sont spécifiquement conçus pour fournir des réponses basées sur des textes catholiques officiels. Emmanuel Goffi, expert en IA, souligne que ces outils n'ont pas d'accréditation institutionnelle et ont un aspect commercial. Il met en garde contre leur utilisation comme substitut à une réflexion spirituelle profonde. Le Vatican, quant à lui, adopte une approche prudente, préférant mener une réflexion de fond sur l'articulation entre ces outils technologiques et la religion. J’avoue que c’est très tentant mais je ne pense pas que ce soit le bon moment pour ressortir la “photo” du pape en doudoune Versace.
Siri GPT en construction
Apple investit massivement dans l'intelligence artificielle, dépensant des millions de dollars chaque jour pour améliorer Siri et développer un nouveau chatbot nommé Ajax.
Le géant de la tech vise à faire de Siri votre assistant numérique ultime, capable d'exécuter des tâches complexes sans intervention humaine.
Quant à Ajax, il est conçu pour être plus performant que ChatGPT 3.5, avec un entraînement basé sur 200 milliards de paramètres. Toutefois, il reste à voir comment il se mesurera aux modèles plus récents d'OpenAI. Si les spécifications techniques ne sont pas un gage de qualité de résultat, nous sommes bien évidemment impatients de tester les outils d’IA d’Apple.
L’outil de la semaine : ideogram.ai
Celles et ceux qui utilisent régulièrement Midjourney et ses alternatives le savent bien : générer du texte correct relève la plupart du temps de la Mission Impossible.
C’est précisément cette problématique qu’adresse ideogram.ai, un générateur d’image gratuit, très performant dans la génération de texte.
Lancé en mode bêta le 22 août dernier, Ideogram AI a déjà attiré plus de 90 000 utilisateurs qui ont créé plus de trois millions d'images. La plateforme permet aux utilisateurs de créer quatre images à partir d'une invite textuelle (un prompt). Elle se distingue par sa simplicité d'utilisation, offrant des étiquettes cliquables pour des styles comme "photo”, "illustration", “peinture”, “rendu 3D”, etc…
Attention : il faut rédiger en anglais pour obtenir les meilleurs résultats.
Objectivement, si l’outil brille dans les styles cartoons, il n’est pas mauvais sur le terrain du photoréalisme :
Un autre atout d'Ideogram est son interface web avec des fonctions communautaires, offrant inspiration et une fonction de remix direct pour les images IA. Cependant, la résolution des images est encore un peu juste(1024 x 690 pixels en 16:9) et nécessitera un upscaling pour tout usage autre que digital.
Parce que vous l’aurez deviné, ideogram AI est un outil qui intéressera très certainement les graphistes et les designers, avec des objectifs potentiels de tirage / impression haute résolution. Dans la version gratuite, toutes les images générées sont publiques. Une version commerciale, qui devrait répondre aux besoins de génération privée ou de licences spéciales, n'est pas encore disponible.
En somme, Ideogram AI s'impose comme un acteur prometteur dans le domaine de la génération d'images et surtout de texte par l’IA.
N’hésitez pas à aller tester la bête : https://ideogram.ai/
Bientôt à la radio !
La semaine dernière, j’ai eu le plaisir de discuter d’intelligence artificielle générative avec le rédacteur en chef d’AirZen radio.
Des échanges stimulants autour de ce sujet qui me passionne, j’ai passé une excellent matinée. L’épisode devrait sortir bientôt, je vous tiens bien évidemment informés.
Theia, un avatar divin généré par l’IA et par mes petits mains
La semaine dernière lors d’un meetup Ia à Paris, j’ai présenté un projet que j’ai réalisé au mois de mai dernier, pour une marque spécialisée dans la technologie de verres de lunettes "intelligents", qui adaptent leur opacité / teinture en fonction des changements de luminosité ambiante. Ainsi, des verres de vue normaux en intérieur se transforment en verres solaires en extérieur. Laissez moi vous raconter ce projet, en détaillant mon processus de création de A à Z.
C’est parti !
Genèse
A l’occasion d’un événement de marque aux Etats Unis qui devait accueillir plus de 1000 personnes, la marque a eu l’idée d’un avatar IA avec lequel des speakers interagiraient sur scène. Le brief qu’ils m’ont donné était “un avatar à l’image de Theia, Titanide et déesse de la lumière et de la vue”.
1. Identifier Theia
Je ne vous mentirai pas : si je me suis un peu intéressé à la mythologie grecque pendant mon adolescence, je n’avais jamais entendu parler de Theia.
J’ai donc demandé à chat GPT de me la décrire. Evidemment, le bougre en savait beaucoup plus que moi sur le sujet, il m’a pondu un pavé :
Esquisser Theia
J’ai sélectionné la partie descriptive et l’ai copié-collée dans Midjourney. Les premiers résultats furent décevants.
Il manquait clairement une dimension divine, “shiny” et un peu autoritaire, au personnage. Il me fallait donc :Préciser Theia
Je modifiais le prompt en ajoutant quelques mots clés issus de mes nombreuses expérimentations avec Midjourney. Des mots comme : "detailed, intricate, hypermaximalist, ornate, elite, esoteric, attractive". Immédiatement, j’ai obtenu des résultats beaucoup plus conforme à l’idée que je me faisais du personnage.Après moultes itérations :
C’est confiant que je soumettais ces pistes à mon client, qui les a validées. Un consensus fut trouvé sur ce visuel :
Toutefois, la CEO de la marque nous fit un retour inattendu : elle craignait que le public ne trouve le visuel anxiogène. L’IA générative est, comme vous le savez, un sujet clivant. Certains s’enthousiasment, d’autres en éprouvent une certaine forme d’angoisse que la marque voulait éviter d’alimenter. La CEO nous a donc proposé un autre visuel, très différent.
Vous êtes prêt.e.s ?L’univers visuel était radicalement très différent de ce que je proposais. Il me fallait donc :
redesigner Theia
La méthode que j’ai utilisée a été de recourir à la fonction “/describe” de Midjourney. Describe permet de faire du “reverse prompting” : On uploade une image dans Midjourney, qui l’analyse et nous propose 4 prompts descriptifs. L’idée est alors d’utiliser un, plusieurs ou une combinaison de ces prompts pour générer une image proche de l’image de référence. Dont acte :
Bon point : La réutilisation des ces prompts produisait des résultats proches de l’image de référence.Cependant, il me fallait encore travailler pour revenir à un résultat divin.
Le Remix
L’idée qui s’imposait alors était de “remixer” mon visuel d’origine, celui d’une Theia qui imposait le respect avec la référence visuelle proposée par la CEO.En jouant avec les mots clés du prompt, j’ai pu retrouver quelques éléments visuels qui m’intéressaient dans ma Theia initiale, tout en conservant la direction que la marque souhait prendre avec l’apparence de l’avatar.
Après de nombreuses itérations :Mes premiers tests d’animation se sont révélés décevants lorsque le visage de l’avatar n’était pas parfaitement de face. L’autre enjeu était de faire sourire le personnage pour lui donner un côté avenant. Ça n’a l’air de rien, mais faire sourire un personnage dans Midjourney n’est pas chose facile.
Pour vous donner une idée, voici le prompt utilisé pour générer les 32 images ci-dessus :
”Large bright smile on the face of a beautiful ethereal goddess of vision and sight attire looks in the mirror, in the style of light pink and azure, hypermaximalist, ornate, elite, whimsical assemblages, pop inspo, detailed facial features, glitter, dusseldorf school of photography, eye - catching"
Et merci pour le sourire !
Après de nombreuses itérations, un consensus fut trouvé sur cette image :A l’époque (n’oublions pas que mai 2023 était le paléolithique supérieur sur la timeline de l’évolution supersonique des outils d’IA générative), le Generative Fill de Photoshop et le “VARY” de Midjourney n’existaient pas encore. J’ai donc utilisé DALL-E 2 pour “outpaint” (étendre) mon image :
Une fois l’image étendue et les bords de Theia créés, j’ai pu détourer Theia de l’arrière plan bleu. Cette étape est indispensable dans l’objectif d’incruster Theia dans un décor de fond que je serai amené à créer ultérieurement.
Pour y parvenir, plusieurs solutions existent, parmi lesquelles le site gratuit https://www.remove.bg/frJ’ai pour ma part opté pour un détourage dans Adobe Premiere Pro.
Animer Theia
De nos jours, un avatar, ça parle. Le moment était venu d’animer Theia. Je me suis dirigé vers la plateforme D-ID, qui permet non seulement d’animer n’importe quelle photo / image, mais également de la faire parler. Mais comme les voix proposées ne me plaisaient pas, j’ai commencé à faire le tour des plateformes de génération de voix par intelligence artificielle.Si ElevenLabs était la meilleure à l’époque (et l’est toujours probablement à l’heure où j’écris ces lignes, même si la nouvelle version de Play HT est très impressionnante), j’ai trouvé mon bonheur sur Resemble.ai.
J’y ai trouvé une voix féminine pleine de confiance et d’autorité, avec un accent qu’on pourrait qualifier d’anglais international.
J’ai ensuite rédigé les répliques de Theia en fonction du contenu du discours des speakers, et Resemble a généré la voix.
C’est le moment où je vous explique pourquoi j’ai rédigé les répliques de Theia plutôt que de la laisser répondre aux questions toute seule comme une grande comme j’en avais initialement l’intention.
Mon ambition était de faire communiquer l’API de chatGPT avec celle de D-ID. Concrètement, il s’agissait de “connecter” la version animée de Theia à chatGPT, et de communiquer avec le chatbot par synthèse vocale. L’objectif final était une discussion humaine à voix haute entre le speaker et l’IA, en direct.
C’est techniquement possible, nous avons mené des tests avec les équipes informatiques de mon client, localisées aux Philippines. Les équipes ont réussi à faire communiquer chatGPT et D-ID mais un temps de latence de 5 à 10 secondes persistait entre les questions et les réponses.
Dans le carre d’une présentation live, 10 secondes de silence, c’est long. Très long. Trop long. Sans parler des conditions du live (speaker au micro, acoustique particulière d’une grande salle) qui rendaient l’exercice hasardeux. Une décision a alors été prise d’éliminer les facteurs risques non maitrisables, en optant pour un dialogue mi pré-enregistré (pour Theia), mi live (pour les speakers).
Le résultat de l’animation était imparfait à l’époque (mi-mai) : les proportions du visage ne sont pas parfaitement respectées et le menton s’estompe un peu lorsque Theia baisse le visage.
Le modèle a bien progressé depuis, voici le résultat début septembre :Le décor
L'intention était de créer un "paysage naturel futuriste"
Les premières itérations se sont révélées intéressantes, mais leur look de faux arrière-plan Google Meet ou Microsoft Teams divisait les opinions.
Un accord a été trouvé sur ce décor plus neutre. je l’ai légèrement flouté pour simuler un effet de profondeur de champ, puis “outpainté” dans Dall-E. Theia a ensuite été incrustée. Quelques lumières de l’arrière plan et des mouvements dans l’herbe ont été animée sous Adobe After Effects.
Le format extra large correspond à celui de l’écran de diffusion de la vidéo, dans la salle de conférence de l’événement.Etape finale : les crédits de fin
Pour le générique de fin, l’idée initiale était de laisser Theia à l’écran et faire apparaitre en animation tous les outils IA utilisés. Le tout sur une musique des Chemical Brothers intitulée “Another World’.J’avais oublié ce titre et l’ai Googlé. Je suis tombé sur le clip, que j’ai visionné. Immédiatement, j’ai eu une idée : fusionner les images du clip avec le portrait de Theia, en utilisant un outil IA de génération de vidéos dont j’ai déjà parlé ici : Runway Gen-1
Mes premiers tests m’ont immédiatement enthousiasmé. J’obtenais une esthétique fascinante, à la fois très graphique et un peu difforme, qui symbolisait à mes yeux l’idée d’une “virtuosité maladroite” caractéristique des IA génératives de vidéo.Je me disais qu’un rendu aussi bizarre n’avait que peu de chances d’être validé par mes clients et pourtant… ils l’ont fait !
Le jour J, la keynote a rencontré un franc succès. J’étais à la fois heureux d’avoir pu travailler sur un projet créatif qui mobilisait autant d’outils Ia différents, et ravi des bons retours obtenus en interne par le commanditaire du projet, que je remercie à nouveau de m’avoir proposé cette stimulante opportunité.
J’espère que ce compte rendu vous aura intéressés. Cette édition est maintenant terminée, merci de l’avoir lue, je vous donne rendez vous la semaine prochaine pour une nouvelle grosse édition.
N’hésitez pas à partager cette édition, me suivre sur LinkedIn et activer la cloche 🔔 pour être tenu informé des prochains posts, à consulter mon compte instagram dédié à la création assistée par l’IA, ni à me contacter pour toute proposition d’intervention, conférence, projet, formation liée à l’intelligence artificielle générative. Et bien sûr, à vous abonner à GENERATIVE 👇