Salut les êtres humains ! Bienvenue dans cette nouvelle édition de GENERATIVE, la newsletter hebdomadaire qui parle d’intelligence artificielle générative, de news et d’outils.
Bienvenue aux 139 nouveaux abonnés qui nous ont rejoint ce mois-ci !
Vous êtes désormais plus de 1000 à lire GENERATIVE toutes les semaines !
Si vous appréciez la lecture de cette newsletter hebdomadaire gratuite, la meilleure manière de soutenir mon travail, c'est de le faire découvrir à plus de personnes :
Merci !
Au sommaire cette semaine :
l’avalanche de news du front de l’IA générative
AI Foodporn : mes expériences culinaires avec Midjourney
Un autre meetup IA très réussi à Paris
“Et toi, tu fais quoi avec l’IA ?” : l’interview de la talentueuse et éclectique Creative Artist Neïla Romeyssa
J’espère que vous êtes prêt.es, cette semaine a été particulièrement riche en news importantes.
C’est parti !
Les news de la semaine
ChatGPT reçoit une GROSSE mise à jour !
C’est clairement la news incontournable de la semaine : ChatGPT a dévoilé non pas une mais trois nouvelles fonctionnalités, chacune avec un potentiel de game changer :
1 - ChatGPT peut désormais (re)faire des recherches en temps réel sur le web, ce qui élargit considérablement sa base de connaissances et annihile les avantages de Bard et Bing Chat sur ce point.
Game changer.
2 - La deuxième fonctionnalité est la possibilité de converser vocalement avec les utilisateurs. Par exemple, vous pourrez demander oralement à ChatGPT d'inventer une histoire pour endormir votre petite dernière, avec quelques invites vocales pour guider la narration.
Ou plus simplement, poser oralement une question à ChatGPT qui répondra de manière vocale. Imaginez le gain de temps dans vos interactions avec chatGPT.
Game Changer.
3 - Enfin, et c’est probablement la mise à jour la plus spectaculaire, chatGPT sera désormais capable de “réagir” à des contenus multimédias comme des photos ou des vidéos. Did you say “Multimodal” ?
Tout le monde va commencer par jouer avec en lui faisant décrire des photos…
Ou encore tricher à “Où est Charlie ?”…
…Mais quelques petits malins iront plus loin dans l’exploitation de cette nouvelle fonctionnalité, comme McKay Wrigley, explorateur IA invétéré et founder d’une startup qui travaille sur un super assistant IA.
Il a griffonné à la hâte un diagramme sur un paperboard, l’a pris en photo, a donné la photo à chatGPT et lui a demandé d’en faire un programme (avec une interface), qui prend en compte toutes les annotations visibles.
Si vous êtes pressés, ne regardez que la première minute de la vidéo, c’est très impressionnant.
ChatGPT est en train de déployer toutes les fonctionnalités introduites lors du fameux Livestream de présentation il y a déjà plus de 6 mois. Les promesses de l’époque deviennent réalité et comme dirait Snoop Dogg : “Are we in a movie or what ?”
Deal historique entre Amazon et Anthropic
Amazon mise gros sur l'intelligence artificielle en annonçant investir jusqu’à 4 milliards de dollars dans la start-up californienne Anthropic. Fondée en 2021 par d'anciens cadres d'OpenAI, Anthropic est spécialisée dans l'IA générative et est connue pour son chatbot Claude, dont nous avons parlé ici il y a quelques semaines.
L'investissement initial d'Amazon est de 1,25 milliard de dollars, avec la possibilité de débloquer 2,75 milliards supplémentaires à l'avenir. En échange, Amazon Web Services (AWS) deviendra le principal fournisseur de cloud d'Anthropic. Cette alliance stratégique intervient alors qu'Anthropic est déjà en alliance avec Google, un autre géant de la tech. Ce partenariat pourrait aider Amazon à mieux se positionner dans la course face aux concurrents Google et Microsoft.
MultiLingofy
Spotify s'associe à OpenAI pour lancer une nouvelle fonctionnalité de traduction vocale alimentée par l'IA. Cette fonction permettra aux podcasteurs de traduire leurs épisodes en d'autres langues tout en conservant leur propre voix. Personnellement, j’ai eu besoin de lire 2 fois la phrase précédente pour en mesurer la portée.
Le service a déjà collaboré avec quelques “gros” podcasteurs américains pour traduire leurs épisodes en espagnol. Des traductions en français et en allemand sont également prévues. La technologie repose sur l'outil de transcription vocale Whisper d'OpenAI, qui peut transcrire et traduire des discours. Spotify prévoit d'étendre cette fonctionnalité à un groupe plus large de podcasteurs à l'avenir.
Tout ça me donne envie d’aller voir ma comparse Laura Ghazal, avec laquelle je co-anime le podcast IAtus et de lui sortir cette citation de Tony Montana :
OpenAI en route vers l’AGI ?
Selon un utilisateur de Reddit, OpenAI aurait développé "Arrakis", un modèle multimodal très supérieur à GPT-4.
Formé à 50% sur des données synthétiques, ce modèle pourrait représenter une avancée très significative dans l’évolution de l’IA générative. Sam Altman, PDG d'OpenAI, a affirmé que l'AGI a été atteinte en interne.
Pour mémoire, l’AGI (Artificial General Intelligence) se réfère à la capacité d'une machine autonome à effectuer l'ensemble des tâches intellectuelles qu'un être humain peut effectuer. On désigne aussi parfois l’AGI par le terme « intelligence artificielle forte ». Elle s’oppose à une IA faible ou étroite, pouvant uniquement être appliquée à des problèmes spécifiques (comme générer du texte avec un chatbot ou des images avec Midjourney par exemple).
Bien que ces déclarations puissent être exagérées à des fins marketing (l’AGI est un sujet qui divise les spécialistes. Certains pensent qu’on y sera avant 2030, d’autres pas avant 2050 et d’autres pensent qu’on ne l’atteindra jamais), il est plus que probable qu’OpenAi nous prépare des futures surprises en arrière cuisine. A suivre de près…
Truth, Justice, and the Microsoft way
Microsoft a annoncé qu'il assumera la responsabilité légale en cas de poursuites pour violation du droit d'auteur liées à l'utilisation de ses services d'IA Copilot. Dans un article de blog, le directeur juridique de Microsoft, Brad Smith, a déclaré que l'entreprise prendrait en charge les risques juridiques potentiels.
Smith a indiqué que l'entreprise avait choisi cette voie pour trois raisons : soutenir ses clients, comprendre les préoccupations des détenteurs de droits d'auteur et mettre en place des mesures de protection contre les violations potentielles du droit d'auteur. Le sujet est sensible : Microsoft, GitHub et OpenAI font déjà face à un procès alléguant que Copilot utilise du code sous licence sans en attribuer le crédit.
Quelle que soit l’issue de ce procès, cette prise de position de Microsoft est importante dans le cadre du nécessaire respect de la propriété intellectuelle attendu de la part de tous les grands acteurs de l’IA générative.
Generative AI by Getty Images
Getty Images, la célèbre banque d'images américaine, a décidé de se lancer dans le domaine de l'intelligence artificielle générative. Face à la concurrence croissante de générateurs d'images comme Midjourney et DALL-E, Getty a inauguré son propre outil basé sur l'IA, entraîné grâce à l'architecture de modèles conçus par Nvidia. Ce qui distingue cet outil, nommé "Generative AI by Getty Images", c'est qu'il utilise uniquement la bibliothèque de Getty, en excluant les images potentiellement problématiques, comme les photos de presse.
Un pas supplémentaire en faveur du respect du copyright !
Fin de la grève à Hollywood ?
Un accord temporaire conclu dans la nuit du 24 au 25 septembre dernier pourrait mettre un terme à la grève qui a mis à l'arrêt l'industrie du film et de la télévision aux États-Unis depuis le début du mois de mai.
Les Studios semblent avoir fait des concessions sur tous les fronts : en plus de la hausse des salaires, Ils se seraient engagés à garantir un effectif minimal de scénaristes pour chaque série télévisée et auraient également atteint un accord sur l'utilisation de l'intelligence artificielle pour réinterpréter des scripts classiques. Les scénaristes ont obtenu que les outils d'IA générative ne soient pas considérés comme leurs égaux et ne pourront pas être crédités comme auteurs. De plus, les studios ont accepté de rencontrer la WGA deux fois par an pour discuter de l'utilisation de l'IA dans le secteur.
La résolution définitive de cette crise dépendra toutefois de l'approbation de l'accord par les membres de la Writers Guild of America (WGA) et de la conclusion d'un accord similaire avec les acteurs.
Les Licornes de l’IA générative
Malgré un ralentissement des transactions de capital-risque dans le secteur technologique, les investissements dans les entreprises d'intelligence artificielle continuent de monter en flèche. Les prévisions d’investissements dans la recherche et les applications de l'IA annoncent 500 milliards de dollars d'ici 2024, tandis que PwC prévoit que l'IA contribuera à l'économie mondiale à hauteur de 15,7 billions de dollars d'ici 2030.
Voici 15 licornes de l'IA générative dont la capitalisation boursière a atteint au moins 1 milliard de dollars au mois d’août 2023.
JCDecaux et le deep learning
Lors du récent salon Big Data & AI Paris, JCDecaux a présenté un outil basé sur la technologie du deep learning, capable d’analyser les éléments clés d'une affiche publicitaire pour maximiser son impact.
L'outil prend en compte divers facteurs, tels que le texte, les couleurs, et même le mouvement dans le cas d'écrans digitaux. Il génère des "heatmaps" qui montrent où le regard des passants est le plus susceptible de se poser, permettant ainsi aux annonceurs de créer des affiches plus efficaces en un temps record.
A quand les affiches de pubs numériques qui nous interpellent par notre nom comme dans Minority Report (que j’ai revu le week end dernier) ?
Oui mais Non à l’IA générative
Alors que l'IA promet de révolutionner le secteur de la publicité, certains annonceurs ajoutent des clauses dans leurs contrats pour interdire son utilisation. Vincent Reynaud Lacroze, directeur général de l'agence We Are Social, évoque une "schizophrénie" des clients qui, d'un côté, veulent de l'innovation et, de l'autre, imposent des restrictions sur l'IA.
Les raisons de cette méfiance sont multiples : l'esthétisme de l'IA qui manque encore d'authenticité, et des questions juridiques non résolues liées aux droits d'auteur. Malgré ces obstacles, les experts du secteur restent optimistes, estimant que ces freins sont temporaires et seront levés une fois les questions juridiques résolues.
Free a t-il tout compris ?
Le groupe français Iliad, dirigé par Xavier Niel, a annoncé un plan d'investissement massif de 200 millions d'euros dans le domaine de l'intelligence artificielle. Ce plan comprend l'acquisition d'un nouveau supercalculateur basé sur la plateforme DGX SuperPOD d'Nvidia, destiné à des tâches exigeantes comme l'entraînement des modèles de langage. Iliad ambitionne de devenir le leader européen des services cloud dédiés à l'IA via sa filiale Scaleway. Le groupe prévoit également de créer un laboratoire de recherche en IA basé à Paris, présidé par Xavier Niel lui-même.
Ray Ban Meta
Le groupe Meta, propriétaire de Facebook, a récemment dévoilé sa seconde génération de lunettes de réalité virtuelle Ray-Ban Meta, en collaboration avec le géant de l'optique, EssilorLuxottica.
Ces lunettes permettront de streamer en direct sur Instagram ou Facebook. La qualité vidéo a été améliorée avec une nouvelle caméra de 12 mégapixels, et des haut-parleurs et microphones améliorés ont également été intégrés.
Les experts estiment que le développement de jeux immersifs pourrait être la clé pour rendre ces lunettes plus attractives pour le grand public.
Google Phone augmenté
Les prochains smartphones de Google, le Pixel 8 et le Pixel 8 Pro, devraient continuer à miser sur l'intelligence artificielle pour améliorer la qualité des photos et des vidéos. Parmi les fonctionnalités basées sur l'IA, il y a "Video Boost" pour améliorer la qualité des vidéos et un mode "Vision de nuit" pour les vidéos.
Google proposerait également une fonction de suppression des bruits de fond lors des enregistrements vidéo. Côté photo, une nouvelle fonction appelée "Magic Editor" serait introduite. Si une personne a les yeux fermé ou tire une drôle de tête, le Pixel 8 pourra trouver une autre photo similaire de cette personne et l'utiliser pour corriger l'image que vous avez prise. Impressionnant et angoissant à la fois. Se dirige t-on vers un monde de photos artificielles dans lequel on aura tous les même sourire figé ?
Mistral gagnant ?
La start-up française Mistral AI a récemment dévoilé Mistral 7B, son premier grand modèle de langage open source doté de 7,3 milliards de paramètres. Cette annonce fait suite à une levée de fonds de 105 millions d'euros en juin dernier. Mistral 7B est présenté comme étant plus performant que ses concurrents open source, y compris le modèle Llama 2 de Meta. Arthur Mensch, cofondateur de Mistral AI, précise que ce n'est pas une application autonome, mais une "brique fondamentale" que les développeurs peuvent utiliser pour créer leurs propres applications. La start-up travaille également sur des modèles plus grands et envisage de développer une offre commerciale pour concurrencer d'autres acteurs du marché, y compris OpenAI.
Optimus Prime
Après une première présentation peu convaincante du robot humanoïde Optimus de Tesla lors du Tesla AI Day 2022, l'entreprise a publié une nouvelle vidéo montrant des améliorations significatives. Le robot peut désormais marcher de manière autonome, ramasser des objets et les reconnaître. Il est également entraîné par des démonstrations humaines pour effectuer diverses tâches. Cependant, il reste en retard par rapport à d'autres robots humanoïdes comme ASIMO de Honda et Atlas de Boston Dynamics.
Respire
Dans le cadre d’une étude, Google DeepMind a utilisé des modèles d'IA pour améliorer les compétences en mathématiques des modèles de langage comme ChatGPT. L'étude a introduit une méthode appelée "Optimization by PROmpting" (OPRO), qui utilise des instructions en langage naturel pour guider les modèles de langage dans la résolution de problèmes.
Les chercheurs ont découvert que des phrases d'encouragement humain, telles que "Prenez une grande respiration et travaillez étape par étape", ont considérablement amélioré les performances des modèles. Par exemple, le modèle de langage PaLM 2 de Google a atteint un score de précision de 80,2 % sur un ensemble de données de problèmes de mathématiques de niveau scolaire, contre seulement 34 % sans incitation spéciale.
Et si vous avez bien regardé la vidéo du 1er article, vous aurez remarqué que McKay Wrigley demande à chatGPT de “take a deep breath and think step-by-step about how you will do this”.
AI Foodporn
Avez vous déjà entendu parler de “Foodporn” ?
Phénomène en vogue sur les réseaux sociaux, il s'agit de poster des photos de plats généralement appétissants sur internet, en jouant parfois sur la surabondance voire sur l’excès et l’obscène, décuplant ainsi les sens, excitant le désir et l’appétit.
C'est sur ce dernier point que j’ai entendu mon ventre gargouiller mardi dernier, lors d’une session de création de visuels culinaires réalisés dans le cadre d’un Proof of concept pour un acteur français de Box culinaires. En effet, de plus en plus de sociétés dont le métier exige la production récurrente de visuels se tournent vers l’IA générative pour optimiser coûts et workflows.
J’ai réalisé ces visuels avec Midjourney, et ajusté la colorimétrie de certains dans Photoshop. Lesquels vous ouvrent l’appétit ?
Meetup IA
Mercredi 27 septembre a eu lieu le 8e meetup IA organisé par l'incontournable Nicolas Guyon (créateur et host de l’excellent podcast “Comptoir IA” dont j’ai parlé la semaine dernière) dans les locaux parisiens d'Urban Linker.
Une soirée riche en informations et en discussions, en introduction de laquelle j'ai eu le plaisir de co-animer une session d'open prompting” sur Midjourney devant une salle comble.
Après le traditionnel tour d'horizon de l'actu IA (particulièrement dense ce mois-ci) par Nicolas Guyon, nous avons découvert plusieurs présentations aussi variées qu’intéressantes, telles "Autonews" par Pierre et Thibaut De la Grand'rive, “Une IA peut elle avoir des idées ?” par Olivier Martinez, “Dream Machine” la BD de Laurent Daudet, CEO de LightOn, co-réalisée avec Appupen et... l'IA générative Stable Diffusion.
Je n'ai qu'un seul regret : ne pas avoir réussi à obtenir un exemplaire dédicacé.
Alexandre Lavallée a ensuite présenté un focus sur l'impact de l'IA dans l'éducation, et comment mieux l'intégrer. Et pour finir, Laodis Menard nous a présenté le playground de sa solution Argil dont je vous invite à tester l'interface très user friendly.
Une soirée instructive et fort sympathique, qui témoigne du développement de l’engouement pour des meetings autour de l’IA générative.
Merci à toutes celles et ceux qui sont venus et ont participé à cette soirée enrichissante et un grand merci à l'équipe organisatrice qui a rendu cette soirée possible !
Et toi, tu fais quoi avec l’IA ?
Aujourd’hui j’ai le plaisir de recevoir l’artiste IA Neïla Romeyssa. “Creative Artist” IA est réducteur, tant Neïla a de casquettes différentes. Je vous invite à découvrir son travail sur son site
Bonjour Neïla, peux-tu te présenter brièvement ?
Je suis Neïla Romeyssa, je suis Creative Freelance basée à Paris. Je travaille principalement pour des sujets luxe, mode, beauty et culture.
Comment as-tu découvert les outils d'intelligence artificielle générative et qu'est-ce qui t'a motivé à les intégrer dans ton processus artistique ?
J’ai découvert l’IA générative suite à des discussions avec un ami passionné par l’IA et l’innovation. Pour être honnête, au début, l’IA générative était quelque chose qui ne me parlait pas plus que cela. Je ne percevais pas ça comme une sorte de « menace», mais j'étais certaine qu'elle ferait plutôt partie du futur.
Puis j’ai eu un déclic qui m’a poussée à découvrir cet univers, je crois que ça s’est fait au fil des discussions, échanges et lectures d’articles. Depuis, je ne lâche plus l’IA Générative. Aujourd’hui, elle me permet d’élargir mes horizons et de donner vie à (presque) tout ce qui se passe dans ma tête… Ou dans celles des autres. Et depuis, je me suis également rendue compte qu’il ne s’agissait pas du futur, mais bel et bien du présent.
Quels sont les outils d'IA générative que tu utilises le plus ?
Midjourney, Stable Diffusion et Adobe Firefly.
Pour quels types de tâches / visuels préfères tu Stable Diffusion à Midjourney ?Pour les QR Codes, les logos aussi. Grâce à ControlNet, Stable Diffusion a beaucoup plus de capacités au niveau des modèles. Stable Diffusion a une valeur ajoutée grâce à ses modèles. L’outil peut générer des images folles, même s'il est plus difficile d'accès que les autres IA génératives... Il en vaut la peine !
Quels étaient les obstacles ou les limitations que tu ressentais avant d'utiliser l'IA générative ?
Le manque de temps et de ressources. Les moodboards avec des images principalement trouvées sur Pinterest ont, selon moi, leur limites. Avec l’IA générative, je trouve qu’il n’y a pas de limites à l’imagination.
Utilises-tu d'autres outils d'IA générative ? Si oui lesquels ?
Yes! Runway, et l’IA Générative de Photoshop.
Je trouve ton travail magnifique visuellement. Où puises-tu ton inspiration ?
Merci Gilles ! À vrai dire, je crois que tout provient de ma tête et des coups de cœur artistiques qui, je pense, font de moi la personne que je suis aujourd’hui. Je lis beaucoup, et je suis passionnée d’art et de cinéma. Ça a toujours fait partie de ma vie. Après mon bac, j’étais tellement passionnée que j’ai opté pour des études de littérature comparée avec des cours d’audiovisuel et d’art, sans trop savoir où tout cela pouvait me mener. C’est de ces éléments que je puise la matière nécessaire pour créer mes visuels/concepts IA.
Que te permettent de faire ces outils que tu ne faisais pas avant ? Quelle est leur valeur ajoutée ?
Donner vie à mes pensées, mon imagination, mes petites rêveries aussi. Mon cœur balance toujours entre les mots et les images, mais à notre époque, il n’y a rien de plus vivant qu’une image.
Comment définirais (ou quantifierais) tu leur apport dans ton workflow ?
C’est des outils qui me permettent d’élargir mes horizons. Leur apport est impossible à quantifier. C’est une (r)évolution, une technologie disruptive qui bouscule nos codes et nos process. Avant d’essayer, je ne savais pas que j’en avais tant besoin.
Penses-tu que ces outils "augmentent" ton processus créatif ?
Je pense que je t’ai répondu juste au-dessus, mais oui, j’en suis même convaincue. Ils l’améliorent parce qu’ils agrandissent les possibilités.
Comment aimerais-tu les utiliser à l'avenir ?
Comme je les utilise déjà aujourd’hui, mais avec des versions plus puissantes… Qui, je pense, ne sauraient tarder ? :)
Penses-tu que les outils IA t'ont ouvert de nouvelles voies créatives ?
Ça a remis en question beaucoup de choses pour moi. Aujourd’hui, je travaille sur des projets IA, c’est une sorte de "semi-reconversion" qui s’est faite naturellement. Ça me permet de découvrir des projets sous un autre angle, et ça ne peut être que plaisant.
Selon toi, quels sont les avantages et les limites de l'utilisation de l'intelligence artificielle générative dans le domaine artistique ? Comment gères-tu ces aspects dans ta pratique ?
Pour moi, il n’y a que des avantages. Les limites n’existent que si nous décidons de les prendre en compte. Évidemment, l’IA ne sait pas tout faire... Mais je pense à une phrase de Benjamin Benichou qui dit : « AI does have limitations, but I believe it’s not the technology itself that limits our creativity, but rather how we choose to use it », et je ne peux être que d’accord !
Selon toi, quels effets aura l'IA générative sur le futur de l'Art ?
Je pense que l’art est en constante évolution. L’effet de l’IA sur l’art n’est que la suite logique de ce dernier. J’ai des amis artistes qui commencent à utiliser l’IA comme support, et je trouve ça génial. Le plus important est de garder en tête que chaque nouvelle génération s’inspire des précédentes. Idem pour les artistes, ils s’inspirent de leurs prédécesseurs, tout en utilisant de nouveaux médiums
Globalement, quel est ton sentiment sur les outils d'IA générative ?
Je suis ravie d’utiliser ces outils. Je suis aussi ravie que cela puisse permettre aux créatifs qui l’utilisent de pouvoir aller au bout de leur imagination, car je pense que l’IA générative contribue beaucoup à cela. Pour moi, l’IA générative ne remplace pas, elle est un complément ; un gros +. Cependant, je ne peux pas cacher mon inquiétude vis-à-vis de l’éthique parce que je vois beaucoup de comptes, notamment sur TikTok et Instagram, utiliser l’IA sans le mentionner. Des fake news de tous types, un peu comme le photographe qui a failli gagner un prix avant d’avouer que c’était de l’IA générative.
En réalité, on se rend compte que le plus important, ce n’est pas tant la machine, ce sont plutôt les intentions de l’humain qui la pilote.
Pour finir, peux tu nous parler de tes activités hors IA générative ?
Je suis auteure d’un roman qui s'intitule Brûleurs », paru aux éditions JC Lattès en février 2023. Il fait partie de la sélection de 3 Prix Littéraires (et à chaque fois que je le dis, je n’y crois toujours pas !) Ce livre, c’est entre autres ma consécration personnelle, vis-à-vis de mes études de littérature, et des rencontres que j’ai faites en arrivant en France. Comme dit plus haut, je jongle entre les mots et les images, et comme l’un n’est rien sans l’autre, ma vie serait bien morose sans ce combo haha :)
Merci Neïla pour ces réponses détaillées et très intéressantes !
Cette édition est terminée, je vous souhaite un excellent weekend, empli de soleil et de prompts inédits.
Si cette édition vous a plu, vous pouvez la partager en cliquant juste ici :
Vous pouvez également me suivre sur LinkedIn et activer la cloche 🔔 pour être tenu informé des prochains posts, et me contacter pour toute proposition d’intervention, conférence, projet, formation liée à l’intelligence artificielle générative.
Et n’oubliez pas de vous abonner pour ne rien rater des prochaines éditions 👇
Salut Gilz, que de news cette semaine encore ! Très impressionnant le robot Tesla !! Dis moi est-ce que tu penses que la dernière maj de Chat GPT pourra servir dans tout ce qui concerne la modération de contenu ?
Je pensais surtout aux différents réseaux sociaux qui pêchent parfois côté modération sur des propos ou des vidéos qui mériteraient peut-être de lever au moins une alerte.