ChatGPT augmenté, navigateurs IA et news à la louche
Bonjour à toutes et à tous et bienvenue dans cette nouvelle édition de GENERATIVE, la newsletter qui parle d’intelligence artificielle générative, des ses outils et de ses usages. L’édition de cette semaine est légèrement plus courte que d’habitude, pour cause de déplacement professionnel en Argentine et au Gabon (je milite pour des journées de 72 heures, mais la rotation terrestre ne veut rien entendre.)
Si vous appréciez la lecture de cette newsletter hebdomadaire gratuite, la meilleure manière de soutenir mon travail, c'est de le faire découvrir à plus de personnes :
Merci !
Au sommaire cette semaine :
✔️ TLDR : le résumé express des news de la semaine
✔️ Les news de la semaine
✔️ Vision : la nouvelle fonctionnalité spectaculaire de chatGPT
✔️ L’outil IA de la semaine : Arc Max, le navigateur IA
J’espère que vous êtes prêt.es, cette semaine a encore été riche en news.
C’est parti !
TLDR : le résumé des news de la semaine
💢 Une étude récente montre que 31% des chercheurs postdoctoraux utilisent l'IA générative dans divers aspects de leur travail, le plus souvent pour affiner des textes et générer du code. Plus d'un tiers des chercheurs estiment que ces outils n'ont pas eu un impact significatif sur leur travail quotidien. Et les 2 autres tiers ?
💢 En dix ans, le concept de relations avec l'IA, autrefois confiné à la science-fiction, a pris vie avec des applications comme Replika et Blush, attirant des centaines de milliers d'utilisateurs. Toutefois, des experts mettent en garde contre les risques d'isolement social.
💢 L'IA génère certes de nouveaux emplois, mais tous ne sont pas de qualité, comme le montre l'exemple des "travailleurs du clic" dans les pays à faible coût de main-d'œuvre. Ces travailleurs accomplissent des tâches répétitives et mal rémunérées pour des géants de la tech, et leur bien-être au travail est questionnable, soulevant des préoccupations éthiques.
💢 Les "Agents IA" sont des entités autonomes conçues pour réaliser des objectifs spécifiques. Certains experts estiment qu'ils pourraient automatiser de nombreuses tâches traditionnellement effectuées par des "cols blancs".
💢 Un modèle d'IA a prédit avec 70% de précision les tremblements de terre lors d'un test en Chine, surpassant 600 autres modèles dans un concours international. Les développeurs cherchent maintenant à créer un système universel de prévision des séismes qui pourrait minimiser les pertes humaines et économiques.
💢 YouTube a introduit "Spotlight Moments", un nouveau système qui utilise l'IA pour placer des vidéos de marques à côté de contenus populaires liés à des moments culturels, comme Halloween par exemple.
💢 Ghostwriter, le créateur musical augmenté par l'IA, propose un système de licence pour permettre aux artistes de contrôler l'utilisation de leurs voix clonées par l’IA. S'inspirant des pratiques de sampling dans les débuts du hip-hop, ce modèle pourrait inclure des clauses de partage des revenus et offrir plus de contrôle aux artistes.
💢 Le drone Saker Scout a été déployé en Ukraine comme premier "robot tueur" avec attaque autonome. Aucune réglementation n'encadre actuellement ces technologies malgré des préoccupations éthiques qu’on pourrait qualifier de légitimes.
💢 Baidu a mis à jour son modèle de langage Ernie, qu'il prétend être aussi performant que GPT-4 d'OpenAI. Malgré ses 45 millions d'utilisateurs, Ernie reste en retrait par rapport à ChatGPT qui en compte 180 millions.
💢 La fonctionnalité “Vision” rend chatGPT désormais capable de “lire” une image. Le camp des possibles s’en trouve élargi dans des proportions jusqu’alors inimaginables. Allez jeter un oeil à l’article, ça vaut le détour.
💢 Arc Max est un navigateur web innovant, qui intègre des fonctionnalités IA telles que interroger une page web comme on interroge un chatbot, afficher des previews de contenus, renommer automatiquement des fichiers ou encore accéder en 1 clic à chatGPT. A essayer.
💢 Bonus Track : une vidéo bourré d’IA générative signée Brainsonic, à découvrir à la fin de cette édition !
Les news de la semaine
IA et recherche
Selon une étude récente, 31% des chercheurs postdoctoraux utilisent régulièrement l'IA générative dans leur travail. Les domaines d'application sont variés : affiner son texte (63%), générer, modifier, dépanner du code informatique (56%), trouver et résumer de la littérature scientifique (29%), préparer des manuscrits (14%), des supports de présentation (12%), améliorer des protocoles expérimentaux (8%).
Les disciplines scientifiques les plus représentées parmi les utilisateurs de l'IA générative sont l'ingénierie (44%) et les sciences sociales (41%). Certains souscrivent même aux abonnements payants tels que ChatGPT Plus ou Claude Pro. L'étude révèle également que 43% des utilisateurs de ces outils y ont recours au moins une fois par semaine. Cependant, plus d'un tiers des chercheurs estiment que l'IA générative n'a pas significativement impacté leur travail quotidien.
Artificial Love
En 10 ans, la science fiction du film “Her” (2013) est en train de devenir réalité. Le marché des relations avec l'Intelligence Artificielle (IA) connait une explosion qui dépasse désormais le cadre de la science-fiction. Des applications comme Replika offrent une compagnie virtuelle et ont déjà séduit plus de 250 000 utilisateurs pour leur version Pro.
Blush, surnommé le "Tinder de l'IA", est conçu comme un simulateur de rencontres qui favorise des émotions authentiques. Selon Eugenia Kuyda, PDG de Replika, les relations romantiques entre humains et IA deviendront courantes, à l'instar des débuts de la rencontre en ligne. Cependant, des experts soulignent que l'interaction excessive avec l'IA peut entraîner un isolement social. De plus, même si l'IA peut imiter les comportements humains, elle reste dépourvue d'émotions authentiques.
Et vous, qu’en pensez vous ?
l’IA créateur d’emplois ?
Les pessimistes avancent t que l’IA détruira les emplois humains.
Les optimistes rétorquent que l’IA va en créer de nouveaux. Si nul ne sait ce que l’avenir nous réserve, force est de constater que l’IA créée des emplois. Mais ils ne sont pas toujours reluisants.
Nous évoquons les "travailleurs du clic", situés dans des pays où le coût du travail est faible, effectuent des tâches répétitives et mal rémunérées pour des entreprises technologiques de premier plan comme Meta, Microsoft et Amazon.
Leur travail consiste à saisir, étiqueter et corriger des données pour permettre aux algorithmes de s'améliorer. L’article source mentionne une jeune femme Philippine payée 280 dollars par mois en travaillant jusqu’à 18 heures par jour, ou encore un jeune Pakistanais qui gagne 50 dollars par mois pour des journées de travail similaires.
« Si l’IA crée de nouveaux types d'emplois, il n'est pas certain que ces emplois soient satisfaisants pour les travailleurs de ces régions », explique Florian Schmidt, auteur de Digital Labour Markets in the Platform Economy.
Agents IA
Avez vous entendu parler des “Agents IA” ?
Il s’agit d’une entité autonome qui agit et dirige son activité vers la réalisation d’un ou plusieurs objectifs. Ces agents sont désormais capables de jouer à des jeux, de récupérer des informations sur des sites web et même de créer des représentations visuelles de données. Certains experts prédisent que ces agents pourraient un jour automatiser une grande variété de tâches de “cols blancs”.
Cependant, malgré l'enthousiasme (ou l’anxiété) qui vous gagne à la lecture de ces lignes, ces agents en sont encore à leurs balbutiements. Par exemple, vous pouvez demander à ChatGPT (via un plugin) de trouver des options de vol sur Expedia mais il ne peut pas encore les réserver.
Je suis personnellement impatient de disposer d’un assistant personnel dirigé par la voix, capable de ire et répondre à certains de mes emails, réserver mes billets de train, commander en ligne certains articles et me les faire livrer, ou encore me proposer un draft complet de la prochaine édition de cette newsletter.
Et vous ?
l’IA prévoit les tremblements de terre mieux que personne
Des chercheurs de l'Université du Texas à Austin ont mis au point un modèle d'IA qui a prédit avec une précision de 70% les tremblements de terre lors d'un essai en Chine. Le modèle a surpassé 600 autres conceptions lors d'un concours international. Cette IA pourrait révolutionner la manière dont les communautés se préparent aux catastrophes naturelles, en minimisant potentiellement les pertes humaines et économiques. L'équipe prévoit de tester cette IA au Texas et envisage de fusionner des modèles basés sur la physique avec cette approche axée sur les données pour créer un système universel de prévision des tremblements de terre.
Spotlight Moments
YouTube a lancé "Spotlight Moments", un nouveau package publicitaire qui permet aux marques de diffuser leurs vidéos à côté du "contenu le plus pertinent et engageant associé au moment". Utilisant l'IA, Spotlight Moments peut identifier des vidéos populaires autour de moments culturels, comme Halloween par exemple.
Ce nouveau service publicitaire a le potentiel d'offrir une visibilité de marque pendant des moments culturels clés et d'atteindre un public cible. De la publicité contextuelle augmentée en quelque sorte.
Lipdub, le retour
Captions, une startup spécialisée dans le montage vidéo alimenté par l'IA, a lancé Lipdub, une nouvelle application de doublage qui prend en charge 28 langues. Disponible gratuitement sur l'App Store, Lipdub permet aux utilisateurs de traduire des vidéos en plusieurs langues.
L'application ajuste également la synchronisation des lèvres en fonction de la langue cible. Captions, fondée en 2021, a déjà levé 40 millions de dollars en financement et compte plus de 100 000 utilisateurs quotidiens.
L’IA jouera t-elle un rôle dans le futur de l’industrie musicale ?
Vous vous souvenez de Ghostwriter, ce créateur musical augmenté par l’IA qui s’était fait connaître avec le tube "Heart on My Sleeve", qui utilisait les voix clonées de Drake et The Weeknd ? Dans une récente interview avec Bloomberg, il suggère un système de compensation permettant aux artistes et aux labels de fixer les conditions de licence de leurs voix pour des projets d'IA.
Les termes de la licence pourraient inclure le partage des revenus, des restrictions d'usage comme l'exclusion du discours de haine ou politique, et davantage de contrôle pour les artistes. Ghostwriter compare ce modèle au sampling non autorisé qui caractérisait les débuts du hip-hop et qui a finalement été accepté après de nombreuses batailles juridiques.
Le point d'interrogation demeure : les labels seront-ils prêts à céder ce contrôle ?
L’Ukraine, la guerre et l’IA
L'Ukraine déploierait des drones équipés d'IA capables d'identifier et de frapper des cibles sans supervision humaine, marquant ainsi la première utilisation de "robots tueurs" sur un champ de bataille.
Le drone Saker Scout peut transporter jusqu'à 3kg de bombes et dispose de modes autonomes pour la reconnaissance et l'attaque. Son système de vision par IA peut reconnaître 64 types de véhicules militaires, comme des chars, et vérifier les cibles avant de frapper sans surveillance humaine.
L'Ukraine affirme que cette fonction d'attaque autonome a été utilisée avec succès, bien qu'à petite échelle.Alors que nombreux sont ceux qui plaident pour une interdiction légale de ces systèmes en raison de préoccupations éthiques, aucune réglementation n'existe actuellement.
Baidu vs OpenAI
Baidu, le géant chinois de la recherche, a récemment mis à jour son modèle de langage Ernie, affirmant qu'il est aussi performant que GPT-4 d'OpenAI. Lors d'un événement à Pékin, Robin Li (CEO de Baidu) a démontré les capacités d'Ernie à résoudre des problèmes complexes et à fournir des réponses en temps réel.
Bien qu'Ernie compte 45 millions d'utilisateurs, il est encore loin derrière ChatGPT, qui en compte 180 millions. Baidu voit en Ernie un élément clé de sa stratégie pour surpasser des concurrents comme Alibaba et Tencent. À l'instar de ses rivaux nationaux, Baidu bénéficie d'un soutien clair du gouvernement pour une technologie qui a le potentiel d'améliorer non seulement des industries entières, mais aussi une économie en difficulté. La Chine compte aujourd'hui au moins 130 grands modèles linguistiques, soit 40 % du total mondial.
ChatGPT Vision : en route vers les IA multimodales
ChatGPT Vision est une nouvelle fonctionnalité de ChatGPT qui intègre des capacités de visualisation, permettant au chatbot d’OpenAI de "voir" et d'interagir avec des images. Cela peut potentiellement changer fondamentalement la manière dont vous utiliserez dorénavant ChatGPT.
Parce que quelques exemples valent mieux que 1000 lignes, regardez ce qui suit :
Je suis allé chercher des radiographies de fractures sur Google Images et ai demandé à chatGPT de l’analyser :
Je lui ai ensuite demandé de traduire un panneau routier
Comme j’aime bien titiller chatGPT, je lui ai demandé d’analyser ce diagramme objectivement imbitable rédigé de la main de Christopher Nolan pendant l’écriture de son film “Inception”.
Voilà ce qu’il m’a répondu :
Dans la même veine, je demande à chatGT de me coacher sur les réseaux sociaux. Spoiler alert : ça fonctionne plutôt pas mal :
On peut imaginer des milliers d’autres exemples : lui demander de nous expliquer une installation électrique à partir d’une photo, de nous décrire une image, d’identifier une espèce animale ou végétale, donner des informations sur un monument, vous donner des idées de recettes à partir d’une photo de votre frigo, voire coder un site web à partir d’un schéma. Les possibilités semblent illimitées.
Alors, que pensez vous de cette nouvelle fonctionnalité ?
L’outil IA de la semaine : Arc Max
Dans une ère où la navigation Internet est devenue une seconde nature, l'innovation est rare. Cependant, la Browser Company a récemment dévoilé Arc Max, une mise à jour de son navigateur Arc, qui propose une promesse : Celle de révolutionner notre façon de naviguer sur le web.
A l’origine il y avait ARC
Arc est un navigateur web qui a suscité un intérêt certain à sa sortie. Il se distingue par sa barre de navigation latérale et offre une multitude de fonctionnalités comme la possibilité de diviser l'écran verticalement ou horizontalement, la prévisualisation des favoris, la copie d’écran simplifiée, les espaces de travail multiples (comme différents bureaux dans MacOS), la librairie pour accéder en 1 cllic à tous les éléments téléchargés et les copies d’écran, un mode focus pour une navigation épurée, et la personnalisation de sites web via le "boost".
L'entreprise derrière Arc, The Browser Company, met l'accent sur la confidentialité des données et assure qu'elle ne suivra pas les activités en ligne des utilisateurs ni ne vendra leurs données à des tiers.
Shubham Sharma a fait une super présentation de l’outil dans la première minute de cette vidéo :
Mais ce qui nous intéresse aujourd’hui, c’est la dernière mise à jour d’ARC Browser récemment dévoilée : ARC Max. Cette version propose cinq nouvelles fonctionnalités basées sur l'IA, pour rendre l'expérience de navigation plus intelligente et efficace.
Fonctionnalités IA
Ask on Page
Cette fonction vous permet de poser des questions basées sur les informations de la page web sur laquelle vous vous trouvez, en utilisant des raccourcis clavier "Cmd + F" ou “Ctrl + F” pour poser des questions. Par exemple, sur une page listant les meilleures applications gratuites pour Mac, vous pouvez demander "Quel est le meilleur logiciel de montage vidéo ?" et l'IA analysera la page pour vous fournir une réponse précise. Vous vous évitez ainsi de lire toute la page pour trouver l’info qui vous intéresse.
5-Second Previews
En maintenant la touche "Shift" enfoncée pendant 5 secondes tout en survolant un lien, vous obtiendrez un résumé rapide de la page liée sans avoir à la visiter. Elle fonctionne de manière transparente sur des moteurs de recherche comme Google et peut même résumer des newsletters d'un simple passage de la souris (bad news pour les accrocs du “TLDR” qui ont réussi à lire jusqu’ici, ça fonctionne mieux avec les liens Google qu’avec les Newsletters)
Tidy Tab Titles
ARC Max renomme automatiquement vos onglets pour les rendre plus identifiables. Pratique pour ceux qui se retrouvent souvent noyés dans une mer d'onglets. Cette fonctionnalité renomme automatiquement et raccourcit les titres des onglets, facilitant la navigation entre plusieurs onglets ouverts. Par exemple, un onglet initialement étiqueté "500 + Best Internet Pictures a Images - Download Free Images on Unsplash" pourrait être simplifié en "Best Internet Pictures" avec le logo unsplash. Pas mal.
Tidy Downloads
Cette fonction organise et renomme automatiquement vos fichiers téléchargés, les rendant plus faciles à trouver et à rechercher. Un exemple avec cette photo unsplash
nommée : “iheb-ab-OBufvGMaBaQ-unsplash.jpg” et automatiquement renommée en “Man silhouette near trees.jpg”
ChatGPT in the Command Bar
Vous pouvez accéder à ChatGPT directement depuis la barre de commande en tapant "Chat GPT" et en appuyant sur la touche "Tab". Vous pouvez ensuite poser n'importe quelle question. Pour que cette fonction fonctionne, vous devez être connecté à votre compte ChatGPT. Seul hic : par défaut c’est chatGPT 3.5 qui est activé pas chatGPT 4.
Ma Fonctionnalité Préférée
Si je devais choisir une fonctionnalité, ce serait les Aperçus de 5 Secondes. La possibilité d'obtenir un aperçu rapide d'une page sans s'engager dans un clic est un véritable “time saver”. Cela accélère non seulement l'expérience de navigation, mais la rend également plus efficace.
Réflexions Finales
Arc Max constitue une proposition intéressante dans l’éventail des navigateurs web. Son ensemble de fonctionnalités IA rend la navigation sur le Web plus rapide, plus efficace et interactive, sans encore le toutefois la révolutionner à mes yeux.
De plus, il nécessite un petit temps d’adaptation pour prendre le réflexe d’utiliser ses fonctionnalités. Mais une fois qu’on s’y met, on le le lâche plus !
Que vous soyez un navigateur occasionnel ou un utilisateur intensif, Arc Max vaut très probablement le détour.
https://arc.net/max
Bonus track
Une fois n’est pas coutume, cette édition vous propose un “bonus track”, avec cette réalisation de l’agence Brainsonic, dont Mathieu Cruq, le Directeur Général, est un infatigable explorateur IA (que j’avais déjà interviewé ICI).
Pour célébrer deux années de collaboration avec Lenovo France, Brainsonic a créé en une semaine ce film très pêchu et rempli d’IA générative : Cinéma 4D + Redshift + After Effects + Premiere Pro + Photoshop + Procreate + Gen-1 + Midjourney + kaiber
Voilà, cette édition est terminée, merci de l’avoir lue jusqu’ici ! Si elle vous a plu, vous pouvez la partager en cliquant juste ici :
Je vous donne rendez vous la semaine prochaine pour une nouvelle grosse édition.
Pour les parisiens, je rappelle la prochaine édition de l’incontournable meetup IA organisé par le camarade Nicolas Guyon, host de l’excellent podcast Comptoir IA.
Le meetup aura lieu e 25 octobre prochain. Tous les détails sont ici. https://www.meetup.com/comptoir-ia/events/296277696/
N’hésitez pas à partager cette édition, me suivre sur LinkedIn et activer la cloche 🔔 pour être tenu informé des prochains posts, ni à me contacter pour toute proposition d’intervention, conférence, projet, formation liée à l’intelligence artificielle générative. Et bien sûr, à vous abonner à GENERATIVE 👇