Bonjour à toutes et à tous, humains, machines, chatbots, générateurs d’images, de sons, de clones, de voix, et bienvenue dans cette nouvelle édition de GENERATIVE.
Une édition raccourcie cette semaine : je suis actuellement en vacances et mes clones rechignent à faire le travail à ma place.
Vivement que les agents autonomes viennent mettre un peu d’ordre dans tout ça.
Au sommaire, des news, des news et encore des news + Un Bonus !
Let’s go !
Les news de la semaine
Payman
C’est incontestablement la news qui m’a le plus étonné cette semaine.
Une nouvelle startup, Payman, propose de révolutionner l'interaction entre l'intelligence artificielle et les humains. Leur plateforme permet aux agents IA d'accéder à des fonds pour rémunérer des professionnels humains qualifiés pour des tâches spécialisées. Payman gère l'allocation de capital, connecte les IA à un réseau de talents et garantit la qualité des tâches effectuées grâce à un système de vérification robuste et des paiements sécurisés. Que pensez vous de cette proposition de collaboration IA-humain ?
Moderna et l’IA
Moderna annonce un partenariat majeur avec OpenAI pour intégrer ChatGPT Enterprise à ses opérations, visant à améliorer la productivité et accélérer les processus. Avec l'accès de 3 000 employés à ChatGPT, basé sur GPT-4, Moderna espère développer 15 nouveaux produits en cinq ans. Malgré le scepticisme de certains leaders de l'industrie, l'entreprise a déjà créé plus de 750 GPT sur mesure pour optimiser diverses tâches, laissant entrevoir une révolution potentielle dans le secteur pharmaceutique.
Uncanny Valley
Lors d’un récent meetup de Comptoir IA, j’ai eu l’opportunité de discuter clones et avatars avec Brivael Le Pogam, co-founder de la startup Argil.ai.
Il me disait que les deux entreprises les plus avancées à l’heure actuelle en génération d’avatars étaient HeyGen et Synthesia. J’ai été surpris. Autant HeyGen reste la reste la référence, autant j’avais une image d’une technoi un peu dépassée en ce qui concerne Synthesia.
Jusqu’à ce que je découvre cette vidéo :
L’IA dans les médias
L'intelligence artificielle a inondé les médias français au premier trimestre 2024, selon l'Observatoire du traitement de l'IA réalisé par Tagaday. La couverture médiatique de l'IA a explosé, passant d'une présence principalement dans les sections technologiques à une omniprésence dans toutes les rubriques.
En chiffres, elle atteint un volume similaire à celui des reportages sur le conflit Israël-Hamas, avec 162 290 contenus sur l'IA contre 170 230 sur le conflit, surpassant même les sujets sur l'inflation.
Wendy’s en solo
La news SF de la semaine, c’est la chaine de restauration rapide américaine Wendy’s qui déploie l’IA dans ses bornes de commande “Drive Thru”. Sommes nous en train d’assister au début du grand remplacement de tous les fast food jobs par des machines ? La vidéo me donne une légère sensation de malaise, faudra que j’en parle à mon PsyGPT.
Allô maman Robot
Puisqu’on est au rayon Science Fiction, vous reprendriez bien un peu de conversation avec un LLM ? Voici Bland AI, l'IA conversationnelle la plus rapide au monde qui “sonne comme un humain”. Capable de gérer plus d'un million d'appels simultanés (!!) pour les entreprises, elle peut répondre à une vitesse naturelle (humaine) avec n'importe quelle voix. De la vente à la qualification instantanée de prospects en passant par le support client, Bland AI pourrait entraîner un changement majeur dans l'emploi et conduire à un futur où nous parlerions davantage aux IA qu'aux humains.
Aussi impressionnant qu’effrayant si vous voulez mon avis.
DIs moi à quoi tu ressembles, je te dirai pour qui tu votes
Pour clore ce chapitre SF, Une étude de l'American Psychological Association affirme que l'IA et la reconnaissance faciale peuvent déterminer l'orientation politique d'une personne à partir de son visage inexpressif. L'algorithme a prédit avec précision les tendances politiques de 591 participants, même sans considérer l'âge, le genre et l'ethnicité. Les résultats soulèvent des inquiétudes quant à l'utilisation abusive potentielle des technologies de surveillance biométrique, soulevant des questions de confidentialité et d'éthique dans l'utilisation de l'IA.
Petit mais costaud
Microsoft a lancé Phi-3 Mini, le plus petit de sa nouvelle série de modèles d'IA, conçu pour l'efficacité. Il est disponible sur Azure, Hugging Face, et Ollama. Ce modèle, qui suit le Phi-2 réputé pour ses performances équivalentes à celles de modèles plus grands, utilise une méthode de formation inspirée de l'apprentissage enfantin à travers des 'livres pour enfants' simplifiés, renforçant ses capacités de codage et de raisonnement. Avec cette tendance vers des modèles plus compacts (on parle ici de avec 3.8 milliards de paramètres), Microsoft suit une tendance actuelle qui vise à réduire les modèles pour les déployer “in-device”, sans avoir besoin d’une connexion internet.
Firefly 3
Adobe a lancé Firefly Image 3, la nouvelle version de son modèle gratuit de génération d'images par IA, directement intégré à Photoshop. Firefly Image 3 promet une qualité photoréaliste, un meilleur rendu du texte et une compréhension améliorée des invites. Les mises à jour de Photoshop incluent de nouveaux outils de référence de structure et de style, ainsi que des fonctionnalités de génération et d'édition d'images directement dans le logiciel.
La grande force d’Adobe à mes yeux, c’est d'intégrer de manière transparente l’IA à sa suite logicielle. La courbe d'apprentissage se retrouve réduite à son strict minimum. Parfait pour favoriser l’adoption rapide des utilisateurs.
Meta paire de Ray Ban pour écouter l’IA
En février dernier, j’ai eu le plaisir de co-animer un workshop IA pour les équipes marketing internationales du groupe Campari, à Milan. J’étais accompagné de Ghislain Labay et Marie Robin, qui avait apporté ses RayBan Meta Glasses pour l’occasion, et nous en avait fait une démo assez édifiante, avec des paparazzi videos (quasi) incognito et des interactions vocales avec le LLM intégré.
Depuis, les Smart Glasses ont été améliorées avec une IA multimodale, qui permet, par exemple, d'identifier des plantes ou encore traduire des panneaux grâce à des commandes vocales. J’ai hâte d’entendre Marie traduire à la volée une conversation franco-italienne lors de notre prochain workshop IA transalpin.
Apple Mini
Apple vient de lancer discrètement OpenELM, une famille de petits modèles de langage open-source conçus pour fonctionner efficacement sur des appareils tels que les iPhones et les Macs. OpenELM comprend huit modèles de différentes tailles, tous entraînés sur des données publiques. Cette famille de modèles est optimisée pour une utilisation “on-device”, permettant de gérer des tâches alimentées par l'IA sans dépendre des serveurs cloud.
J’ai encore un peu de mal à pleinement visualiser l’immense potentiel d’un LLM multimodal qui aurait accès à la totalité des données stockées ou transitant sur votre smartphone. Mais je suis impatient de tester. Et vous ?
Croissance is coming
Le marché de l'intelligence artificielle devrait atteindre 2745 milliards de dollars d'ici 2032, avec un taux de croissance annuel composé de 36,8%, selon un nouveau rapport de MarketsandMarkets. Le segment des soins de santé et des sciences de la vie devrait connaître la plus forte croissance, tandis que la région Asie-Pacifique devrait afficher le taux de croissance le plus élevé au cours de la période de prévision.
Le ChatGPT killer sera t-il chinois ?
SenseTime a lancé SenseNova 5.0 à Shanghai, un modèle de langage égalant ou surpassant GPT-4 Turbo d'OpenAI. L'entreprise a collaboré avec Huawei pour développer un grand modèle de langage sinophone destiné à divers secteurs tels que la finance et la santé. Xiaomi utilise la technologie de SenseTime dans le cockpit intelligent de son premier véhicule électrique, le SU7.
Selon les premières infos :
SenseNova 5.0 Surpasse GPT-4T sur presque tous les benchmarks
Possède une fenêtre de contexte de 200k
Est entraîné sur plus de 10 To de jetons
A des avancées majeures en matière de connaissances, de mathématiques, de raisonnement et de capacités de codage
Pendant ce temps là à Cupertino…
Apple a acquis Datakalab, une entreprise française pionnière dans l'intelligence artificielle, spécialisée dans l'analyse vidéo et la compression de données. Fondée en 2017, Datakalab est reconnue pour ses innovations telles que l'analyse des émotions faciales et l'utilisation de l'edge computing. Cette acquisition témoigne de la volonté d'Apple de renforcer ses capacités en IA et de développer des technologies de pointe pour révolutionner les technologies portables et les smart cities.
FilmFast
Pika a lancé récemment FilmFast, un concours de court-métrages IA, en partenariat avec Eleven labs. Les films primés sont visibles ICI.
VideoGigaGAN
Les chercheurs d'Adobe ont développé un nouveau modèle d'IA générative appelé VideoGigaGAN, capable d'améliorer la résolution des vidéos floues jusqu'à huit fois leur résolution d'origine. VideoGigaGAN serait supérieur aux autres méthodes de super-résolution vidéo, fournissant des détails plus fins sans introduire d'"étrangetés de l'IA" dans les images.
Deepfake Live
DeepFacelive, un outil permettant l'échange de visages en temps réel lors de diffusions en direct et d'appels vidéo, est récemment apparu sur les radars. Il peut modifier le visage en temps réel pendant un appel vidéo, ajuster les expressions faciales ou l'apparence entière lors d'un streaming en direct, et contrôler des images faciales statiques.Les imitateurs et les fans de deepfakes vont être contents.
Video-To-Video Open Source
AnyV2V est une technique d'édition vidéo permettant de modifier une vidéo source en ajoutant des contrôles tels que des textes, des sujets ou des styles. Le processus se déroule en deux étapes : l'édition de la première image pour définir le style souhaité, puis la reconstruction de la vidéo à partir d'un "bruit" initial. AnyV2V revendique une grande flexibilité pour des tâches d'édition variées tout en préservant la cohérence du mouvement original.
Les outils du futur
Krea.ai enchaine les nouveautés avec l’apparition de la vidéo et la modification de format eh temps réel. Toutes ces nouvelles fonctionnalités nous permettent d’ores et déjà d’imaginer les apps de création Ia du futur. J’imagine une plateforme all-in-one avec génération d’image en temps réel, où l’image se forme au fur et à mesure que vous saisissez votre prompt, avec également de la génération de vidéo, de l’upscaling, etc…
Avec style
Dans la suite de Midjourney, Leonardo AI a lancé une fonctionnalité de “"référence de style”. Vous pouvez désormais uploader une image de référence sur la plateforme et l'utiliser pour influencer vos créations.
UGC plug and play
HeyGen révolutionne la création de contenu généré par les utilisateurs (UGC) grâce à sa technologie d'avatars. Il suffit d'entrer l'URL d'un produit provenant d'Amazon, Etsy, Ebay ou Shopify, puis de personnaliser le titre, la description, les médias, le script et de choisir l'avatar. En quelques secondes, un contenu vidéo est généré, prêt à être diffusé sur les réseaux sociaux ou ailleurs. C’est assez impressionnant, regardez.
Les français et l’IA
Une étude du Boston Consulting Group sur l'usage de l'intelligence artificielle générative dans vingt pays révèle une attitude nuancée en France. Alors que des pays comme la Chine et le Brésil montrent un grand enthousiasme pour l'IA, les Français, aux côtés des Australiens et des Britanniques, expriment davantage de préoccupations. Malgré une familiarité généralisée avec la technologie, seulement 58% des Français se disent enthousiastes à l'idée d'intégrer l'IA dans leur travail, marquant une inquiétude notable concernant les impacts sur l'emploi et la sécurité des données personnelles.
👉 31% se déclarent même plutôt préoccupés
👉 33% des appréhensions portent sur la sécurité des données personnelles
👉 Les Français étant particulièrement sensibilisés à l'usage des données personnelles par la CNIL
👉 10% se préoccupent de l’effet de l’IA générative sur l'environnement
T’as le bonjour d’Albert
Puisqu’on parle des français et l’IA, le Premier ministre Gabriel Attal a annoncé le lancement d'Albert, une intelligence artificielle souveraine destinée à faciliter les tâches administratives des agents du service public. Développé en France, Albert vise à simplifier les procédures, réduire les délais et améliorer l'efficacité des politiques publiques. Sans remplacer les agents, l'IA allégera leur charge de travail en triant les demandes et en formulant des réponses automatisées, permettant un meilleur service aux citoyens. Un beau programme sur le papier, à tester dans la réalité.
À quoi ressemblera TED dans 40 ans ?
TEDx travaillé avec l’artiste Paul Trillo pour créer une vidéo impressionnante à l’aide de Sora.
Au passage, OpenAi rappelle qu’ “actuellement, seul un petit groupe d’artistes et de créateurs approuvés par OpenAI peut créer quoi que ce soit en utilisant Sora, car il s’agit d’un système fermé.”
”Started from the bottom now we’re here”
Le respecté Ethan Mollick a récemment déclaré sur Linkedin que les études sur l'impact de l'IA au travail révèlent systématiquement une amélioration des performances des employés les moins performants. Pourtant, l'IA est souvent comparée aux travailleurs moyens ou aux meilleurs éléments.
Une stratégie gagnante consisterait à se concentrer sur la maximisation des avantages de cet effet de nivellement, plutôt que de se focaliser uniquement sur les performances de l'IA par rapport aux individus les plus compétents dans un domaine donné. Que pensez vous de cette analyse ?
T’as pas 200 millions ?
Un rapport de l’université de Stanford nous renseigne sur le coût d’entrainement des modèles, avec les infographies ci-dessous.
BONUS TRACK : MUSAVIR, MES CLONES ET MOI
J’ai publié cette semaine sur Linkedin le résultat de mes explorations de la dernière fonctionnalité MyAvatar v0.9 de Musavir.
Je garde constamment un oeil sur les évolutions de Musavir, un générateur d’images qui m’a séduit par la qualité de ses générations, et dont j’avais eu le plaisir d’interviewer le co-founder Arslan Javed il y a quelques mois.
MyAvatar est actuellement probablement le meilleur outil du marché pour générer des avatars consistants et homogènes, à partir d’une seule photo de référence. Contrairement à d’autres apps qui font la même chose, il n’y a que très peu de déchets. C’est assez fun à utiliser.
Je vous invite à aller voir sur Linkedin le résultat de mes expériences, et vous propose un petit collage teaser ci dessous.
Cette édition est terminée, merci de l’avoir lue jusqu’ici ! Si elle vous a plu, vous pouvez la partager en cliquant juste ici :
Vous pouvez également me suivre sur LinkedIn et activer la cloche 🔔, je poste régulièrement sur l’intelligence artificielle générative. Vous pouvez également me contacter pour toute proposition de création, intervention, conférence, projet, formation liée à l’intelligence artificielle générative.
Et n’oubliez pas de vous abonner pour ne rien rater des prochaines éditions 👇
Pour la reconnaissance faciale / orientation politique ,après lecture de l'article de recherche les résultats ne sont pas très élevés ( environ 20%) et l'humain fait aussi bien que l'algo
J'ai l'impression que c'est plus un exercice de recherche qu'une réelle avancée