Salut les avatars et les authentiques, les synthétiques et les êtres de chair et de sang, et bienvenue dans cette 62e édition de GENERATIVE, la newsletter qui vous parle d’IA générative, de création augmentée et d’outils disruptifs ou innovants.
Au sommaire cette semaine :
Les news de la semaine
Meetup IA à Alger
La digital fashion, nouvel eldorado ?
Les news de la semaine
Nouveauté de la semaine : j’ai utilisé un florilège de LLMs pour mes résumés de news : ChatPGT4, Claude 3 Opus, LLama-3-70b et le fameux gpt2.
Llama 3 m’a agréablement surpris. Gpt2 m’a moins impressionné que ce à quoi je m’attendais sur mes 1ers tests. A creuser….
Apple fait le buzz
La dernière pub d’Apple pour l’iPad Pro fait le bad buzz sur X (Twitter). On y voit une presse écrabouiller des dizaines d’ustensiles physiques de gaming et de créativité. Avec un message clair : Vous n’avez plus besoin de rien, tout est dans le nouvel iPad Pro.
Qu’en pensez-vous ?
Moi j’aurais tendance à penser comme William Shakespeare : “Beaucoup de bruit pour rien”. Le concept est loin d’être nouveau, comme en atteste cette pub de 2008
OpenAI clarifie les règles de ChatGPT
OpenAI a révélé comment elle encadre ses intelligences artificielles comme ChatGPT pour éviter les erreurs et les abus. Ces modèles suivent des règles précises pour ne pas générer de fausses informations ou de conseils biaisés. Ils sont programmés pour répondre de manière contrôlée, évitant les sujets inappropriés. Cette initiative rend plus claire la façon dont ces IA fonctionnent et pourquoi elles refusent certaines demandes. Cependant, malgré ces précautions, les utilisateurs peuvent parfois rencontrer des limites dans les réponses de l'IA.
Warren Buffet redoute l’IA
Le célèbre investisseur Warren Buffett a tiré la sonnette d'alarme sur les risques de l'IA, la comparant aux armes nucléaires. Bien que reconnaissant son potentiel bénéfique, Buffett redoute ses utilisations malveillantes, citant les deepfakes utilisés à des fins criminelles. Malgré son manque de connaissances techniques, il s'inquiète de l'équilibre entre les avantages et les dangers de cette technologie révolutionnaire, susceptible de transformer des pans entiers de l'économie avec d'éventuelles pertes d'emplois massives. Merci Warren.
Source
Apple rattrape du terrain
Alors que les infos sur iOs 18 commencent à fuiter, Apple dévoile enfin la nouvelle puce M4 de l'iPad Pro, conçue pour fonctionner avec l'IA, serait capable de gérer 38 billions d'opérations par seconde, offrant des performances 4 fois supérieures aux modèles précédents. Elle rivalise ainsi en performance avec les meilleurs processeurs PC tout en consommant quatre fois moins d'énergie.
MAI-DAY
De son côté, Microsoft se prépare à dévoiler MAI-1, son nouveau LLM, lors de la conférence Build du 21 au 23 mai 2024. Piloté par Mustafa Suleyman, co-fondateur de Google DeepMind, ce modèle possède 500 milliards de paramètres, moins que les un trillion de GPT-4 d'OpenAI, mais affiche des ambitions similaires. Microsoft mise sur des ensembles de données massifs et des processeurs Nvidia avancés pour développer MAI-1, renforçant sa position dans l'IA intégrée à ses produits.
Eleven Labs donne le la
Eleven Labs vient challenger les générateurs de musique Udio et Suno avec une nouvelle fonctionnalité qui s’annonce très prometteuse, écoutez :
(prompt : “Pop pop-rock, country, top charts song”)
Une autre
Prompt : “Smooth Contemporary R&B with subtle Electronic elements, featuring a pulsing 104 BPM drum machine beat, filtered synths, lush electric piano, and soaring strings, with an intimate mood.”
New kid on the block
Krea AI a lancé “Krea Video”, une nouvelle fonctionnalité de génération de vidéos réservée aux abonnés Max (60$/mois). Avec une timeline, un système de keyframes (images clés) et de prompts qui déterminent l'apparence de la vidéo à un moment donné. Avec cette nouvelle fonctionnalité de taille, Krea continue de monter en puissance. J’attends de tester en profondeur pour me forger une opinion définitive.
L’IA débarque dans Whatsapp
Meta a intégré son nouveau chatbot, Meta AI, basé sur l’excellent modèle de langage Llama 3, dans WhatsApp. Ce chatbot, fonctionne comme un contact : on peut lui poser des questions et lui demander des rappels pour des événements importants. L'accès se fait simplement en tapant "@MetaAI" dans la barre de recherche. Pour l'instant, cette fonctionnalité est disponible uniquement dans 13 pays anglophones, mais Meta prévoit d'étendre ce service à d'autres pays et langues.
MatrixCity
NeRF-XL est une nouvelle technique qui permet de traiter et d'afficher des images 3D très détaillées en utilisant plusieurs cartes graphiques (GPU) simultanément. Avec NeRF-XL, on peut utiliser un grand nombre de paramètres pour créer des images plus précises, simplement en ajoutant plus de cartes graphiques. Cette technique assure que tous les GPU travaillent ensemble efficacement, avec très peu de besoin de communiquer entre eux, ce qui accélère le processus. NeRF-XL a montré des améliorations notables aussi bien en qualité d'image qu'en vitesse de traitement, et a été testée sur des ensembles de données variés, dont MatrixCity, qui contient 258 000 images d'une zone urbaine de 25 km². Cette avancée rend possible des visualisations 3D de très grande taille et avec beaucoup de détails.
Shadow AI
Selon le work trend index report, 3 personnes sur 4 utiliseraient l’IA au travail (enquête menée aux Etats Unis). Parmi elles, 78% des personnes interrogées utiliseraient l’IA de manière non encadrée. Un phénomène appelé “BYOAI” (Bring Your Own AI”). Cela suggère qu'en ne fournissant pas d'orientation, les entreprises n'évitent pas l'IA au travail : elles obtiennent une utilisation secrète et potentiellement mauvaise de l’IA au travail (souvent sans garanties adéquates de confidentialité des données et de protection de la propriété intellectuelle). Il devient urgent non seulement de former les collaborateurs mais également de les encadrer dans leur utilisation des outils IA. (“Encadrer” ne signifiant pas “fliquer” mais proposer du soutien et un suivi)
Même les boomers sont chauds sur le BYOAI
Le meilleur des mondes
Alors que nous commençons à comprendre l'impact des réseaux sociaux sur la santé mentale des adolescents, l'IA vient bouleverser l'équation. Les chatbots, comme Character AI, deviennent si performants dans l'imitation de la communication humaine que certains adolescents les utilisent pour obtenir des conseils et même de la compagnie. Cependant, les psychologues mettent en garde contre les effets potentiellement néfastes de ces interactions sur la santé mentale des jeunes, tels que des diagnostics incorrects et une dépendance qui réduit le temps consacré aux relations réelles. La génération Z, plus ouverte à l'IA, pourrait être mieux préparée aux changements à venir, mais aussi plus vulnérable à ses dangers.
Google met de l’IA dans (presque) tous ses smartphones
Google a récemment annoncé le lancement du Pixel 8a, qui embarque un écran OLED de 6,1 pouces et le processeur Tensor G3, avec des options de 128 ou 256 Go de stockage. Google met en avant l'IA, intégrant des fonctions avancées telles que "Entourer pour chercher" et divers outils de retouche et de gestion de contenu. Le Pixel 8a est également équipé de Gemini Nano, le petit LLM de la gamme. Disponible en précommande pour 559 €, il sera livré dès le 14 mai.
De l’influence des chatbots sur les humains
Selon une analyse récente d'Andrew Gray, bibliothécaire de l'University College London, le vocabulaire couramment utilisé dans les chatbots d'IA comme ChatGPT apparaît de plus en plus fréquemment dans les recherches nouvellement publiées. Gray a constaté que certains mots associés à l'IA, tels que "complexe", "méticuleusement" et "louable", sont devenus beaucoup plus courants dans les écrits académiques en 2023 par rapport à 2022. Cela suggère que les chercheurs se tournent de plus en plus vers ChatGPT pour les aider à rédiger leurs articles, soulevant d'importantes questions sur la fiabilité des écrits scientifiques à l'ère de l'IA.
News Midjourney
A l’occasion de la publication de ses traditionnelles “office hours”, Midjourney a annoncé quelques nouveautés à venir :
L’interface web, désormais accessible aux utilisateurs ayant généré plus de 100 images, se voit doté de nouvelles fonctionnalités comme des salles privées ou un mode d’exploration par tendances.
Il sera également possible de personnaliser son espace.
Une v6.1 est en chemin avec une améliorations de la qualité d'image, de la cohérence et du rendu de texte.
Un peu plus tard dans l’année, une v7 proposera “un bond très notable des performances”.
Enfin, l’équipe a mentionné “Beaucoup de R&D en cours (temps réel, 3D, vidéo), nombreux entraînements et la réflexion sur la création d'un dictionnaire visuel pour les srefs.
Freepik acquiert Magnific AI
La plateforme Freepik (concurrent Midjourney) a acquis Magnific AI, un outil d'upscaling et d'amélioration d'images par intelligence artificielle. Cette acquisition stratégique est la plus importante à ce jour pour Freepik, qui renforce ainsi ses ambitions en matière d'IA et poursuit son expansion mondiale. Lancé il y a cinq mois, Magnific compte déjà 725 000 utilisateurs enregistrés. Les fondateurs de Magnific, Javi López et Emilio Nicolás, rejoindront l'équipe d'innovation IA de Freepik.
Pour célébrer cette fusion, Magnific offre des cadeaux :
➡️ Abonnés actifs : un mois gratuit (+2 500 crédits)
➡️ Anciens abonnés : +500 crédits
➡️ Utilisateurs enregistrés (sans abonnement) : +60 crédits
➡️ Nouveaux utilisateurs : utilisez le code "FREEPIKMAGNIFIC" pour obtenir 50 % de réduction sur le premier mois.
La médecine augmentée progresse
Google DeepMind lance AlphaFold 3, un modèle d'IA révolutionnaire pour comprendre les structures biologiques et leurs interactions au sein des cellules. Cette troisième version peut analyser non seulement les protéines, mais également l'ADN, l'ARN et les molécules de signalisation. Grâce à cette technologie, les scientifiques peuvent formuler et vérifier des hypothèses à un niveau atomique en quelques secondes, ce qui pourrait accélérer la découverte de nouveaux médicaments et révolutionner la recherche biologique.
Des nouvelles de Sora ?
En plus d’une nouvelle fonctionnalité d’inpaiting impressionnante “sur le papier” (frustrant de voir passer des updates sans même pouvoir tester la version de base)
Sora a fait parler de lui dans une récente interview, le collectif Shy Kids a partagé son expérience avec l’utilisation de Sora lors de la création de leur court-métrage "Airhead".
Ils comparent l'utilisation de Sora à une “machine à sous”, au sens aléatoire du terme. Le processus a nécessité un ratio de 300 rendus pour obtenir une scène utilisable, avec chaque rendu prenant entre 10 et 20 minutes, indépendamment de la longueur de la scène. Leur travail a inclus un important post-traitement, comme la modification de la couleur des ballons et le rotoscoping dans After Effects.
Pour les amoureux du calcul mental, je vous propose une durée moyenne de 15 minutes par rendu.
Le film Airhead compte 40 plans (je viens de compter). Soit 10 heures de rendus.
D’un côté ceci confirme certaines craintes formalisées par les utilisateurs de Runway Gen-2 dont je fais partie : avec des itérations à la pelle, Sora risque d’être une véritable tannée à utiliser.
D’un autre côté :
1 - ça reste plus rapide et moins cher qu'un tournage classique.
2 - Sora permet de réaliser des plans impossibles (ou très coûteux/complexes) dans la vie réelle.
Mais si les professionnels, dont je fais partie, y verront un gain coût/productivité, quid de la majorité de la population ? Dans l’état actuel des choses, Sora peut-il est considéré comme un produit grand public ? Si vous deviez générer 300 images Midjourney avant d’en avoir une correcte, souscririez vous à un abonnement ?
La vanne “qui vivra Sora” commence déjà à être éculée.
Mon avis est qu’une adoption de masse n’est possible qu’à travers une utilisation fluide et rapide.
MEETUP IA A ALGER !
J’ai passé les deux dernières semaines en Algérie. Un voyage extraordinaire, qui m’a fait sortir de ma zone de confort au sens où tellement de gens nous avaient dit qu’il était “impossible d’aller en Algérie si on n’y avait aucun contact”
.
Nous avons dû briser ces barrières mentales pour partir à l’aventure et découvrir un pays doté d’une riche diversité de paysages, au patrimoine culturel incroyable (vous seriez surpris de l’état de conservation exceptionnel de nombreux sites antiques) et surtout, le joyau insoupçonné de ce pays, l’hospitalité extraordinaire (je pèse ces mots) des algériens. Des sourires, de la bienveillance désintéressée, des cadeaux, de la générosité, de l’aide, des invitations à dîner, les algériens sont encore plus forts que les Omanais et les Saoudiens dans ce domaine.
Et l’Algérie, c’est également le pays d’origine de ma camarade Neila Romeyssa, une artiste IA talentueuse que j’avais eu le plaisir d’interviewer ici il y a quelques mois.
Je vous invite à découvrir son travail si vous ne le connaissez pas encore.
Bref, une belle occasion pour discuter GEN AI le temps d’un selfie au pied de la Basilique Notre Dame d’Afrique à Alger, la soeur de la Basilique notre Dame de la Garde à Marseille (les deux se font d’ailleurs face). Avec quelques retouches vestimentaires IA s’il vous plait.
LA DIGITAL FASHION, NOUVEL ELDORADO ?
Le collage photo ci-dessus me permet une transition idéale vers la mode numérique. J’ai commencé à en entendre parler en 2021, en pleine vogue du Metaverse. Certaines startups proposaient des vêtements virtuels pour les avatars des joueurs.
En réalité, la tendance du Digital Fashion est un peu plus ancienne, à l’image de DRESSX, marque fondée en juillet 2020, par Daria Shapovalova et Natalia Modenova, deux ukrainiennes passionnées par la mode, le digital et les nouvelles technologies.
Dès 2019, elles avaient eu l’idée de créer un e-shop dédié à des vêtements 100% virtuels inspirés de créations de haute couture. Des pièces dont le prix peut atteindre des dizaines de milliers de dollars dans la vie réelle, et qui étaient proposées pour 200$ maximum sur l’e-shop de DRESSX. Les robes virtuelles étaient numériquement ajoutées à une photo fournie par le client.
L’idée a ensuite été transposée à des espaces virtuels, tels le Metaverse ou le gaming, comme Roblox par exemple.
L’objectif de DRESSX est de vendre un milliard d'articles de mode numérique par an, (l'industrie de la mode produit 150 milliards de vêtements physiques chaque année).
Avec ses avatars fixe ou animés, l’intelligence artificielle générative ouvre de nouvelles opportunités pour la mode numérique, dans lesquelles DRESSX s’est déjà engouffrée. Ainsi, j’ai obtenu un accès anticipé à leur outil “DRESSX AI”, une plateforme de génération de vêtements digitaux par l’intelligence artificielle.
Tout se passe via Discord, comme pour Midjourney.
L’ergonomie est simple, on prompte : “/dressxme” suivi d’une description vestimentaire et une photo à modifier.
On peut modifier une photo réelle, Hi Tom !
Ou une image générée par l’IA, comme mes Avatars Musavir par exemple :
J’ai récemment parlé de mes avatars Musavir sur Linkedin, si jamais vous avez raté la publication, c’est ICI.
On sent que le modèle a été tuné pour produire des résultats esthétiques. Même en poussant un peu les prompts, on obtient rien de réellement grotesque.
Mes premiers tests me laissent à penser que les meilleurs résultats sont obtenus avec des images générées par l’IA. Le rendu est parfait.
Comme vous pouvez le constater, le prompt n’est pas toujours respecté à la lettre. En revanche, la qualité d’intégration est excellente, c’est le gros point fort de l’outil.
Au delà du “Vanity Selfie Business”, quelles applications imaginez vous pour DRESSX ?
Malgré les apparences, je suis toujours en vacances et n’ai pas eu le temps de tester une autre app qui propose des fonctionnalités similaires mais pas que : rendernet.
Je la teste ASAP comme on dit dans mes visios.
Cette édition est terminée, merci de l’avoir lue jusqu’ici ! Si elle vous a plu, vous pouvez la partager en cliquant juste ici :
Vous pouvez également me suivre sur LinkedIn et activer la cloche 🔔, je poste régulièrement sur l’intelligence artificielle générative. Vous pouvez également me contacter pour toute proposition de création, intervention, conférence, projet, formation liée à l’intelligence artificielle générative.
Et n’oubliez pas de vous abonner pour ne rien rater des prochaines éditions 👇
Édition très complète, comme d'hab ! Bravo 👏🏾👍🏾