Bonjour à toutes et à tous, novices du prompts, experts génératifs, cyborgs, mutants, androïdes, et mêmes humaines, bienvenue dans cette 49e édition de GENERATIVE, la grosse newsletter hebdomadaire francophone qui vous résumé l’actu trépidante bouillonnante inquiétante fascinante (rayez la mention inutile) de l’inelligence artificielle générative.
Au sommaire cette semaine :
✔️ Les news de la semaine
✔️ Mon Marathon pédagogique avec l’IA
✔️ Le 1er groupe musical IA made in France ?
Les news de la semaine
Google Bard, c’est (déjà) fini
Google s'apprête à renommer son chatbot Bard en “Gemini”, en référence à son nouveau modèle multimodal. Ce changement, effectif dès le 8 février, vise à mieux concurrencer GPT-4 d'OpenAI. Google promet un accès amélioré à ses modèles d'IA, avec une version payante (20$/mois) plus puissante, Gemini Advanced, offrant des capacités avancées pour des tâches complexes. Un prix non divulgué, mais une disponibilité annoncée dans 150 pays. De plus, une application Gemini pour Android et iOS sera lancée, initialement en anglais, japonais et coréen.
Et lorsqu’on interroge le principal intéressé, le switch semble déjà fait :
“For the record” voici la bande démo de l’outil, qui ressemble davantage à un teaser qu’à une prez produit. D’aucuns le présentent déjà comme un “chatGPT4 Killer” sur les internets. Sortez vos cornets de popcorn, le feuilleton ne fait que commencer…
Single Persons Unicorns
Une récente déclaration de Sam Altman, PDG d'OpenAI, a récemment fait couler beaucoup d’encre. Selon lui, l'IA pourrait permettre l'émergence d'une nouvelle sorte de startups : la "licorne à une personne", valorisée à plus d'un milliard de dollars avec un seul fondateur et aucun employé.
Boostées par des outils d'IA automatisant de nombreuses tâches, ces solo-entreprises pourraient représenter l'apogée du mythe du fondateur visionnaire qui nourrit la Silicon Valley depuis plusieurs décennies.
Vous y croyez vous ? Personnellement, j’ai un peu de mal.
Source
Turbo Génération
Puisqu’on parle de Google, la firme de Mountain View Google innove avec MobileDiffusion, un modèle d'IA capable de générer des images à partir de prompts sur smartphones. Plus compact que DALL-E et Stable Diffusion, MobileDiffusion produit des images 512x512 en moins d'une demi-seconde(!), traitant les données directement sur les appareils iOS et Android sans passer par le cloud, offrant ainsi une solution pratique et rapide pour la génération d'images via l'intelligence artificielle.
Ne clignez pas des yeux, ça va très vite
Les espions agents du futur
Après ChatGPT, OpenAI serait en train de plancher sur des agents IA capables d'accomplir des tâches à la place des utilisateurs, comme remplir des tableurs ou réserver des voyages, etc.
Deux types d'agents seraient en développement : l'un pour automatiser des actions sur l'ordinateur, l'autre pour réaliser des requêtes web complexes. Le revers de vcete médaille reluisante, c’est que pour être efficaces, ces agents doivent accéder aux données personnelles des utilisateurs. Etes vous prêts à tout révéler à ces "majordomes numériques" ?
Source
Les LLM vous comprennent
Des recherches récentes montrent que les modèles de langage de grande taille (LLM) peuvent comprendre des différences d’états mentaux humains, une capacité psychologique connue sous le nom de “théorie de l'esprit”. Michal Kosinski de Stanford a testé des modèles comme GPT-4 sur des tâches linguistiques conçues pour évaluer cette capacité chez les humains. Les résultats indiquent que la performance des modèles s'améliore avec leur taille, GPT-4 ayant surpassé les performances des enfants de 7 ans dans certains cas.
Seriez vous prêts à faire part de vos pensées à un LLM ?
Identification faciale
Microsoft lance "Face Check", une nouvelle fonctionnalité de vérification d'identité en temps réel par reconnaissance faciale, intégrée à son service Entra Verified ID. Utilisant l'intelligence artificielle Azure, Face Check compare un selfie à un document d'identité certifié, pour une vérification simple et sécurisée des utilisateurs. Axée sur le respect de la vie privée, cette innovation a le potentiel de révolutionner la gestion des identités numériques.
Identification toujours
OpenAI a annoncé l'introduction de filigranes numériques (watermarks) pour les images générées par DALL-E 3, développés par la Coalition for Content Provenance and Authenticity (C2PA). Cette initiative vise à renforcer la confiance du public en permettant de vérifier facilement l'authenticité et la source des contenus. Les filigranes, invisibles mais détectables, garantissent la transparence sans altérer l'esthétique visuelle des images. Cette mesure proactive répond au besoin croissant de mécanismes pour différencier les contenus générés par l'IA de ceux créés par des humains, et lutter contre la désinformation.
Apple le disrupteur
Apple et les chercheurs de l'UC Santa Barbara ont développé “MGIE”, un système d'IA en open source, capanble d’éditer des images via des commandes en langage naturel. Utilisant des modèles de langage multimodal, MGIE peut modifier couleurs, objets, optimiser luminosité/contraste et appliquer des filtres à partir de simples instructions textuelles. Le modèle assure que les modifications correspondent aux instructions tout en préservant les zones non concernées, promettant un contrôle de type Photoshop avec de simples prompts.
J’ai mis cette dernière phrase en gras à destination de tous les professionnels de l’image qui comprendront à quel point cela pourrait devenir un game changer.
Usual Deepfakes
À Hong Kong, un employé d'une multinationale a transféré 25 millions de dollars à des escrocs lors d'une fausse visioconférence. Tous les participants étaient des deepfakes créés par IA pour imiter ses collègues. Trompé par ces simulations ultra-réalistes, l'employé a effectué une quinzaine de transactions comme demandé par son faux patron. Cette arnaque sophistiquée démontre les dangers potentiels des deepfakes, capables de manipuler même des professionnels avertis.
AI Acte 2
Après sept mois d'opposition, la France a finalement accepté de valider l'AI Act, un projet de règlement européen sur l'intelligence artificielle. Cette décision, prise à l'unanimité par les vingt-sept pays de l'UE, représente une étape décisive. Ce texte réglementaire vise à équilibrer innovation et sécurité dans le domaine de l'IA. La France a tenté en vain d'obtenir des concessions supplémentaires pour protéger ses startups d'IA. Si c'est un revers à court terme, la France estime avoir gagné sur le long terme en affichant son leadership européen dans ce domaine et en accueillant un sommet mondial sur l'IA à l'automne.
Horizon 2030
Selon Next Move Strategy Consulting, le marché de l'intelligence artificielle devrait connaître une forte croissance dans la décennie à venir, passant de 100 milliards de dollars en 2022 à près de 2 000 milliards en 2030. Dans ce contexte, l'IA générative comme ChatGPT suscite un intérêt grandissant depuis fin 2022. Parallèlement, le monde académique accélère la publication d'études sur l'IA pour suivre le rythme des avancées technologiques rapides du secteur, la plupart des spécialistes PhDs nord-américains étant embauchés dans l'industrie.
Source
Encore une avancée en vidéo ?
Je ne sais pas ce qu’il se passe en ce moment avec la vidéo IA mais j’ai l’impression que chaque nouvelle semaine est le théâtre d’un nouveau pavé dans la mare (ou d’une “avancée significative” comme dit chatGPT). La semaine dernière, c’était Google Lumière qui impressionnait. Cette semaine, la surprise nous vient du monde de l’open source avec Stable Video.
Les deux explorateurs IA que sont Hauke Hilberg et Martin Haerlin ont reçu un accès anticipé à la plateforme et ont réalisé un (très) court métrage intitulé “Storm”, qui met en scène une ballerine qui affronte ses peurs intérieures jusqu’à ce qu’elle devienne elle-même la tempête.
Leur objectif était d’évaluer la gestion des mouvements par l’outil. Ils n’ont pas fait d’upscale ni ajouté d’effet.
Leurs observations :
- Il est possible de soit télécharger des images, soit les créer directement sur la plateforme.
- Si vous voulez que votre clip ait des mouvements, pensez à utiliser des images de coureurs, de voitures ou bien de danseurs.
Je trouve le résultat pas mal du tout, même si les mouvements sont encore un peu figés. Cela à mettre en perspective avec ce que proposent Runway Gen-2 et Pika. Le contrôle des mouvement des personnages y est très aléatoire, pour ne pas dire impossible. Le contrôle fin des éléments est le principal cheval de bataille des prochains updates des outils de génération de vidéo.
Que pensez vous du résultat ?
Vous pouvez rejoindre la waitilist ici :
Mon Marathon pédagogique de l’IA
Ma semaine a été particulièrement remplie avec pas moins de 4 journées (et une soirée !) de formations en IA générative.
Lundi et mardi, j’ai découvert une zone française méconnue, un triangle des Bermudes constituée par les villes de Nantes, Angers et Cholet.
Et au milieu de tout ça, Saint Pierre Montlimart, où se trouve le siège social d’Eram.
Au programme de ces deux jours de formation, des outils de génération d’images, de vidéos et un peu de chatGPT. A chaque fois, je prends du plaisir à non seulement transmettre des connassainces mais aussi à voir les stagiaires s’émerveiller de leurs premières générations avec ChatGPT et Midjourney.
Mercredi et Jeudi, je suis retourné dans les beaux locaux du groupe Newen à Paris 15e, où j’ai formé les collaborateurs de l’agence Capa corporate que j’avais déjà acculturés au mois de janvier et pour qui j’avais co-réalisé le film de voeux IA que je vous ai présenté la semaine dernière.
Un programme similaire avec quelques outils supplémentaires d’upscaling génératif (krea.ai et Magnific.ai) ou encore Leonardo AI et ideogram.ai.
Mercredi soir, j’ai eu le plaisir d’animer une session de formation en visio pour des équipes de France Télévisions Publicité situées de l’autre côté du globe, à Nouméa et Papeete. Il était 20h en France, 9 du matin le même jour à Papeete et 6h du matin le jour suivant à Noumea. Au programme : des outils d’IA pour explorer des possibilités de création audiovisuelle pour ces équipes, nous avons eu des échanges passionnants.
Je constate une traction très forte sur ces sessions d’acculturation et de formation en Ia générative. J’ai le sentiment que l'IA apporte un chamboulement similaire à celui de l’arrivée de la micro informatique en entreprise dans les années 90.
Qu’on soit pour ou contre, la vague IA est là, déferlante, inévitable.
Envisager de manière concrète d’intégrer l’IA dans les pratiques professionnelles de leurs collaborateurs n’est désormais plus seulement une option pour les entreprises, mais une nécessité pour rester compétitifs et avant-gardistes.
Le 1er groupe musical IA made in France ?
Le toujours très créatif Ari Kouts, dont je vous avais déjà parlé en ces pages vient de sortir sa dernière expérimentation, toujours à la frontière entre créativité et automatisation.
Il s’est attaqué cette fois-ci au domaine musical en créant un groupe 100% IA et leur premier album, disponible sur toutes les plateformes de Streaming.
https://siliconsymphony.art
Voici un mashup pour se faire une idée :
La (forte) compression audio est clairement perceptible mais je trouve que les mélodies n’ont pas grand chose à envier sur ce que j’entends à la radio.
Bien entendu qui dit musique dit clip, Ari a donc également réalisé leur premier clip 100% IA :
Ari explique qu’il a réalisé les morceaux avec de simples prompts sur Suno, sans aucune écriture, composition ou même montage. Selon lui, un album complet (mais moyen) peut être réalisé en quelques minutes (!).
Ce constat ouvre des perspectives pour celles et ceux qui auraient des velléités de création musicale sans disposer de compétences / connaissances en composition musicale.
Et pose évidemment des questions sur l’avenir de la création musicale. Mon avis est qu’on va assister à l’émergence de nouveaux contenus musicaux plus ou moins “cheap”, générés avec l’IA.
On verra aussi (et c’est déjà le cas) l’utilisation d’outils IA par des artistes installés, pour optimiser leurs workflow et/ou leurs process créatifs.
Avec une différence qualité entre les deux qui devrait diminuer au fur et à mesure que l’IA va rattraper son retard sur la création humaine.
Et en ce qui concerne les groupes virtuels, le phénomène n’est pas nouveau et cartonne en Corée du Sud.
Cette édition est terminée, merci de l’avoir lue. Si elle vous a plu, vous pouvez la partager en cliquant juste ici :
Vous pouvez également me suivre sur LinkedIn et activer la cloche 🔔, je poste régulièrement sur l’intelligence artificielle générative. Vous pouvez également me contacter pour toute proposition de création, intervention, conférence, projet, formation liée à l’intelligence artificielle générative.
Et n’oubliez pas de vous abonner pour ne rien rater des prochaines éditions 👇
A la semaine prochaine !
Au top toutes ces formations pro ! 👏🏻