Une nouvelle Aube
Bonjour à tous, modèles de langage, humains curieux, artistes numériques augmentés, amateurs de belles images, techniciens du prompt, et à tous les autres lecteurs. Nous vous souhaitons la bienvenue dans cette 48e édition de GENERATIVE, la grosse newsletter hebdomadaire qui non seulement aborde l'actualité de l'IA générative, mais vous présente également des outils créatifs, résume les projets marquants, et donne la parole à des acteurs inspirants de l'écosystème qui font des choses intéressantes avec cette technologie.
Sommaire
✔️ Les news de la semaine
✔️ Midjourney ajoute de nouvelles fonctionnalités !
✔️ Le film de voeux augmenté par l’IA de l’agence Capa
✔️ Et toi, tu fais quoi avec l’IA ? Interview imagée de Ludovic Creator
Les news de la semaine
La Force du côté obscur
Selon une étude de Kaspersky, les conversations avec ChatGPT pourraient se retrouver sur le dark web. Près de 3000 publications illicites utilisant ChatGPT ont été recensées. Les cybercriminels exploitent ces IA à des fins malveillantes : fraudes, logiciels malveillants, revente de comptes volés... La prudence est de mise. Avant de confier vos secrets à ChatGPT, rappelez-vous que vos mots pourraient voyager bien au-delà de vos attentes, jusqu'aux bas-fonds du dark web.
Source
Le Times pivote
Le New York Times crée une équipe dédiée pour expérimenter les applications de l'intelligence artificielle au journalisme. Menée par Zach Seward, figure de l'innovation médiatique, elle établira des principes d'utilisation des IA génératives et concevra des formations pour les journalistes. Objectif : incorporer ces outils dans les processus de publication et la création de contenus, malgré la relation tumultueuse passée du journal avec l'IA comme ChatGPT. Le quotidien américain opère un virage stratégique : dès août 2023, il avait été le premier à interdire la récupération de ses contenus pour entraîner les modèles d’intelligence artificielle.
La lutte contre les deepfakes s’organise
Suite à la publication de deepfakes pornographiques de Taylor Swift, des législateurs américains proposent une loi pour lutter contre ce fléau. Le "Defiance Act" permettrait aux victimes d'engager des poursuites contre les auteurs de ces faux médias généré par IA. La création et diffusion non consenties de deepfakes sexuels deviendrait un délit. D’aucuns pointent déjà du doigt des activistes pro-Trump convaincus que Taylor Swift serait un agent infiltré pour faire basculer la prochaine élection présidentielle américaine en faveur des démocrates, mais c’est une histoire pour une prochaine édition. Ou pas.
Joe Biden said
Un deepfake audio du président Joe Biden, crééeavec la technologie d'ElevenLabs, a été utilisée pour dissuader les électeurs de voter lors des primaires du New Hampshire. Suite à une analyse confirmant l'origine de cette manipulation, ElevenLabs a suspendu le compte de l'utilisateur à l'origine. Cet incident prouve une fois encore la facilité troublante avec laquelle l'IA voix peut désormais créer des contenus hyperréalistes capable de mettre en danger le processus démocratique.
“A cinematic photo portrait of a robotic Joe Biden” - LeonardoAI
L’open source contre attaque
La startup française Mistral AI a subi une fuite au sujet d’un LLM avancé, divulgué sur Hugging Face, et baptisé par "Miqu". Les premières analyses suggèrent des performances comparables à GPT-4 d'OpenAI. Arthur Mensch, PDG de Mistral, a reconnu la fuite comme étant l'action d'un employé d'un client ayant accès anticipé. Mistral, réputée pour ses modèles de langage open source performants, envisage de surpasser GPT-4 avec son développement en cours, renforçant l'intérêt pour l'IA générative open source face aux modèles propriétaires.
Source
“L’image comme vérité est morte”
Le photographe britannique Phillip Toledano interroge avec son projet "Another America" la capacité troublante de l'intelligence artificielle à falsifier le passé. En générant de fausses photos d'archives, il imagine une histoire alternative des Etats-Unis. Son objectif: dénoncer la facilité avec laquelle l'IA peut désormais fournir des preuves visuelles convaincantes à des mensonges historiques. Ses images imitent le style photographique des années 40-50 quand les photos étaient encore gage de vérité, contrairement à aujourd'hui où "la notion d'image comme vérité est morte" selon lui. Source
Vers la fin du sous-titrage ?
Lors du Forum économique mondial à Davos, le président argentin Javier Milei a utilisé la technologie HeyGen pour traduire son discours en anglais. L’outil a non seulement transcrit fidèlement ses paroles, mais a aussi synchronisé le mouvement de ses lèvres, comme s'il parlait anglais, en conservant ses expressions faciales et son ton. Ce développement ouvre des perspectives spectaculaires pour la communication mondiale, rendant les sous-titres obsolètes et promettant un avenir où les barrières linguistiques pourraient être inexistantes. Et pose en même temps la question de la nécessité de continuer à apprendre des langues étrangères. Qu’en pensez-vous ?
On n’arrête plus Google
…qui lance une sortie Gen AI majeure toutes les semaines. La dernière en date s’appelle ImageFX, un nouvel outil de création d'images alimenté par l'IA Imagen 2. Grâce à des "puces expressives", il permet aux utilisateurs d'explorer différentes variations de leurs idées. Google assure avoir mis en place des garde-fous techniques pour limiter les contenus problématiques (Bonjour Taylor Swift). Les images sont également marquées par SynthID, une signature imperceptible permettant de détecter si elles ont été générées par l'IA.
Quant à Imagen 2, il semble prometteur. Pour mémoire, Imagen 1 est accessible via l’outil de génération d’images de Canva.
Imagen 2 (les temps de génération ont été accélérés)
New Future of Work Report
La firme de Redmond a récemment publié un rapport sur le futur du travail avec l'IA:
Selon ce rapport, les travailleurs utilisant des assistants IA comme ChatGPT gagnent en productivité (37%) et en qualité (40%) de travail, mais perdent en précision (20%). Pour pallier cela, l'analyse et l'intégration humaines des informations générées par l'IA deviendront cruciales. On note aussi la prédominance persistante de l'anglais dans les performances des IA, pénalisant les langues sous représentées sur internet.
Autre constat: le savoir numérique réside désormais plus dans les conversations employés-IA que dans les documents. Enfin, l'IA pourrait impacter 10 à 50% des tâches de 80% des travailleurs américains. Plutôt que de subir ses effets, Microsoft appelle à décider collectivement de son influence souhaitée sur le travail.
Source
Le Top des outils IA les plus populaires de 2023
Selon une étude publiée par Visual Capitalist, le produit phare de l'intelligence artificielle en 2023 est ChatGPT, avec plus de 14 milliards de visites sur son site, soit 60% du trafic total vers les outils d'IA. Il devance le chatbot Character.AI (j’avoue mon incompréhension, je dois être sensiblement plus vieux que le coeur de cible) et l'outil d'écriture QuillBot. Outre ces générateurs de texte, Midjourney se classe 4e, montrant la popularité croissante de l'IA générative. Malgré le stade précoce de cette technologie, ces outils ont déjà conquis des milliards d'utilisateurs, préfigurant une adoption publique massive à venir avec des produits toujours plus innovants.
The Billionaires Bunker
La chaine YouTube “The AI Daddy” a récemment publié une vidéo réalisée avec 3 outils d’IA générative :
Gen-2
Midjourney
Eleven Labs
Le résultat est fort sympathique :
Des news Midjourney !
Midjourney a inauguré hier un nouveau paramètre appelé “consistent styles”.
Il permet aux utilisateurs Midjourney.
Pour l'utiliser, ajoutez le paramètre --sref {imgURL}.
Oui, il est désormais possible de copier le style d’une image sur internet.
Le modèle considère les URL de l'image comme des « références de style » et essaie de créer des visuels dont l’aspect correspond à l'ambiance et à l'esthétique.
Point de vue positif : “On va pouvoir s’inspirer de n’importe quel visuel, no limit à la créativité !”
Point de vue négatif : “Facilitation des possibilités de plagiat de tous les artistes/créatifs/designers/créateurs dont les images sont disponibles sur Internet (tout le monde quoi)”
Exemples de son fonctionnement proposé par Nick St Pierre :
Vous ajustez les “poids du style” comme ceci :{prompt} --sref urlA::2 urlB::3 urlC::5
Le poids détermine l'influence d’un style sur l'image. Plus le poids est élevé, plus l'influence est grande. Par défaut, ils sont équilibrés à 1. C’est une syntaxe déjà bien connue par les utilisateurs réguliers / avancés de Midjourney.
Vous pouvez définir l'intensité totale de la stylisation via --sw 100.
100 est la valeur par défaut, 0 c’est désactivé, 1000 est le maximum.
La syntaxe : {votre prompt} --sref urlA::2 urlB::3 --sw 500
Je compte sur tous les utilisateurs Midjourney qui me lisent pour tester et explorer ce nouveau paramètre dès que possible !
Un film de voeux augmenté par l’IA
J’ai récemment acculturé les équipes de la célèbre agence Capa aux outils d’intelligence artificielle générative, et je retourne les former la semaine prochaine, sous l’étendard de mon partenaire spécialiste Maikers Institute.
Ce fut un événement riche d’échanges et de rencontres, à l’issue duquel la direction de Capa m’a proposé de réaliser leur film de voeux 2024, avec de l’IA dedans. J’ai évidemment accepté, et nous nous sommes mis au travail sur la dernière dizaine de janvier.
Après le tournage qui a eu lieu dans les locaux parisiens de l’agence
Je me suis mis au boulot sur les effets spéciaux. Au final, j’ai utilisé pas moins de 11 outils différents :
Runway Gen-1
Runway Gen-2
Runway ML (détourage automatique)
Eleven Labs
Heygen
Suno
Midjourney v6
Magnific AI
LensGo Ai
Wonder Dynamics
D-ID
Sans plus attendre, voici le résultat :
Et toi, tu fais quoi avec l’IA ?
Cette semaine, j’ai le plaisir d’interviewer Ludovic Carli, a.k.a. LudovicCreator sur Twitter. Ludovic est un explorateur d’outils genAI doublé d’un créateur talentueux et très prolifique.
Bonjour Ludovic, pourrais-tu te présenter ?
Alors j’ai 48 ans originaire de Marseille et vivant à Marseille après avoir beaucoup bougé. Je suis ingénieur chimiste procédés de formation,. J’ai fait une partie de mes études en Angleterre puis terminé mon cursus en France et fait de la recherche chez Rhodia Chimie. Passioné de rugby , de plongée je suis en freelance et bosse avec certaines sociétés pour du dimensionnement et coûts de fonctionnements de nouvelles installations. Et un passionné d’IA depuis quelques mois.
Quand as-tu commencé ton parcours en IA générative, et comment cela s'est-il passé ?
J’ai commencé mon parcours dans l’IA générative en Juin 2023. Je m’intéressais un peu à Chat GPT et Claude car je suis assez curieux de nature. Puis un jour en scrollant sur Instagram je suis tombé sur un post de Geniart et là whouua je me suis dit cool ce qu’on peut faire ..Je vois donc sur sa bio un lien vers un serveur Discord et un site internet sur Midjourney. Je regarde son site Internet avec beaucoup d’informations sur Midjourney puis rejoint dans la foulée son serveur Discord qui est une vraie mine d’or d’informations sur les IA génératives. Et c’est là que mon aventure a débuté. Geniart m’a beaucoup aidé dès le début ainsi que toute la communauté du Discord . Je prends un abonnement à Midjourney et tout s’est enchaîné. J’ai débuté sur Midjourney une semaine avant la sortie de la V 5.2. Tout ce que je pouvais faire ,avec beaucoup d’échanges avec la communauté Geniart, ne faisait qu’éveiller encore plus ma curiosité.
Quels sont tes outils d'IA générative préférés et pourquoi ?
Mes outils d’IA générative préférés sont :
MIDJOURNEY : J’ai débuté avec cet outil et il me passionne. Je trouve que c’est un outil formidable pour des personnes ayant un esprit créatif mais pas de talent de dessin ou autre. J’avais quelques connaissances mais aucun véritable background en art ou en photographie. Créer sur Midjourney m’a permis de m’y intéresser de manière approfondie et donc aussi d’élargir mes connaissances car il y a un travail de recherche permanent à faire aussi quand on veut pousser les choses plus loin.
LEONARDO AI : Je m’y suis intéressé plus tard et je trouvais ça vraiment intéressant mais je n’ai pas poussé plus loin car je n’avais pas envie de prendre un deuxième abonnement et j’étais satisfait avec Midjourney. Mais ma présence et mon activité sur X (Twitter) ont fait que j’ai été contacté par la staff de Leonardo pour intégrer leur programme de créateurs courant Novembre. Et donc depuis je l’utilise aussi très régulièrement. C’est une plateforme qui évolue très vite , qui s’améliore très vite avec de nombreuses fonctionnalités. Et c’est largement au niveau de Midjourney sur certains types de rendus .
REMIX : C’est une application mobile d’IA générative d’images avec pour vocation de rester en mobile. Là aussi je n’étais pas très convaincu par le mobile mais depuis Novembre je l’utilise régulièrement. C’est même assez ludique avec de très nombreuses fonctionnalités ajoutées régulièrement. Cela ne remplacera jamais Midjourney ou Leonardo mais ils évoluent très vite et un outil gratuit formidable pour des débutants en IA générative d’images.
Runway / Pika Labs/ Assistive pour la vidéo : Chaque outil , comme pour tous , a ses avantages et ses inconvénients . Mais ça évolue très vite , et quand on regarde quelques mois en arrière c’est quand même assez impressionnant les possibilités.
Magnific AI : Un upscaler de grande qualité , pas toujours fiable, qui demandent pas mal de tests , et un pricing assez cher mais qui peut bonifier n’importe quelle image.
Générative Fill de Photoshop : bien pratique quand on passe du temps à le maîtriser.
Chat GPT : Un assistant formidable en terme de créativité
Comment utilises-tu l'IA générative pour nourrir et amplifier ta créativité ?
J’aime pousser l’IA générative le plus que je peux . Et c’est très addictif au final . Car les possibilités sont infinies. Après quelques semaines d’apprentissage j’ai commencé à intégrer la chimie dans mes prompts., pour essayer d’intégrer la science à l’”Art” . Et je mets “Art” entre guillemets car je ne me considère pas comme un Artiste mais comme un créateur . Ce débat est très vaste et d’actualité mais ç’est ma perception à moi. Puis je me suis mis à créer mes propres styles . Soit en mixant des styles existants , des fois totalement opposés, soit en créant des tokens imaginaires ou des styles imaginaires. Et là la créativité est sans fin .
Alors oui ça demande beaucoup de tests , d’essais certains marchent très bien , d’autres pas du tout . Car il ne faut pas oublier que l’on est aussi dépendant de l’interprétation de l’IA de nos prompts. Mais ce qui fait que j’ai toujours des projets, des prompts à créer , des styles à expérimenter.
Puis l’évolution des outils , comme les nouvelles versions de Midjourney par exemple, nous poussent sans cesse à nous renouveler , à créer différemment , à évoluer aussi dans notre manière de prompter.
Quand t'es tu lancé sur X (Twitter) et comment as tu fait pour fédérer une communauté de bientôt 10.000 followers ?
Je me suis lancé sur X fin Juin 2023. La communauté IA était très active et bienveillante dans 95 % des cas, avec beaucoup de partages de prompts , de challenges pour partager nos créations. Cela m’a permis d’interagir avec beaucoup de gros comptes , de créateurs. Puis courant Août j’ai commencé à partager mes prompts. Et là ma communauté a commencé à grandir. Puis je crois courant Novembre j’ai commencé à partager mes prompts basés sur la chimie ou alors mes prompts de styles créés. Je crois que de faire quelque chose de différent ça plait aussi.
Donc depuis Novembre je partage en gros 5 prompts par jour , quelques fois des tutos aussi comme j’ai pu le faire pour Leonardo AI. L’algo de X est très fluctuant et incompréhensible et ne favorise pas spécialement les créateurs. Et il y a aussi beaucoup plus de monde dans la communauté que quelques mois en arrière.
Cela demande consistance, partage, bienveillance et interactions. C’est quelquefois très frustrant quand on passe des heures sur un prompt et que la publication a très peu d’impressions . Je pense que je suis apprécié pour ma bienveillance aussi en prenant le temps d’interagir avec tous peu important la taille du compte.
En te suivant sur les réseaux sociaux, j'ai remarqué que tu postes régulièrement des images Midjourney créés avec des token plus ou moins rares ou exotiques. d'où te vient cette inspiration ?
Alors c'est surtout l'envie de proposer quelque chose de différent. Je n'utilise jamais d'artiste en référence dans mes prompts , c'est un choix personnel. L'IA permet une créativité infinie. Mon idée et mon envie étaient de la pousser le plus loin possible en utilisant des styles ou des tokens qui n'existent pas. On est quand même tributaire de l'interprétation de l'IA, mais cela nous aide à pousser notre créativité très loin. C'est aussi une des raisons certainement qui fait que mes publications plaisent, car c'est un style qui m'est propre.
En regardant en arrière sur l'année 2023, qu'est-ce qui t'a le plus marqué ou surpris dans le monde de l'IA générative ?
Alors j’ai moins de recul car j’ai démarré en milieu d’année . Mais ce qui m’a le plus marqué c’est l’évolution hyper rapide des outils et l’apparition constante et journalière de nouveaux outils.
La V6 de Midjourney a été bien longue à arriver avec le fantôme de la V 5.3 mais Leonardo a évolué très vite , de très nombreux outils sont apparus tel que Musavir , Magnific , Rendernet et bien d’autres . Les outils vidéos ont aussi tous beaucoup évolué et même si on parle essentiellement de Runway et Pika Labs il y en a beaucoup plus.
Le travail de veille à faire est énorme concernant l’IA générative et c’est aussi une grosse partie de notre travail.
Quelles sont les innovations que tu anticipes sur l'années 2024 dans le domaine des outils créatifs d'IA générative ?
Ce que je vois sur l’année 2024 :
Compétition acharnée entre Runway / Pika Labs dans le domaine de la vidéo. Verra-t-on un film full AI d’ici la fin de la l’année ? Je ne sais pas mais sur une durée de 30 minutes je pense
Régler le problème de la consistence des personnages . Le premier outil qui va régler cela de manière “simple” prendra une longueur d’avance
l’apparition de plateforme multi tools comme Leonardo AI pour simplifier le workflow.
Je suis un amoureux de Midjourney mais si ils n’évoluent pas plus vite 2024 pourrait bien être l’année de Leonardo AI
des avancées certaines dans le domaine de la 3D
Merci Ludo pour ces réponses détaillées comme on les aime !
Cette édition est terminée, merci de l’avoir lue. Si elle vous a plu, vous pouvez la partager en cliquant juste ici :
Vous pouvez également me suivre sur LinkedIn et activer la cloche 🔔, je poste régulièrement sur l’intelligence artificielle générative. Vous pouvez également me contacter pour toute proposition de création, intervention, conférence, projet, formation liée à l’intelligence artificielle générative.
Et n’oubliez pas de vous abonner pour ne rien rater des prochaines éditions 👇
A la semaine prochaine !