Technologie et créativité augmentée

janv. 19, 2024

Salut les passionnés et les curieux, bienvenue dans cette nouvelle édition de GENERATIVE, la. newsletter hebdomadaire qui décortique l’actualité de l’IA générative, vous présente des outils créatifs et des personnes qui utilisent l’IA de manière éclairante.

Au sommaire cette semaine, des news, un retour sur le 48 hour Film Project IA et l’interview de la très talentueuse et très prolixe Tatiana Tsiguleva, artiste Ia experte de Midjourney. C’est parti !

✔️ Les news de la semaine

✔️ 48 Hour Film Project IA

✔️ Et toi, tu fais quoi avec l’IA ? Interview de Tatiana Tsiguleva

“a man's face upturned against a backdrop of a cosmic galaxy” - Midjiourney v6 - Outpainting Photoshop

Les news de la semaine

Copilot Pro
Microsoft lance Copilot Pro, une version avancée de son assistant IA, à un tarif de 20 dollars par mois. Basé sur le modèle d'IA Prometheus de GPT-4 d'OpenAI, Copilot Pro propose des fonctionnalités étendues pour optimiser performance, productivité et créativité. Les abonnés Microsoft 365 Personnel ou Famille bénéficient d'un accès prioritaire aux derniers modèles IA, dont GPT-4 Turbo, et à de nouvelles capacités comme la création d'images IA avec Image Creator. Microsoft introduit également Copilot GPT Builder pour personnaliser les modèles GPT, et une application mobile Copilot, disponible sur Android et iOS. L'objectif est de rendre Copilot accessible à tous les utilisateurs de Microsoft 365, sans restriction du nombre d'utilisateurs.

ChatGPT 5
Sam Altman, CEO d'OpenAI, a fait une annonce concernant le futur GPT-5 de ChatGPT. Cette version sera entièrement multimodale, capable de gérer parole, image, code, et vidéo. GPT-5 pourrait en effet générer des vidéos selon les requêtes des utilisateurs, ce qui marque une avancée significative supplémentaire dans les capacités de chatGPT.
Evidemment, cela soulève des inquiétudes concernant la confidentialité, les droits d'auteur et personnellement je redoute le raz de marée de vidéos de mauvaise qualité (à priori dans un 1er temps) qui vont bientôt inonder nos réseaux sociaux. GPT-5, prévu pour sortir cette année, sera disponible uniquement pour les abonnés payants de ChatGPT Plus.

Propaganda
Dans son édition du 18 janvier, le journal "Le Monde" met en lumière une campagne d'influence en ligne pro-Chine qui utiliserait des chaînes YouTube comme "Sophie décrypte" ou "360 Vision" pour diffuser de la propagande.
Ces chaînes, qui recourent à la synthèse vocale pour “lire” des textes qui semblent avoir été écrits avec chatGPT, font l'éloge de l'économie et de l'industrie chinoise, parfois de manière presque parodique, avec pour objectif la promotion des intérêts politiques et économiques de Pékin. YouTube a déjà modéré plusieurs de ces chaînes et l'origine exacte de cette campagne n'est pas clairement établie, mais elle pourrait être liée à des acteurs privés engagés dans des opérations d'influence pour le compte de la Chine.

La chaîne Sophie décrypte rassemblait près de 50 000 abonnés sur YouTube.

Le futur du travail en question
Bertrand Roudaut, dans une tribune pour "Le Monde", analyse l'impact de l'IA sur l'emploi, remettant en question la théorie du déversement de Sauvy. Historiquement, les emplois se déplaçaient de l'agriculture à l'industrie puis aux services. Avec l'IA, ce modèle est perturbé, l'IA détruisant des emplois qualifiés dans les services sans créer un nombre équivalent de nouveaux postes. Roudaut propose la création d'un secteur "quaternaire" centré sur la décarbonation, réunissant les objectifs économiques, environnementaux et sociétaux. Pour lire l'article complet, veuillez visiter Le Monde.

Multi Motion Brush
Runway, éditeur de l’outil de générations de video IA “Gen-2”, vient de sortir une nouvelle fonctionnalité appelée “multi motion brush”. Il est désormais possible d’animer plusieurs éléments d’une vidéo, indépendamment les uns des autres.
Cette fonctionnalité n’est accessible qu’en version bêta, aux membres du “Creative Partner Program”.

The Virtual Girlfriend business
Askip, comme disent les jeunes, des utilisateurs enfreignent les règles dès le deuxième jour d'ouverture du GPT Store d'OpenAI, en créant des chatbots de type "girlfriend". Cette situation défie les règles du Store qui interdisent les GPT dédiés à la compagnie romantique. La popularité de ces chatbots s'inscrit dans un contexte où les applications de chatbot relationnelles sont très téléchargées aux États-Unis. Reflet probable de la solitude croissante dans la société, les chatbots AI pourraient apporter une solution pour les plus isolés, mais posent également des questions éthiques sur l'exploitation de la souffrance humaine.
Source

Screenshot of "Virtual Sweetheart" chatbot.

Pub TV IA
En Pologne, une publicité presque entièrement générée avec des outils l'IA s’est fait récemment remarquer. Elle a été créée en suivant un processus proche d’un tournage pub traditionnel de film d’animation. Les outils changent, pas les étapes du processus.

La stratégie a été élaborée d’un commun accord par l’agence et le client.
Idée créative et scénario conçus par un concepteur rédacteur humain.
Moodboards, storyboards et "acteurs" générés par l'IA et approuvés par le client.
Utilisation de 8 outils d'IA pour animer et finaliser personnages et décors (15 versions au total)
Voix off enregistrée par un comédien humain.
Publicité testée avec l’outil “Kantar LinkAI”. Elle a obtenu d’excellentes notes dans les benchmarks, notamment en différenciation.
Consultation sur les risques juridiques avant le lancement de la campagne.
Diffusion télévisée du projet depuis cette semaine, après validation.

Alors, on en pense quoi ?

Ecriture hybride
Rie Kudan, lauréate du prix Akutagawa, a révélé que son roman "Tokyo-to Dojo-to" intégrait environ 5% de texte généré par l'IA ChatGPT. Ce livre, salué pour sa perfection, explore un Tokyo futuriste et a été influencé par des dialogues entre l'autrice et l'IA. Cette approche suscite autant de débats sur la moralité et le talent, qu’elle représente un exemple novateur de l'utilisation de l'IA dans la “littérature sérieuse” (je ne parle pas des milliers d’écrits chatGPT auto édités sur Amazon)

Jumelles augmentées
Au CES 2024, Swarovski Optik a révélé les AX Vision, des jumelles dotées d'IA capables d'identifier environ 9000 espèces d'oiseaux. Ces jumelles, équipées d'une unité de traitement neuronal, reconnaissent les oiseaux en cinq secondes et intègrent un GPS pour une identification précise selon la localisation. Elles possèdent également une caméra de 13 mégapixels pour des vidéos et photos de haute qualité. Une application mobile dédiée reçoit les images capturées, et une fonctionnalité affiche des flèches indiquant l'espèce observée lors du passage des jumelles d'une main à l'autre. 4799$ tout de même.

Tu seras mon AMIE
Google Research a développé AMIE, un système d'IA spécialisé pour le raisonnement diagnostique dans le domaine médical. AMIE vise à améliorer l'exactitude diagnostique et la communication dans les consultations cliniques.
Testé dans des simulations, AMIE a surpassé les médecins généralistes dans plusieurs dialogues diagnostiques. Ce système marque un progrès important pour intégrer l'IA dans les soins de santé, nécessitant encore des développements pour assurer sa sécurité et sa fiabilité.
Source

Midjourney Update is coming
David Holz, le fondateur de Midjourney, a récemment fait des annonces concernant les updates à venir de la v6.
En résumé : Retour de fonctionnalités telles que l'inpainting et l'outpainting, ainsi qu'une nouvelle page "Explore" dynamique. Le site Alpha, réservé aux utilisateurs très actifs, bénéficie d'un système de notation simplifié. Des sondages réguliers et une enquête sur la v6 sont prévus pour mieux comprendre les préférences esthétiques des utilisateurs. Tout ça devrait arriver très prochainement. A suivre…

48h Film Project IA

Samedi dernier, au Forum des images s'est tenue la projection (et la remise des Prix) de la première édition mondiale du 48 Hour Film Project IA.

Après en avoir réalisé la bande annonce il y a quelques mois, j'ai eu l'honneur d'interviewer les réalisatrices et réalisateurs des films en compétition.

Si je ne devais retenir qu'une seule chose de cette projection, ce serait son éclectisme total. Au delà de la différence de sujets et de traitement des court métrages, j'ai été frappé par la manière dont chaque équipe s'est approprié les outils d'IA.

Il y avait autant de films que d'approches techniques. Certains ont utilisé très peu d'outils IA, d'autres en ont utilisé une dizaine. Certains ont écrit à la main, d'autres ont sollicité chatGPT.

Quelques films mêlaient prise de vue réelle et images IA, d'autres s'apparentaient à des films d'animation 100% IA.

Merci à Olivier Dussausse de m'avoir embarqué dans cette aventure, aux membres du jury, les talentueux Laura Ghazal, Valentin Schmite et Guillaume Desjardins (réalisateur de l’excellente série “L’effondrement” sur canal +), à Runway pour avoir sponsorisé la compétition en offrant un accès illimité d'un mois à Gen-2 à tous les participants, ainsi qu'au Forum des Images pour les exceptionnelles conditions de projection.

Voici le film Lauréat de la compétition :

Les autres films sont visibles ici :
https://youtube.com/playlist?list=PLhaFbAfR1_mtT_SqqKtad5H_L8QJGKlFc&si=pZGzMZvv8kGrd3Kx

Et toi, tu fais quoi avec l’IA ?

Cette semaine, j’ai le grand plaisir d’interviewer l’une des artistes Midjourney les plus intéressantes de la toile, Tatiana Tsiguleva. En plus d’être l’une des meilleures expertes internationales du prompting Midjourney (et je pèse mes mots), Tatiana réalise des images exceptionnelles, et fait preuve d’une vraie générosité dans son partage de connaissances, tant sur son compte twitter que sur sa page Linkedin.

Bonjour Tatiana, pourrais-tu te présenter brièvement ?

Bonjour Gilles, je suis Tatiana, Directrice de Design et Conseillère de Startups. Pendant mon temps libre, j'explore les capacités des outils d'IA et travaille sur OffScreen.

Peux-tu nous en dire plus sur OffScreen ?

Bien sûr. Merci de poser la question. En novembre 2023, j'ai quitté mon emploi à temps plein pour me concentrer davantage sur ma famille et j'ai décidé de consacrer mon temps libre limité à un projet auquel je crois vraiment être important. C'est ainsi que j'ai commencé OffScreen.

À l'ère numérique d'aujourd'hui, les familles sont de plus en plus absorbées par les écrans, ce qui conduit à moins de temps de qualité ensemble. Ce temps passé devant l'écran est particulièrement impactant pour les enfants, affectant leur développement et leurs liens familiaux.

Ceci est particulièrement vital pour les enfants âgés de 1 à 3 ans, car c'est pendant cette période qu'ils devraient explorer et apprendre sur le monde physique et découvrir les capacités de leurs corps. OffScreen commence avec des livres éducatifs pour enfants et vise à évoluer vers un écosystème diversifié, comprenant des jeux de société, des ressources pour les parents et des outils de soutien familial pour favoriser un environnement intégré pour l'apprentissage et l'interaction familiaux.

J'ai de grandes ambitions pour ce projet, mais j’avance pas à pas. Je prévois de présenter le premier livre d'ici la fin de l'année.

Quel était ton parcours professionnel avant de fonder Offscreen ?

Mon parcours dans le monde de la technologie a commencé avec une formation en informatique et ingénierie. Cette formation et mes 4 années d'école d'art ont jeté les bases de ma transition vers le domaine du design. Au fil du temps, j'ai évolué en tant que Chef de Produit Design et leader d'équipes de design dans diverses startups, où j'ai combiné mes compétences techniques avec des pratiques de design créatif. En conséquence, mon expérience m'a conduit à mon rôle de membre fondateur et responsable du design chez Vial, une startup soutenue par des investisseurs de la Silicon Valley, où j'ai joué un rôle clé dans la constitution de l'équipe de design et l'établissement de nos processus de design.

Quand as-tu commencé ton parcours en IA générative, et comment cela s'est-il passé ?

Depuis fin 2022, je me suis plongée dans le monde de l'IA, principalement en m'engageant avec des outils tels que Midjourney, DALL·E, Runway et Pika Labs. Ma décision de partager ces découvertes sur les réseaux sociaux m'a conduit à approfondir et à effectuer des recherches quotidiennes. Depuis lors, j'ai maintenu un effort constant ; ainsi, depuis plus d'un an maintenant, j'explore quotidiennement les capacités de ces modèles.

Je me considère comme un utilisateur avancé de Midjourney, mais je dois admettre que j'apprends souvent de nouvelles choses grâce à tes publications. Comment produis-tu constamment un contenu aussi éclairant ? (As-tu une formation en photographie ?)

Juste beaucoup de pratique et des tonnes d'expériences. Je partage seulement environ 5% de ce que je teste réellement. Je suppose que beaucoup de designers aiment essayer la photographie, haha. J'ai appris quelques bases, mais c'est mon expérience à l'école d'art qui m'inspire le plus.

Je te considère comme l'une des meilleurs spécialistes de Midjourney au monde et je me demandais si tu utilises d'autres outils d'IA créatifs ? Si oui, quels sont tes outils d'IA favoris et pourquoi ?

Oh, merci pour tes gentils mots. J'adore Midjourney pour de nombreuses raisons. J'aime la mission de l'équipe de Midjourney et leur engagement pour la qualité plutôt que pour le battage médiatique.

Quant aux autres outils, oui, j'en utilise beaucoup :

Modèles d'image-to-video :
Runway : Excellente interface utilisateur, offrant beaucoup de flexibilité avec des fonctionnalités comme le motion brush.
Pika Labs : J'adore la façon dont le modèle anime les personnages.

Modèles de text-to-image :
Midjourney : Le meilleur en termes d'esthétique et de qualité.
DALL·E : Bon pour des illustrations simples.
Stable Diffusion : Je l'utilise rarement, mais j'apprécie sa flexibilité et l'option de former son propre modèle. J'aime aussi le principe de l'open source.

Améliorateurs d'image : Magnific AI : Le meilleur upscaler.

Topaz Video AI : Le meilleur upscaler de vidéos.

Text-to-speech
ElevenLabs : Le meilleur générateur de voix IA.

J'utilise aussi ChatGPT. Il m'aide à mener de nombreuses expériences en organisant les données de la manière dont je le demande.

par "le meilleur", je veux dire "le meilleur à mon avis" :)

Et pour les vidéos générées par IA ? Préfères tu Runway ou Pika ?

Je les adore tous les deux. Je participe à leur programme de partenaires créatifs (à la fois pour Pika et Runway), donc je teste beaucoup leurs produits.

En regardant vers l'année 2024, quels développements majeurs anticipes-tu dans l'utilisation de l'IA générative pour la création d'images ? Y a-t-il des avancées technologiques spécifiques que tu attends avec impatience ?

Je pense que nous nous approchons d'une avancée significative dans le domaine de la 3D, ce qui entraînera des améliorations remarquables dans la qualité des vidéos. À mesure que nous parviendrons à créer des scènes 3D de haute qualité, nous verrons un bond exponentiel dans l'apparence et la sensation des vidéos.

Merci Tatiana d’voir pris le temps de répondre à mes questions, j’ai hâte de suivre tes prochaines publications !

Cette édition est terminée, merci de l’avoir lue jusqu’ici ! Si elle vous a plu, vous pouvez la partager en cliquant juste ici :

Partagez Generative

Vous pouvez également me suivre sur LinkedIn et activer la cloche 🔔, je poste régulièrement sur l’intelligence artificielle générative. Vous pouvez également me contacter pour toute proposition de création, intervention, conférence, projet, formation liée à l’intelligence artificielle générative.

Et n’oubliez pas de vous abonner pour ne rien rater des prochaines éditions 👇

Generative