Nouvelle année, nouveaux outils ?
Salut les connectés, les augmentés, les enthousiastes, les réfractaires et les terrorisés. Bienvenue dans la 45e édition de GENERATIVE, la newsletter qui parle d'IA générative sous l’angle de la créativité.
Cette semaine a été intense pour moi, avec de nombreux projets IA, tant en création qu’en acculturation et formation en entreprises, au point où le temps m’a manqué pour pouvoir publier vendredi, comme j’en ai pris l’habitude. Qu’à cela ne tienne, voici le contenu de l’édition :
✔️ Les news de la semaine
✔️ Le GPT Store est arrivé, on analyse ensemble
✔️ Les nouveautés image/video 2024
Les news de la semaine
Vegas Baby
L’événement tech de la semaine était le CES de Las Vegas, qui a dévoilé pas mal d’annonces sur le front de l’IA. En voici un tour d’horizon sélectif :
Rabbit lance le r1, un dispositif mobile IA autonome. Présenté par le PDG Jesse Lyu, le r1 intègre un écran tactile, un bouton de dialogue, une caméra rotative, Bluetooth, Wifi et un emplacement pour carte SIM. Il peut répondre à des questions, interagir avec des applications comme Spotify et Uber, et exécuter des tâches complexes qui nécessitent habituellement plusieurs applications, comme planifier et réserver un voyage. Sa caméra, équipée de vision par ordinateur, offre des fonctionnalités sympathiques comme générer des recettes à partir des contenus du réfrigérateur. Vendu à 199 dollars, le r1 est disponible en précommande, sans abonnement requis.
Plaud, un magnétophone IA motorisé par chatGPT
DIalogue Trainer lance la première plateforme de simulation en ligne pour la formation aux compétences relationnelles (Soft Skills) avec des personnages virtuels.
La startup espagnole Hechicer IA lance Current Anima, un outil de génération de storyboard 3D motorisé par l’IA
”Alexa, passe la seconde !”
BMW, en collaboration avec Amazon, a annoncé l'intégration d'Alexa assistée par l'IA dans ses voitures. Ce partenariat permettra d'avoir un assistant vocal amélioré, capable de répondre aux questions sur le véhicule et d'effectuer des actions comme l'activation d'un mode de conduite ou le réglage du chauffage. BMW mise sur cette technologie pour simplifier l'utilisation des véhicules et minimiser les distractions au volant. De leur côté, Volskwagen et Skoda ont annoncé l’arrivée de chatGPT dans leurs prochains véhicules.
Acting Virtuel
Meta a développé un algorithme d'IA qui modélise automatiquement les acteurs à partir de données réelles de conversations et d'interactions face à la caméra. Cette technologie permet de synchroniser les lèvres et de reproduire les mouvements des acteurs simplement à partir d'un fichier audio. Cette avancée ouvre des nouvelles possibilités dans le domaine de la création cinématographique et des médias, en permettant la production de contenu avec des acteurs virtuels générés par IA.
Ce que j’espère ici, c’est que type de technologie ne mette pas un terme à l’art dramatique. Dans un monde de contenus 100% AI generated, y aura t-il toujours de places pour les comédiens ?
AI for Cinema
La startup Suisse Largo.ai a dévoilé des solutions IA qui ciblent les sociétés de production de films et séries.
L’outil permettrait d’analysez contenu et audience à partir d'un scénario, d’établir une cartographie dynamique des genres du scénario, de comparer les motifs avec plus de 60 000 autres films, de prédire l'adéquation par âge, scène par scène, et démographie de l'audience potentielle, d’établir un descriptif visuel des personnages à partir du scénario, de comparer des acteurs/actrices potentiels en termes de tendances d'audience et de retours sur investissement, ou encore de faire des prévisions financières pour le box-office et le streaming à l’international.
Bonjour, c’est pour une commande
VoxAI introduit une solution de commande vocale destinée aux drive-in. Conçue pour alléger la charge de travail des employés des fast-foods, cette technologie promet une augmentation significative de l'efficacité. Avec plus de 200 000 drive-ins aux États-Unis, VoxAI estime une hausse potentielle des revenus de 17%.
Prompt-to-3D
Artflow est une plateforme pour créer des contenus visuels utilisant Stable Diffusion et la technologie CLIP d'OpenAI . Elle permet de générer des images et vidéos avec des personnages constants. Le Character Builder aide à concevoir des personnages 3D à partir de descriptions textuelles. Il est aussi possible de créer des images du personnage dans différents contextes, en changeant l'angle de caméra ou la posture. De plus, la fonctionnalité Video Studio peut animer les personnages avec mouvements de caméra et synchronisation labiale.
ARTFLOW
Midjourney et le (non) respect de la propriété intellectuelle
Midjourney se trouve actuellement au cœur d'une controverse suite à la fuite d'informations révélant le plagiat présumé de 16 000 artistes. Cette situation entretient le débat nécessaire sur les droits d'auteur dans le domaine de l'IA générative. Plusieurs artistes ont déjà porté plainte, pour utilisation non consentie de leurs œuvres.
Allez, circulez !
La startup française SequoIA Analytics, basée à Sophia-Antipolis, a mis au point un logiciel d’IA pour prévenir et fluidifier les bouchons routiers. Ce dispositif utilise la technologie DAS, avec un boîtier relié à des câbles optiques le long des routes, pour analyser en temps réel l'état du trafic via les vibrations des véhicules. Plus efficace que les systèmes de vidéosurveillance et les applications de circulation, cet outil a déjà été testé avec succès à Nice, et pourrait s'avérer utile pour les grandes agglomérations confrontées aux embouteillages.
L’IA menace les métiers de la traduction
Duolingo, célèbre application d'apprentissage de langues, a récemment réduit de 10 % son effectif de traducteurs contractuels, en lien avec l'intégration de l'IA générative dans ses services. Cette décision, confirmée par un porte-parole de l'entreprise, reflète l'impact croissant de l'automatisation dans le marché du travail. Les traducteurs restants se concentrent désormais sur la vérification des erreurs dans les textes générés par l'IA, réduisant leur travail à une forme de contrôle qualité pour l'intelligence artificielle.
La news SF de la semaine
Des chercheurs de l’Institut national des sciences de l'Univers du CNRS ont mis au point un algorithme d’intelligence artificielle nommé "PhySO". Il serait capable de produire des modèles physiques analytiques à partir de données scientifiques brutes et pourrait aider à modéliser les lois régissant notre Univers, y compris celles que nous ne connaissons pas encore…
Le GPT Store est arrivé !
OpenAI, l'entreprise à l'origine de chatGPT, a annoncé le lancement imminent d'une nouvelle plateforme nommée "GPT Store". Selon les informations communiquées par la société, ce GPT Store sera une sorte d'"App Store" destinée à vendre des agents IA personnalisés créés par les utilisateurs, appelés "GPTs".
Le store est réservé aux abonnés payants chatGPT Plus à 24€/mois.
Rappel : qu'est-ce qu'un GPT ?
Un GPT est en quelque sorte un "mini chatGPT" que chacun peut créer facilement, sans compétences techniques particulières. Chacun pourra créer un assistant virtuel dédié à un domaine précis : fitness, coding, génération d'images, tutorat en ligne, etc. Les possibilités sont infinies !
Comment créer son propre GPT ?
La création d'un GPT sera à la portée de tous (oui même toi qui doute) Il suffira de se connecter sur le site chat.openai.com et de cliquer sur "Create GPT" dans votre profil.
Vous devrez alors donner un nom à votre GPT, ajouter une description, rédiger des instructions détaillées sur la manière dont vous souhaitez qu'il interagisse, et éventuellement lui fournir des connaissances supplémentaires sous forme de fichiers PDF ou ebooks. Une fois ces quelques étapes effectuées, votre GPT est prêt ! Vous pouvez le tester directement et voir s'il répond correctement aux requêtes.
J’attire votre attention sur le fait que s’il est facile et rapide de créer un GPT, concevoir un GPT performant, bien conçu ,qui apporte réellement de la valeur et se démarque de la concurrence est une autre paire de manches.
Des revenus grâce aux GPT ?
L'annonce la plus enthousiasmante pour les amateurs de side businesses et de revenus complémentaires concerne probablement les possibilités de monétisation offertes par le GPT Store. D'après les rumeurs, OpenAI prévoit deux modèles économiques :
Le revenue sharing : à chaque utilisation d'un GPT, son créateur recevra un pourcentage des revenus générés pour OpenAI. Plus le GPT est populaire, plus son concepteur empochera d'argent.
La mise en place d'un paywall : possibilité de facturer l'accès à son GPT (2, 3 ou 4€ par exemple).
Quoi qu'il en soit, publier un GPT à succès sur cette plateforme sera l'assurance de revenus complémentaires plus ou moins conséquents. Une opportunité en or pour celles et ceux qui ont de bonnes idées d'assistants IA !
Les conditions pour être accepté sur le GPT Store
OpenAI explique que pour figurer sur sa plateforme, quelques règles sont à respecter :
Se conformer aux conditions d'utilisation : pas d'activités illégales ou contraires à l'éthique
Respecter les brand guidelines : ne pas utiliser certains termes comme "créé par OpenAI", mentionner "propulsé par OpenAI"
Ne pas inclure le mot "GPT" dans le nom de son agent IA
Si vous remplissez ces critères, votre candidature au GPT Store a de très grandes chances d'être acceptée ! Vous pourrez alors profiter de cette incroyable vitrine et faire connaître votre création au plus grand nombre.
Alors Champagne ?
Pas tout à fait, jeune entrepreneur.e. Et ceci pour deux raisons :
Depuis deux mois qu’OpenAi a commencé à communiquer sur le GPTStore, il y a déjà pas moins de 3 millions (!) de GPTS créés par les utilisateurs et potentiellement prêts à inonder le marché. De plus, on peut s’attendre à un FOMO (Fear Of Missing Out) à grande échelle de la part de développeurs en herbe qui y voient une opportunité business comparable au lancement de l’AppStore, en juillet 2008.
Un programme de revenus GPT Builder sera lancé au cours du 1ere trimestre. Les créateurs de GPTs seront rémunérés en fonction de l'engagement des utilisateurs avec leur(s) GPT(s) MAIS ne concernera que les utilisateurs américains dans un 1er temps.
Le GPT Store, futur concurrent de l'App Store ?
Le GPT Store s'annonce clairement comme l’un des Hot Topics de ces prochains mois dans l'univers de l'intelligence artificielle générative. Comme pour l’App Store, seules les meilleurs GPTs sortiront du lot. Vous avez deux options ici :
1. Wait and see
2. A vos idées de GPTs, et rendez-vous sur le store pour les concrétiser !
Quelques nouveautés images/vidéo IA de 2024
ASSISTIVE
L’une des vraies découvertes de ce début d’année, c’est Assistive, un générateur de vidéos surprenant et étrangement confidentiel. Son interface est claire avec un champ de saisie, quelques options de réglages et le best of du feed de la communauté
On peut régler le niveau de conformité au prompt de référence
Ainsi que 3 niveaux de mouvements à l’image
Et la bonne surprise, c’est la qualité des vidéos en sortie, tant en image-to-video qu’en prompt-to-video :
La plateforme propose 2 formules d’abonnement plutôt accessible par rapport à la concurrence , à 12,99$ et 18,99$ par mois. Une 3e formule à 29,99$ arrive bientôt.
MAGNIFIC AI
L’incontournable upscaler Magnific AI a connu récemment un update majeur avec l’apparition d’un upscaling x16 au lieu des x2 auxquels nous nous étions habitués.
Ça permet de faire des trucs assez cools, regardez :
(Source Doganuraldesign)
En outre, MagnificAi propose désormais un curseur de “Fractality” qui permet de “contrôler la complexité par pixel carré” et le niveau de prise en compte du prompt dans le résultat final. Avec 2 niveaux :
Fractalité Faible : moins de détails, moins d’hallucinations.
Fractalité Élevée : accentue les détails dans des petites zones. Par exemple, avec "Une photographie de rose", une valeur élevée peut créer des mini-roses dans la rose principale, produisant des détails fins à des résolutions élevées.
A 39$ par mois, Magnific AI n’est clairement pas donné et vise clairement les professionnels de l’image. Il n’en reste pas moins l’un de mes outils préférés, tant sa valeur ajoutée est forte, notamment sur tous les visuels Midjourney v5, Leonardo ou Stable Diffusion XL qui toquent à la porte du photoréalisme. MagnificAI leur ouvre la porte et les fait rentrer de manière toujours spectaculaire, c’est assez stimulant.
LEONARDO UPSCALE & MOTION
Celle-ci date de fin 2023 mais mérite sa place ici : il s’agit du dernier update de leonardo.ai, qui ajoute deux fonctionnalités clé à son interface :
De l’upscaling
Un mode vidéo
UPSCALING
il existe pas moins de 3 types d’upscaling : Smooth, Crisp et Alchemy.
L’Alchemy fonctionne avec 3 niveaux de “Refiner Strength” qui, un peu à la manière du curseur de “Creativity” de MagnificAI paramètre le degré “d’hallucination” (et donc de créativité) du modèle lors de l’upscaling.
Essayons ça tout de suite :
Prompt : Photograph of a giant whale gliding in the distant sky above the beijing ,a asian young woman looking up, shocking and beautiful, dusk, fantasy, back view
Leonardo Vision XL
Si le Diable se cache dans les détails, regardez bien les deux images agrandies pour en apprécier toutes les différences.
VIDEO
Le mode vidéo de Leonardo se nomme “image2motion” et donne des résultats assez aléatoires. Tantôt on obtient des photos statiques avec une partie animées :
Tantôt des éléments en mouvement (avec un peu de warping il est vrai)
Quelquefois on obtient un petit travelling assez cool :
Bref tout cela est très amusant mais surtout très exploratoire. On attend une v2 avec davantage de contrôle sur le résultat, même si l’expression “contrôle sur le résultat” se heurte généralement aux lois du hasard lorsqu’il s’agit de demander à l’IA de générer de la vidéo (Oui Runway Gen-2, c’est essentiellement à toi que je m’adresse).
Leonardo se repositionne comme un outsider de choix à Midjourney, avec une interface plus accessible et quelques fonctionnalités supplémentaires qui méritent largement le détour.
PIKA 1.0
Une bonne nouvelle pour finir Pika a pris en compte les retours des utilisateurs et modifié ses plans d'abonnement. Désormais, avec un compte gratuit, vous obtenez 30 crédits par jour.
Après la déception des premiers essais, je ne désespère pas de cracker Pika 1.0, qui se révèle très étonnant en prompt-to-video, avec un style visuel d’animation.
Cette édition est terminée, merci de l’avoir lue jusqu’ici ! Si elle vous a plu, vous pouvez la partager en cliquant juste ici :
Vous pouvez également me suivre sur LinkedIn et activer la cloche 🔔, je poste régulièrement sur l’intelligence artificielle générative. Vous pouvez également me contacter pour toute proposition de création, intervention, conférence, projet, formation liée à l’intelligence artificielle générative.
Et n’oubliez pas de vous abonner pour ne rien rater des prochaines éditions 👇