Comment les algorithmes génèrent-ils des images ?
Comment les algorithmes génèrent-ils des images ?
Commençons par les bases : comment un logiciel (ou un algorithme) peut-il créer des images complexes et hyperréalistes à partir d'instructions textuelles simples ? Ces dernières années, la fusion des nouvelles connaissances en IA avec les bases de données de plus en plus grandes disponibles, y compris les bases de données open-source (c'est-à-dire sans restrictions spécifiques pour les utilisateurs ordinaires), a conduit à la création de programmes capables d'accomplir des tâches auparavant impensables. Les fondements de ce processus reposent également sur la capacité des chercheurs à créer des algorithmes de plus en plus performants en matière d'apprentissage, d'adaptation aux nouvelles informations et de mise à jour efficace.

Image générée automatiquement avec Neutral Love en utilisant la commande "homme avec un drapeau de la paix et des cheveux rouges."
En réalité, ce type d'approche technologique est fortement basé sur le fonctionnement du cerveau humain, au point que cela repose sur ce qu'on appelle les "réseaux neuronaux", des interconnexions entre différents éléments capables de s'influencer mutuellement, créant ainsi des connaissances de plus en plus complètes. La conséquence logique de ce processus est que nous pourrions nous attendre, à l'avenir, à une croissance plus stable des logiciels de génération d'images, avec une importance croissante tant dans le débat public que dans la vie quotidienne de chaque individu.
Malgré la puissance évidente des nouveaux logiciels en ligne disponibles, beaucoup se demandent encore pourquoi ils devraient les utiliser. En d'autres termes, qui pourrait bénéficier de ces plateformes non seulement pour s'amuser, mais aussi pour en tirer un profit, peut-être d'ordre professionnel ? Les réponses varient :
- Les artistes et les illustrateurs : ceux qui sont impliqués dans le monde de l'art peuvent être vivement intéressés par l'incorporation d'une forme d'automatisation dans leurs œuvres, ne serait-ce que pour s'inspirer ou améliorer leur technique ;
- Les entreprises qui veulent se concentrer fortement sur des campagnes publicitaires percutantes, dynamiques et entièrement personnalisables. Il n'est pas surprenant que bon nombre des "fausses photos" récemment publiées dans le but de secouer l'opinion publique ressemblent au projet "UnHate" d'Oliviero Toscani lancé par Benetton à la fin de l'année 2011 ;
- Les étudiants et les enseignants qui souhaitent rendre l'expérience d'apprentissage (la leur ou celle des autres) plus divertissante, basée sur des stimuli visuels, peut-être en mettant en scène des événements historiques qui n'ont pas de représentations graphiques.

Image générée automatiquement avec Neutral Love en utilisant la commande "couronnement de Ramsès II."
Cependant, pour chacune de ces catégories, il existe des problèmes sous-jacents dont il faut être conscient afin d'utiliser les images générées artificiellement de manière véritablement consciente. En plus de ce qui a déjà été mentionné dans l'introduction, il est important de toujours rappeler d'étiqueter les créations fictives comme telles ; sinon, il y aurait un problème de crédibilité pour les professionnels et une confusion entre le contenu et l'imagination pour tous les autres utilisateurs.
MidJourney est probablement l'un des logiciels les plus connus pour la création automatique d'images, fournissant un système complexe qui combine différentes "bibliothèques" à partir desquelles les algorithmes tirent leurs informations. Les commandes à communiquer au programme sont des phrases simples ou des textes descriptifs, même très courts. Le programme est suffisamment sophistiqué pour compléter automatiquement le contexte de l'image. Pour des opérations plus complexes telles que l'agrandissement ou le changement de style, il est nécessaire de connaître des commandes de base légèrement plus complexes.

Image créée avec Mid Journey par Benj Edwads et publiée sur howtogeek.com.
Ce programme ne peut pas être utilisé sur les navigateurs traditionnels, mais il doit être lancé depuis la plateforme Discord, qui regroupe généralement les "communautés" Internet et offre un espace de rassemblement en ligne. De plus, MidJourney est gratuit seulement pendant une période limitée, après quoi un abonnement allant de 12 $ à environ 73 $ par mois, selon le temps passé sur la plateforme, est requis.
Stable Diffusion se vante de pouvoir créer des images "photo-réalistes" en combinant la créativité individuelle avec les différentes bases de données de la plateforme. Il peut être utilisé directement en ligne et donne vie aux créations grâce à des commandes positives (comme "pot décoré, vert et doré") et à des commandes négatives (comme "pas de blanc").

Image générée automatiquement avec Stable Diffusion en utilisant les commandes précédemment mentionnées à titre d'exemples.
Le niveau de précision peut varier, en particulier en fonction de la spécificité de la demande, mais la force de Stable Diffusion réside dans sa communauté active qui fournit de vastes bibliothèques d'images pré-créées sur divers sujets. De plus, la plateforme est particulièrement accessible grâce à sa nature gratuite et à l'absence de besoin de compétences préliminaires pour l'utiliser.
Dall-E 2 est un logiciel qui appartient à la même famille que le beaucoup plus célèbre ChatGPT. Extrêmement sophistiquées, les ressources de cette plateforme peuvent être utilisées directement en ligne grâce à une interface très intuitive qui offre aux utilisateurs une grande liberté créative. Malgré les nombreux avantages qu'elle offre, tels que l'existence d'un profil pouvant être partagé et utilisé à des fins professionnelles, il n'existe actuellement aucun plan gratuit permettant aux utilisateurs de générer des images souhaitées, même pour une période limitée. Il est nécessaire d'acheter des packages de 115 crédits pour réaliser les créations correspondantes, au prix de 15 $ par package.
Probablement l'outil le plus adaptable aux besoins individuels, Neutral Love est un logiciel qui peut être utilisé directement en ligne non seulement pour créer des images, mais aussi pour les améliorer. L'interface en ligne permet aux utilisateurs de naviguer facilement à travers différentes sections du site web, à la fois pour générer et s'inspirer des créations déjà mises à disposition par la communauté.

Image générée automatiquement avec Neutral Love en utilisant la commande "Voiture blanche conduite par une femme".
Les prix de la plateforme varient en fonction de la solution choisie par l'utilisateur : basés sur un système de crédits, ils vont de 10 $ à 500 $ par mois. Le coût relativement élevé pour ceux qui découvrent cette technologie est justifié par une série de fonctionnalités supplémentaires, telles que la possibilité de créer un avatar ou d'améliorer la vidéo et l'audio. Après avoir profité des fonctionnalités offertes par le plan gratuit (y compris la génération illimitée d'artifices artistiques), les utilisateurs peuvent ajuster leur investissement en fonction de leur utilisation prévue, qui peut aller du simple divertissement aux activités commerciales et professionnelles générales.