Wie funktioniert die automatische Bildgenerierung?
Wie funktioniert die automatische Bildgenerierung?
Lassen Sie uns bei den Grundlagen beginnen: Wie ist es möglich, dass eine Software (oder ein Algorithmus) komplexe und hyperrealistische Bilder aus einfachen Textanweisungen erstellen kann? In den letzten Jahren hat die Kombination neuer Erkenntnisse in der KI (künstliche Intelligenz) mit immer größer werdenden, auch für gewöhnliche Benutzer verfügbaren Datenbanken, zu Programmen geführt, die bisher undenkbar erscheinende Aufgaben ausführen können. Die Grundlage dieses Prozesses beruht auch auf der Fähigkeit der Forscher, immer bessere Lernalgorithmen zu entwickeln, die sich an neue Informationen anpassen und sich autonom aktualisieren können.

Bild automatisch generiert mit Neutral Love mit dem Befehl "Mann mit Friedensflagge und roten Haaren".
Tatsächlich basieren solche technologischen Ansätze stark auf der Funktionsweise des menschlichen Gehirns, sodass sie auf sogenannten "neuronalen Netzwerken" beruhen, d. h. Verbindungen zwischen verschiedenen Elementen, die sich gegenseitig beeinflussen und so ein immer umfassenderes Wissen schaffen können. Die logische Konsequenz dieses Prozesses ist, dass in Zukunft ein immer stabileres Wachstum von Bildgenerierungssoftware erwartet werden kann, die sowohl in öffentlichen Debatten als auch im täglichen Leben jedes Einzelnen eine größere Bedeutung erlangen wird.
Die Verwendungsmöglichkeiten und Probleme bei der automatischen Bildgenerierung
Obwohl die Leistungsfähigkeit der neuen online verfügbaren Software offensichtlich ist, ist vielen immer noch unklar, warum sie genutzt werden sollte. Mit anderen Worten: Wer könnte diese Plattformen nicht nur zum Spaß nutzen, sondern auch einen möglichen beruflichen Nutzen daraus ziehen? Die Antworten sind vielfältig:
- Künstler und Illustratoren: Personen, die mit der Kunstwelt zu tun haben, könnten stark daran interessiert sein, Automatisierung in ihre Werke einzuführen - sei es nur zur Inspiration oder zur Verbesserung ihrer Technik;
- Unternehmen, die eine wirkungsvolle, dynamische und vollständig anpassbare Werbekampagne anstreben. Nicht umsonst basieren viele der kürzlich veröffentlichten "gefälschten Aufnahmen", die die öffentliche Meinung erschüttern sollen, auf dem Projekt "UnHate" von Oliviero Toscani, das Ende 2011 von Benetton gestartet wurde;
- Studenten und Lehrer, die das Lernen (ihr eigenes oder das anderer) unterhaltsamer gestalten möchten, indem sie visuelle Reize einsetzen, vielleicht durch Inszenierung von historischen Ereignissen, für die es keine grafischen Darstellungen gibt.

Bild automatisch generiert mit Neutral Love mit dem Befehl "Krönung von Ramses II".
Für jede dieser Kategorien gibt es jedoch ebenso viele Hintergrundprobleme, über die man sich bewusst sein muss, um die künstlich generierten Bilder verantwortungsbewusst zu nutzen. Neben dem bereits in der Einleitung erwähnten Aspekt muss beispielsweise immer daran erinnert werden, dass fiktive Kreationen als solche gekennzeichnet werden müssen; andernfalls entstünde ein Glaubwürdigkeitsproblem für Fachleute und eine Verwirrung zwischen Inhalt und Vorstellungskraft für alle anderen Benutzer.
Die wichtigsten Plattformen für die automatische Bildgenerierung
MidJourney
MidJourney ist wahrscheinlich eine der bekanntesten Softwarelösungen für die automatische Bildgenerierung. Sie bietet ein komplexes System, das verschiedene "Bibliotheken" nutzt, aus denen die Algorithmen ihre Informationen beziehen. Die Befehle, die an das Programm übermittelt werden, sind einfache Sätze oder Beschreibungstexte, auch sehr kurze. Das Programm ist so ausgefeilt, dass es den Kontext des Bildes autonom vervollständigen kann. Für komplexere Operationen (wie Vergrößerung oder Stiländerung) sind etwas komplexere Grundbefehle erforderlich.

Bild erstellt mit Mid Journey von Benj Edwads und veröffentlicht auf howtogeek.com.
Dieses Programm kann nicht in normalen Browsern verwendet werden, sondern muss von der Discord-Plattform aus gestartet werden, die in der Regel Internet-"Communities" zusammenführt und einen Raum für Online-Aggregation bietet. Darüber hinaus ist MidJourney nur für einen begrenzten Zeitraum kostenlos, gefolgt von einem Abonnement, das je nach Nutzungsdauer auf der Plattform zwischen 12 $ und etwa 73 $ pro Monat liegt.
Stabile Diffusion
Stabile Diffusion bietet die Möglichkeit, "fotorealistische Bilder" zu erstellen, indem die Kreativität des Einzelnen mit den verschiedenen Datenbanken der Plattform kombiniert wird. Es kann direkt über das Internet verwendet werden und lässt Kreationen sowohl durch positive Befehle (wie "dekorierte Vase, grün und gold") als auch durch negative Befehle (wie "kein Weiß") entstehen.

Bild automatisch mit Stable Diffusion generiert, anhand der oben genannten Beispiele.
Obwohl das Maß an Genauigkeit hauptsächlich von der Spezifität der Anfrage abhängt, ist eine Stärke von Stable Diffusion eine aktive Community, die ganze Bibliotheken von bereits erstellten Bildern zu verschiedenen Themen zur Verfügung stellt. Darüber hinaus ist die Plattform aufgrund ihrer Kostenlosigkeit und der Abwesenheit der Notwendigkeit von vorherigen Fähigkeiten besonders zugänglich.
Dall-E 2
Dall-E 2 ist eine Software, die zur gleichen Familie wie das weitaus bekanntere ChatGPT gehört. Die Ressourcen dieser Plattform können über eine sehr benutzerfreundliche und intuitive Online-Schnittstelle genutzt werden. Obwohl es viele Vorteile gibt, wie z.B. die Möglichkeit, ein Profil zu erstellen, das auch geteilt und somit für professionelle Zwecke verwendet werden kann, gibt es derzeit keinen kostenlosen Plan, der es ermöglicht, die gewünschten Bilder zu generieren - auch nicht für einen begrenzten Zeitraum. Es ist erforderlich, Pakete mit 115 Credits zu kaufen, um entsprechende Kreationen durchführen zu können - zum Preis von 15 $ pro Paket.
Neutral Love
Das Tool, das wahrscheinlich am besten auf die Bedürfnisse des Einzelnen zugeschnitten ist, ist Neutral Love, eine Software, die nicht nur zur Erstellung von Bildern, sondern auch zur Verbesserung bereits vorhandener Bilder direkt online verwendet werden kann. Die Online-Benutzeroberfläche ermöglicht es Ihnen, sich problemlos zwischen den verschiedenen Abschnitten der Website zu bewegen, um sowohl Kreationen zu generieren als auch sich von der Community bereitgestellte Kreationen inspirieren zu lassen.

Bild automatisch mit Neutral Love generiert anhand des Befehls "Weißes Auto, von einer Frau gefahren".
Die Preise der Plattform sind je nach gewählter Lösung unterschiedlich: Auf Grundlage eines Credit-Systems variieren sie zwischen 10 und 500 $ pro Monat. Der relativ hohe Preis für diejenigen, die mit dieser Technologie noch nicht vertraut sind, wird durch eine Reihe von Zusatzleistungen gerechtfertigt, wie z.B. die Möglichkeit, einen Avatar zu erstellen oder auch Videos und Audio zu verbessern. Nachdem die Funktionen des kostenlosen Plans genutzt wurden (einschließlich der unbegrenzten Generierung künstlerischer Kunstwerke), können Sie Ihre Investition entsprechend Ihren beabsichtigten Verwendungszwecken abstimmen, die von einfacher Unterhaltung bis hin zu geschäftlichen und professionellen Zwecken reichen können.