Algorithmen

Midjourney, Dall-E & Imagen: Der unaufhaltsame Aufstieg der AI-Bilder

KI-Kunst als Wettbewerb-Sieger © Sincarnate on Discord
KI-Kunst als Wettbewerb-Sieger © Sincarnate on Discord
Startup Interviewer: Gib uns dein erstes AI Interview Startup Interviewer: Gib uns dein erstes AI Interview

Vor Kurzem gab es in der Kunstwelt einen Aufschrei, als bei einem Wettbewerb im US-Bundesstaat Colorado ein Werk zum Sieger gekürt wurde, das nicht von einem Menschen, sondern von einer Künstlichen Intelligenz erschaffen wurde. Eingereicht hat das Bild ein Mann namens Jason Allen in der Kategorie „Digital Arts/Digitally Manipulated Photography“, berichtet Heise. Das Bild „Théâtre D’opéra Spatial“ ist im Programm Midjourney entstanden. Derzeit gibt es noch keine Regeln bei dem Wettbewerb, laut denen KI-Kunst verboten ist. Auf Twitter ist daraufhin eine heftige Diskussion entstanden, manche sprachen sogar vom „Tod der Kunst“.

Doch der Aufstieg der KI-Kunst scheint unaufhaltbar zu sein. Neben Midjourney gibt es auch noch viele weitere Programme, mit denen User:innen schnell ein digitales Werk erstellen lassen können. Hierfür müssen sie in der Regel nur eine Textvorgabe liefern, den Rest macht der Algorithmus. Es handelt sich hierbei um Künstliche Intelligenzen, die anhand von Millionen von Bildern aus dem Internet trainiert wurden und so teilweise sehr beeindruckende, teils aber auch sehr seltsame Bilder liefern können. Viele davon sind in letzter Zeit zu populären Internet-Memes geworden. Wir beleuchten ein paar der beliebtesten Text-zu-Bild-Programme.

Startup-AI rechnet indische Akzente in US-amerikanische Stimmen um

Dall-E und Dall-E 2

Eines der bekanntesten Text-zu-Bild-Programme ist Dall-E. Das von OpenAI entwickelte Computerprogramm erstellt Bilder aus Texten und nutzt dafür künstliche neuronale Netzwerke. Dabei kann das Programm, Bilder in verschiedensten künstlerischen Stilrichtungen kreieren. Mit Dall-E 2 gibt es laut t3n schon eine neue Version des Programms, das eine höhere Auflösung, mehr Performance und realistischere Bilder verspricht. Dall-E ist eigentlich derzeit nur für Forscher:innen gedacht, doch es gibt auch die kostenlose Version DALL-E mini, die kürzlich in Craiyon umbenannt wurde. Diese Version hat dem Programm in den letzten Monaten zu großer Berühmtheit verholfen, vor allem aufgrund der seltsamen Memes, die darin entstanden sind.

Midjourney

Mit dem Programm Midjourney hat es Jason Allen geschafft, einen Kunstwettbewerb zu gewinnen, und so eine heftige Diskussion über den künstlerischen Wert von KI-Werken vom Zaun gebrochen. Midjourney ist in der Lage, futuristische Wohnarchitektur samt Bepflanzung zu schaffen. Das Programm funktioniert ähnlich wie Dall-E. Anhand von Textanweisungen erstellt der Algorithmus entsprechende Bilder. Aktuell befindet sich das Tool noch in der Open Beta. Midjourney verwendet ein Freemium-Geschäftsmodell mit einem begrenzten kostenlosen Kontingent und eine kostenpflichtige Variante, die schnelleren Zugriff, größere Kapazität und zusätzliche Funktionen bietet.

Imagen

Bei Imagen handelt es sich um den hauseigenen Bildgenerator von Google. Das Softwaretool setzt dabei laut Google auf „einen noch nie dagewesenen Grad an Fotorealismus und ein tiefes Sprachverständnis“. Die Bildgeneratoren seien demnach noch diverser und genauer als die der Konkurrenz. Derzeit befindet sich Imagen noch in der Entwicklungsphase, User:innen können das Programm noch nicht verwenden. Auf der Website zeigt Google lediglich erste Ergebnisse, die der Algorithmus vorzuweisen hat.

AI Greenscreen

Auch die Videoplattform Tiktok ist mittlerweile in das Rennen um die beste Text-zu-Bild-KI eingestiegen. Der neue Effekt AI Greenscreen ermöglicht es Nutzer:innen laut The Verge, einen Text einzugeben, den die Software dann als Bild generiert. Dieses Bild können sie dann als Hintergrund für ein Video verwenden. Im Vergleich zu Imagen, DALL-E 2 oder Midjourney sind die Bilder allerdings ziemlich einfach. Fotorealismus ist hier nicht das Ziel, AI Greenscreen erzeugt stattdessen abstrakte Bilder. Das soll allerdings besser zu den TikTok-Videos passen und außerdem explizite sexuelle oder gewalttätige Bilder vermeiden.

Stable Diffusion

Stable Diffusion geht den gleichen Weg wie die bereits genannten Tools und generiert aus Textbausteinen Bilder. Allerdings geht die KI noch einen Schritt weiter. Nutzer:innen können dem Tool skizzieren, wie das Endprodukt ungefähr aussehen soll, und Stable Diffusion orientiert sich daran. Ein weiterer Unterschied ist, dass Hersteller Stability AI das komplette Modell offengelegt hat. Somit haben alle Entwickler:innen die Möglichkeit, die KI für ihre eigenen Projekte zu verwenden.

Meta: KI-Tool „Builder Bot“ soll durch Sprachkommandos Metaverse-Welten erstellen

Debatte um künstlerischen Wert von KI-Bildern

Die Bilder, die aus diesen Programmen entstehen, werden zunehmend detailreicher und beeindruckender. Waren die Memes, die so zum Vorschein kamen, durchaus unterhaltsam, hat die Diskussion um die KI-Kunst nun auch sehr ernste Züge angenommen. Je näher die KI an die Werke von echten Menschen herankommen, desto schwieriger wird es für das ungeübte Auge, den Unterschied zu erkennen. So ist es auch möglich, dass solche Bilder bei Wettbewerben nicht nur teilnehmen, sondern auch gewinnen können.

Für viele ist das ein großes Problem, weil hinter den KI-Programmen kein wirklich kreativer Aufwand stehe. Denn die Machine Learning-Algorithmen von OpenAI und Co lernen bloß anhand von existierenden Bildern und erstellen dadurch ihre Bilder. Es lässt sich darüber streiten, inwiefern sich das von menschlicher Kunst, die ebenfalls Inspiration erfordert, unterscheidet. Die große Kontroverse liegt aber vielmehr in den möglichen Folgen für menschliche Kreative.

Viele Kritiker:innen befürchten, dass automatisierte Kunst den Lebenserhalt von Kreativen – die ohnehin häufig finanzielle Schwierigkeiten haben – gefährdet. Wenn außerdem nicht einmal kreative Jobs vor Maschinen sicher seien, dann liefen sogar hoch qualifizierte Jobs Gefahr, überflüssig zu werden. Allerdings ist es möglich, dass Wettbewerbe bald ihre Regeln anpassen und Midjourney und Co verbannen. Es muss sich außerdem noch zeigen, ob KI-Kunst je die „Seele“ der menschlichen Kunst und auch die gleiche Anerkennung erreichen wird.

Werbung
Werbung

Specials unserer Partner

Die besten Artikel in unserem Netzwerk

Deep Dives

#glaubandich CHALLENGE Hochformat.

#glaubandich CHALLENGE 2025

Österreichs größter Startup-Wettbewerb - 13 Top-Investoren mit an Bord
© Wiener Börse

IPO Spotlight

powered by Wiener Börse

Austrian Startup Investment Tracker

Die Finanzierungsrunden 2024

Trending Topics Tech Talk

Der Podcast mit smarten Köpfen für smarte Köpfe

2 Minuten 2 Millionen | Staffel 11

Die Startups - die Investoren - die Deals - die Hintergründe

The Top 101

Die besten Startups & Scale-ups Österreichs im großen Voting

BOLD Community

Podcast-Gespräche mit den BOLD Minds

IPO Success Stories

Der Weg an die Wiener Börse

Weiterlesen