Stability AI: Neuer Bildgenerator kann endlich realistische Hände zeichnen
AI-Modellen kann man derzeit beim Lernen nur so Zuschauen, aber im Zeitraffer. Nun hat Stability AI, das mit Runway und der CompVis Group der Ludwig Maximilian Universität in München berühmterweise Stable Diffusion veröffentlicht hat, eine neue Version des Text-zu-Bild-Generators veröffentlicht. „SDXL 0.9“ ist vorerst zu Forschungszwecken am Markt erhältlich und soll den Macher:innen zufolge „hyperrealistische Kreationen für Filme, Fernsehen, Musik und Lehrvideos erzeugen“ und damit zu den Vorreitern von KI-Bildern gehören.
SDXL 0.9 soll dabei nicht nur Text-Prompts verstehen, sondern auch das das Prompting von Bild zu Bild (Eingabe eines Bildes, um Variationen dieses Bildes zu erhalten), Inpainting (Rekonstruktion fehlender Teile eines Bildes) und Outpainting (Konstruktion einer nahtlosen Erweiterung eines bestehenden Bildes) erlauben. Ebenfalls bemerkenswert: Das Modell hat 6,6 Milliarden Parameter und gehört damit zu den größten seiner Klasse, trotzdem soll man es auf einer modernen Konsumenten-GPU laufen lassen können.
Für das KI-Bildmodell braucht es nur Windows 10 oder 11 oder ein Linux-Betriebssystem mit 16 GB RAM und eine Nvidia GeForce RTX 20-Grafikkarte (gleichwertiger oder höherer Standard) mit mindestens 8 GB VRAM. Linux-Nutzer können auch eine kompatible AMD-Karte mit 16 GB VRAM verwenden. Die Vollversion SDXL 1.0 soll dann Mitte Juli kommen.
AI Spendings werden sich von 2023 bis 2026 auf 300 Mrd. Dollar verdoppeln
Kontroverse AI-Modelle
Eine Besonderheit, die von Stability AI aber herausgestrichen wird: Das AI-Modell kann endlich auch realistische menschliche Hände zeichnen. Bisher sind viele Bildgeneratoren genau daran gescheitert und haben in der Vergangenheit oft Hände mit zu vielen oder zu wenigen Fingern kreiert. Das soll nun besser gehen, auch wenn die von Stability AI gezeigten Beispiele teilweise auch nicht unbedingt das Prädikat „hyperrealistisch“ verdienen. Aber man sieht jedenfalls, dass die AI schon sehr annehmbare Resultate zustande bringt.
Wie erwähnt, ist SDXL 0.9 vorerst nur zu Forschungszwecken einsetzbar und eingeschränkt zugänglich. Nutzer:innen der Clickdrop-App von Stability AI sowie Stability AI API- und DreamStudio-Kund:innen bekommen Zugriff, sowie soll es ab Montag, dem 26. Juni auch die Möglichkeit geben, via Github und Hugging Face an den Code zu kommen. Voraussetzung aber ist, dass es nicht für kommerzielle Zwecke eingesetzt wird.
Stability AI rund um CEO Emad Mostaque hat den Hauptsitz in London und bisher etwa 100 Mio. Dollar von namhaften Investoren wie Coatue, Lightspeed Venture Partners und O’Shaughnessy Ventures erhalten. Es steckt auch hinter dem durchaus kontroversen Stable-Diffusion-Modell, das dem Startup Klagen von Künstler:innen sowie von Getty Images einbrachte. Diese werfen dem britischen Startup vor, die KI-Modelle mit kopiergeschützten Inhalten trainiert zu haben und damit Urheberrechtsverletzungen begangen zu haben. Mit StableLM entwickelt Stability AI auch ein großes Sprachmodell.
Midjourney, Dall-E & Imagen: Der unaufhaltsame Aufstieg der AI-Bilder