Ersatz

OpenAI schickt Dall-E in Pension, bringt verbesserte Bildgenerierung mit GPT-4o

Taucher in den Wolken, generiert mit GPT-4o. © Trending Topics via ChatGPT
Taucher in den Wolken, generiert mit GPT-4o. © Trending Topics via ChatGPT
Startup Interviewer: Gib uns dein erstes AI Interview Startup Interviewer: Gib uns dein erstes AI Interview

Eifrige Nutzer:innen von ChatGPT haben es schon bemerkt: Seit Dienstag Abend gibt es einen neuen Bildgenerator, der direkt in den berühmtesten KI-Chatbot der Welt integriert ist. Denn Macher OpenAI hat den bisherigen Bildgenerator Dall-E 3 in Pension geschickt und ihn durch die Bildfähigkeiten von GPT-4o ersetzt.

„Die GPT-4o-Bilderzeugung ist ein neuer, wesentlich leistungsfähigerer Ansatz zur Bilderzeugung als unsere früheren Modelle der DALL-E 3-Serie. Es kann fotorealistische Ausgaben erzeugen. Es kann Bilder als Input nehmen und sie transformieren. Es kann detaillierte Anweisungen befolgen, einschließlich der zuverlässigen Einbindung von Text in Bilder. Und da die 4o-Bilderzeugung nativ in die Architektur unseres omnimodalen GPT-4o-Modells eingebettet ist, kann sie alles, was sie weiß, nutzen, um diese Fähigkeiten auf subtile und ausdrucksstarke Weise anzuwenden und Bilder zu erzeugen, die nicht nur schön, sondern auch nützlich sind“, heißt es in einer Aussendung von OpenAI.

Dass nun GPT-4o zum Einsatz kommt, ist natürlich auch eine Reaktion auf die starke Konkurrenz im Bildbereich. Midjourney gilt vielen als der Quasi-Standard für KI-Bildgenerierung, aber auch bei Grok von Elon Musks xAI, Black Forest Labs (integriert bei Mistral AI) oder Googles Gemini gibt es bereits deutlich bessere Bildgenerierung als bei ChatGPT. Deswegen ist es kaum verwunderlich, dass die längst aus der Mode gekommenen Dall-E-3-Bilder in Pension geschickt werden (Dall-E gibt es weiter als GPT) werden und durch etwas Besseres ersetzt werden.

Hier die Vor- und Nachteile der neuen Bildergenerierung laut OpenAI:

Vorteile:

  1. Fotorealistische Qualität: GPT-4o erzeugt präzise, fotorealistische Bilder, integriert Text und Symbole nahtlos und ermöglicht komplexe Bild-zu-Bild-Transformationen.
  2. Multimodale Integration: Es verbindet Text- und Bildgenerierung durch native Einbettung in GPT-4o für kontextbewusste und intelligente Ergebnisse.
  3. Verbesserte Sicherheitsmaßnahmen: Mehrschichtige Mechanismen wie Prompt-Blocking und Output-Blocking schützen vor schädlichen Inhalten.
  4. Stärkere Diversität: Bessere Repräsentation von Geschlecht, Hautfarben und ethnischen Gruppen im Vergleich zu vorherigen Modellen.
  5. Transparenz und Nachverfolgbarkeit: Durch C2PA-Metadaten können Inhalte verifiziert und deren Herkunft geprüft werden.

Nachteile

  1. Missbrauchsmöglichkeiten: Die realistische Qualität bietet Potenzial für Deepfakes, nicht genehmigte Bildmanipulationen oder unerwünschte Anleitungen.
  2. Einschränkungen für Kreative: Verbot der Nachahmung von Künstlerstilen und strikte Regeln für Darstellungen von Minderjährigen schränken kreative Freiheiten ein.
  3. Bias-Problematik: Trotz Fortschritten existieren Verzerrungen in Bezug auf Geschlecht (männlich dominiert) und ethnische Vielfalt.
  4. Technische Limitationen: Klassifikatoren, etwa zur Erkennung Minderjähriger, können in Grenzfällen ungenau sein.
  5. Ethische Herausforderungen: Realistische Bilder können Vertrauen in Medien untergraben und gesellschaftliches Misstrauen fördern.
Werbung
Werbung

Specials unserer Partner

Die besten Artikel in unserem Netzwerk

Powered by Dieser Preis-Ticker beinhaltet Affiliate-Links zu Bitpanda.

Deep Dives

Startup & Scale-up Investment Tracker 2025

Die größten Finanzierungsrunden des Jahres im Überblick
#glaubandich CHALLENGE Hochformat.

#glaubandich CHALLENGE 2025

Österreichs größter Startup-Wettbewerb - 13 Top-Investoren mit an Bord
© Wiener Börse

IPO Spotlight

powered by Wiener Börse

Trending Topics Tech Talk

Der Podcast mit smarten Köpfen für smarte Köpfe
Die 2 Minuten 2 Millionen Investoren. © PULS 4 / Gerry Frank

2 Minuten 2 Millionen | Staffel 12

Die Startups - die Investoren - die Deals - die Hintergründe

BOLD Community

Podcast-Gespräche mit den BOLD Minds

IPO Success Stories

Der Weg an die Wiener Börse

Weiterlesen