OpenAI launcht o3 und o4-mini, fokussiert stärker auf KI-Agenten

Das Namens-Chaos bei OpenAI ist perfekt: OpenAI hat mit o3 und o4-mini eine neue Generation von KI-Modellen präsentiert, die einen signifikanten Fortschritt in der Entwicklung künstlicher Intelligenz markieren sollen. Die Modelle zeichnen sich besonders durch ihre verbesserte Fähigkeit aus, längere Denkprozesse zu durchlaufen, bevor sie Antworten generieren – wie die anderen KI-Modelle der o-Serie stellen sie die Reasoning-Fähigkeiten in den Mittelpunkt.
Mittelfristig will OpenAI seine o-Serie und seine GPT-Serie (zuletzt ersetzte dort verwirrenderweise 4.1 seinen Vorgänger 4.5) zusammenführen. Bei Anthropic gibt es bereits AI-Modelle, die alles unter einem Dach haben.
Agentenähnliche Funktionalitäten
Ein zentrales Merkmal der neuen Modelle ist ihre Fähigkeit, als Agenten zu agieren und sämtliche in ChatGPT verfügbaren Werkzeuge eigenständig zu kombinieren. Dazu gehören die Websuche, Analyse von Dateien mittels Python, Verarbeitung visueller Eingaben und Bildgenerierung. Die Modelle wurden darauf trainiert, selbstständig zu entscheiden, wann und wie sie diese Tools einsetzen, um innerhalb einer angemessenen Zeitspanne detaillierte Antworten zu liefern.
Verbesserte Leistungsfähigkeit
Die Kombination aus erweitertem Denkvermögen und umfassendem Werkzeugzugriff führt zu messbaren Leistungssteigerungen:
- o3 reduziert schwerwiegende Fehler um 20 Prozent im Vergleich zum Vorgängermodell o1 bei komplexen Aufgabenstellungen
- Besondere Verbesserungen zeigen sich in den Bereichen Programmierung, Unternehmensberatung und kreative Ideenfindung
- o4-mini, das kostengünstigere und kompaktere Modell, erreicht beachtliche Resultate in den Bereichen Mathematik, Programmierung und visuelle Aufgaben
Fortschritte in der visuellen Verarbeitung
Ein technologischer Durchbruch ist die Integration von Bildern direkt in den Denkprozess der Modelle. Sie können visuelle Informationen nicht nur wahrnehmen, sondern diese aktiv in ihre Argumentation einbeziehen. Dies ermöglicht die Interpretation von Whiteboards, Diagrammen oder Skizzen selbst bei suboptimaler Bildqualität. Mit den integrierten Werkzeugen können die Modelle Bilder während des Denkprozesses manipulieren und transformieren.
Bei der Entwicklung von o3 konnte OpenAI beobachten, dass verstärkendes Lernen (Reinforcement Learning) in großem Maßstab ähnlichen Skalierungseffekten unterliegt wie das GPT-Vortraining: Mehr Rechenleistung führt zu proportional besseren Ergebnissen. Die Modelle wurden nicht nur im Werkzeugeinsatz trainiert, sondern lernten durch Reinforcement Learning, wann der Einsatz dieser Werkzeuge sinnvoll ist.
Abzuwarten bleibt, wie gut o3 und o4-mini in unabhängigen Tests abschneiden – in der wichtigen Chatbot Arena sind die beiden neuen KI-Modelle noch nicht gerankt.