LLMs

OpenAI o1 bereits bestes AI-Modell – vor Google und Anthropic

Jakob Steinschaden24. September 2024, 18:38

Startup Interviewer: Gib uns dein erstes AI Interview

Erst vor gut zehn Tagen in einer Preview veröffentlicht, und schon an der Spitze: OpenAIs neuestes AI-Modell ist trotz aller Kontroversen bereits an allen anderen LLMs vorbeigezogen und hat den ersten Platz der vielbeachteten Chatbot Arena Charts erobert – und zwar sowohl vor den anderen OpenAI-Modellen sowie vor den Hauptkonkurrenten Google, xAI und Anthropic.

In der Chatbot Arena bewerten Nutzer:innen die Outputs von LLMs, ohne sie zu kennen – und diese Wertungen werden dann zu einem Gesamtscore sowie zu Noten in einzelnen Kategorien wie Sprachen, Mathematik und Coding berechnet. OpenAI o1 liegt nunmehr bei 1335 Punkten und hat somit all anderen im Ranking befindlichen LLMs hinter sich gelassen.

Auch die kleinere Version OpenAI o1 mini, die mit verringerter Leistung und kleineren Preisen daherkommt, ist an nahezu allen anderen AI-Modellen vorbeigezogen – einzig Gemini 1,5 Pro von Google liegt noch etwas besser als die Mini-Version. Hier das aktuelle Ranking:

Mittlere Risikostufe für o1

OpenAI o1 ist Angaben des Anbieters zufolge imstande, Aufgaben auf dem Niveau eines Doktoranden zu lösen – und zwar, indem es für die Lösung Prozesse durchgeht, die dem menschlichen Nachdenken nachempfunden werden. Die Schritte zur Lösung kann das LLM dem Nutzer anzeigen. Aktuell können es bereits zahlende ChatGPT-Abonnent:innen verwenden.

Kontrovers ist OpenAI o1, weil es vom Hersteller bereits als mittleres Risiko eingestuft wurde. Es können von Expert:innen als Hilfestellung dazu genutzt werden, um biologische Waffen herzustellen. „Wir sind uns bewusst, dass diese neuen Fähigkeiten die Grundlage für gefährliche Anwendungen bilden könnten“, heißt es seitens OpenAI. Noch aber sind keine Verbote für das LLM bekannt geworden, auch wenn es sich Behörden sicher sehr genau ansehen.

Konkurrenz muss nachziehen

OpenAI, das vor einer massiven Finanzierungsrunde von 6,5 Milliarden Dollar steht, hat dem Mitbewerb einiges vorgelegt. Vor allem Google, das aktuell bei Gemini 1.5 steht, und Anthropic, das zuletzt Claude 3.5 veröffentlichte, sind gefordert, nachzulegen. Zuletzt hat auch Grok von xAI, das Elon Musk mitgründete, das Ranking aufgemischt und kam locker in die Top 10. Weiter abgeschlagen sind bereits Llama 3.1 von Meta sowie die AI-Modelle von Mistral AI aus Frankreich.