GPT-4o dominiert bereits die Charts der AI-Modelle
Sie sind zwar kontrovers und nicht wirklich offen, aber sie dominieren weiter ihr Feld: Nach dem Relaese von GPT-4o (das „o“ steht für omni) durch OpenAI vergangene Woche hat das AI-Modell bereits die Charts erklommen. Im mittlerweile berühmten und sehr wichtigen Chatbot Arena Leaderboard von Hugging Face liegt GPT-4o bereits auf Platz eins – und in Sachen Punktebewertung doch deutlich vor Gemini 1.5 Pro bzw. Flash von Google oder Claude 3 Opus vom Rivalen Anthropic.
GPT-4o ist mit 1.287 Punkten deutlich auf Platz 1, die Folgeplätze gehen an unterschiedliche Versionen von Google Gemini 1.5 Pro. Danach kommen die älteren Versionen von GPT-4, und dann schließlich erst Claude 3 Opus. Spannender Neuaufsteiger ist das chinesische Startup 01.AI mit seinem neuen Yi-Modell, das klar an Gewn von Alibaba vorbeigezogen ist. Mistral Large des französischen Startups Mistral AI hat es nicht einmal mehr unter die Top 20 geschafft. Meta bleibt mit seiner neuesten Schöpfung Llama 3 abgeschlagen.
Das Ranking betrifft nicht nur die Gesamtnote, sondern auch Unterkategorien. Auch bei Coding, längeren Eingaben oder Englisch ist GPT-4o von OpenAI derzeit ungeschlagen, lediglich in Chinesisch und Französisch ist Gemini 1.5 Pro von Google dem Marktführer überlegen. Bei der Chatbot Arena bewerten Menschen die Antworten von AI-Modellen.
Hier die aktuellen Top 20:
Rank* (UB)
|
Model
|
Arena Elo
|
95% CI
|
Votes
|
Organization
|
License
|
Knowledge Cutoff
|
---|---|---|---|---|---|---|---|
1
|
1287
|
+4/-4
|
26899
|
OpenAI
|
Proprietary
|
2023/10
|
|
2
|
1268
|
+5/-4
|
20181
|
Google
|
Proprietary
|
2023/11
|
|
2
|
1267
|
+4/-4
|
22132
|
Google
|
Proprietary
|
Online
|
|
4
|
1258
|
+3/-3
|
55731
|
Google
|
Proprietary
|
2023/11
|
|
4
|
1256
|
+3/-3
|
58147
|
OpenAI
|
Proprietary
|
2023/12
|
|
5
|
1252
|
+2/-3
|
78286
|
OpenAI
|
Proprietary
|
2023/4
|
|
6
|
1246
|
+3/-2
|
71547
|
OpenAI
|
Proprietary
|
2023/12
|
|
6
|
1248
|
+3/-3
|
118351
|
Anthropic
|
Proprietary
|
2023/8
|
|
9
|
1232
|
+4/-6
|
18317
|
Google
|
Proprietary
|
2023/11
|
|
9
|
1239
|
+3/-4
|
30787
|
01 AI
|
Proprietary
|
Unknown
|
|
11
|
1208
|
+3/-2
|
118874
|
Meta
|
Llama 3 Community
|
2023/12
|
|
11
|
1208
|
+7/-5
|
11853
|
Google
|
Proprietary
|
Online
|
|
12
|
1201
|
+4/-3
|
36612
|
Reka AI
|
Proprietary
|
Unknown
|
|
12
|
1201
|
+3/-2
|
92706
|
Anthropic
|
Proprietary
|
2023/8
|
GPT-5 wird bereits trainiert
GPT-4o ist klarerweise das Flaggschiffmodell von OpenAI und kommt bereits auch in der kostenlosen Basisversion von ChatGPT zum Einsatz. Dort ist es im Nutzungsumfang (Anzahl der Anfragen) aber beschränkt, wer 5x mehr Anfragen braucht, der greift zur kostenpflichtigen ChatGPT-Plus-Version. Nur dort ist dann auch die ziemlich schnelle Sprachausgabe enthalten, die bei der Präsentation so beeindruckte.
Wie lange GPT-4o das Flaggschiff bleiben wird, ist unklar. Diese Woche wurde bekannt, dass OpenAI mit dem Training von (wahrscheinlich) GPT-5 begonnen hat – dazu sicherte sich das Unternehmen im Vorfeld die Content-Rechte von großen Medienunternehmen wie Axel Springer, Le Monde, News Corp oder Associated Press – deren Artikel dürften wohl in das nächste AI-Modell einfließen.
Spannend werden folgende Dinge: Mistral AI und Anthropic werden wohl noch dieses Jahr ebenfalls neue AI-Modelle ins Rennen werfen, auch von Meta kommt die stärkste Version von Llama 3 noch auf den Markt. xAI von Elon Musk hat gerade erst satte 6 Milliarden Dollar eingenommen, auch dort wird sicher intensiv an einem GPT-4o-Rivalen gearbeitet.