Immer härterer Preiskampf der AI-Modelle
Weil eher fraglich ist, ob viele Millionen Endkonsument:innen dauerhaft monatliche Abogebühren für Chatbots bezahlen werden, haben sich Anbieter von AI-Modellen zunehmend darauf verlegt, ihre APIs für diese AI-Modelle im B2B-Geschäft zu optimieren. Damit sich Entwickler:innen, die diese APIs in ihre Apps und Web-Services integrieren, ist nicht nur die Qualität des Outputs entscheidend, sondern immer mehr die Preise.
OpenAI hat heute mit GPT-4o mini den kleinen Bruder seines neuesten und besten AI-Modells vorgestellt. Von dem weiß man eigentlich nicht viel, außer: Es ist um sehr kleines Geld verfügbar. Bis einige Ausnahmen unterbietet OpenAI seine größten Konkurrenten Anthropic, Google und Mistral AI beim Preis ziemlich deutlich. Gegenüber seinem Top-Modell GPT-4o kostet die Mini-Version lediglich 3% und nur etwa ein Viertel dessen, was OpenAi für das mittlerweile etwas veraltete GPT-3.5 Turbo, das schon älter als ein Jahr ist.
Hier der aktuelle Preisvergleich zwischen den Claude-Modellen von Anthropic, den Modellen von Mistral AI aus Paris den Gemini-Modellen von Google und schließlich den Modellen des deutschen Startups Aleph Alpha:
Input per Million Tokens | Output per Million Tokens | Context Window | |
OpenAI GPT-4o mini |
0,15 $ | 0,60 $ | 128K |
OpenAI GPT-4o |
5 $ | 15 $ | 128K |
OpenAI GPT-3.5 Turbo |
0,50 $ | 1,50 $ | 16K |
Anthropic Claude 3.5 Sonnet |
3 $ | 15 $ | 200K |
Anthropic Claude 3 Opus |
15 $ | 75 $ | 200K |
Anthropic Claude 3 Haiku |
0,25 $ | 1.25 $ | 200K |
Mistral AI Large |
4 $ | 12 $ | 32K |
Mistral AI Medium |
2,7 $ | 8,1 $ | 32K |
Mistral Mixtral 8x22B |
2 $ | 6 $ | 64K |
Mistral Mixtral 8x7B |
0,70 $ | 0,70 $ | 32K |
Google Gemini 1.5 Pro |
3,50 $
7 $ |
10,50 $
21 $ |
128K
> 128K |
Google Gemini 1.5 Flash |
0,35 $
0,70 $ |
1,05 $
2,10 $ |
128K
> 128K |
Google Gemini 1.0 Pro |
0,50 $ | 1,50 $ | n.a. |
Aleph Alpha Base Control |
7,50€ | n.a. | 2.048 |
Aleph Alpha Extended Control |
11,25€ | n.a. | 2.048 |
Aleph Alpha Supreme Control |
43,75€ | n.a. | 2.048 |
Top 3 Player unterbieten sich gegenseitig
Hier sieht man auch deutlich, wie schwierig es ist, für kleinere Anbieter mit den großen preislich mitzuhalten. Anthropic verlangt für sein Top-Modell „Claude 3 Opus“ das Dreifache wie OpenAI für sein Flaggschiff-Modell GPT-40, während sich Google mit seinem besten LLM in die Mitte der beiden AI-Startups gesetzt hat.
Zuletzt haben Anthropic mit Claude 3.5 Sonnet und Google mit Gemini 1.5 Flash preislich deutlich nach unten reduzierte Varianten ihrer Top-Modelle auf den Markt gebracht – klar mit dem Ziel, möglichst viele Developer weg von OpenAi zu locken.
Mistral AI aus Paris bleibt bei den Preisen deutlich unter jenen der Top-Modelle von Anthropic, Google und OpenAI, kann aber auch nicht mit denen mithalten, sondern ist im Ranking der wichtigen Chatbot Arena doch ein Stück weit hinter den Top 3 angesiedelt.
Und dann gibt es noch den Fall Aleph Alpha: Das deutsche Startup kann mit seinen Luminous-Modellen qualitativ (siehe auch Kontext-Fenster) nicht mithalten, hat aber beim Pricing sehr teure Modelle. Spannend dabei ist, dass die Pricing-Seite von Aleph Alpha auch offline genommen wurde, aber hier noch zu finden ist. Anzunehmen ist, das Aleph Alpha bald mit neuen Modellen und vor allem neuen Preisen auf den Markt gehen muss, um konkurrenzfähig zu bleiben.