Launch

Google Gemini 2.5 Flash: Starkes neues KI-Modell mit niedrigen Preisen

Jakob Steinschaden18. April 2025, 07:56

Google Gemini am Smartphone. © Google / Canva Pro

Startup Interviewer: Gib uns dein erstes AI Interview

Google hat eine frühe Version von Gemini 2.5 Flash als Preview über die Gemini API in Google AI Studio und Vertex AI veröffentlicht. Das neue Modell baut auf dem Vorgänger 2.0 Flash auf und bringt laut Hersteller deutliche Verbesserungen bei den Reasoning-Fähigkeiten, behält dabei jedoch den Fokus auf Geschwindigkeit und Kosteneffizienz bei. Gemini 2.5 Flash ist die günstige Schwester des Top-Modells Gemini 2.5 Pro, das derzeit als das beste aller AI-Modelle gilt.

Die wichtigste Neuerung von Gemini 2.5 Flash ist die Einführung eines vollständig hybriden Reasoning-Ansatzes. Entwickler können nun den „Denkprozess“ des Modells aktivieren oder deaktivieren. Bei aktiviertem Denken analysiert das Modell zunächst den Prompt, zerlegt komplexe Aufgaben und plant seine Antwort, bevor es mit der eigentlichen Textgenerierung beginnt. Dieses Vorgehen verbessert laut Google die Qualität bei komplexen Aufgaben wie mathematischen Problemen oder Forschungsfragen.

Einstellbare „Denk-Budgets“ für Kostenkontrolle

Ein zentrales Feature für die Preisgestaltung ist die Möglichkeit, ein spezifisches „Denkbudget“ festzulegen. Dieses definiert die maximale Anzahl an Tokens, die das Modell während seiner Denkphase generieren darf, und erlaubt damit eine präzise Kontrolle über Kosten, Latenz und Qualität:

Ein Budget von 0 deaktiviert den Denkprozess komplett und bietet so die niedrigsten Kosten bei gleichzeitig verbesserter Leistung gegenüber 2.0 Flash
Entwickler können das Budget bis zu 24.576 Tokens für 2.5 Flash festlegen
Das Modell nutzt dabei nur so viel des Budgets, wie für die jeweilige Aufgabe nötig ist

Preis-Leistungs-Verhältnis

Google positioniert Gemini 2.5 Flash als das Modell mit dem besten Preis-Leistungs-Verhältnis im eigenen Portfolio. Laut Herstellerangaben erreicht es vergleichbare Metriken wie konkurrierende Modelle bei einem Bruchteil der Kosten und Größe. Besonders hervorzuheben ist die starke Leistung bei komplexen Anfragen in LMArena, wo es nur von Gemini 2.5 Pro übertroffen wird.

Beim Pricing hat Google stark darauf geachtet, die Konkurrenz zu unterbieten. Bei den Input- und Output-Preisen bleibt Gemini 2.5 deutlich unter jenen des Mitbewerbs und will sogar DeepSeek aus China unterbieten.

Comparison table showing price and performance metrics for LLMs

In der Chatbot Arena, wo die Rankings durch User-Bewertungen der LLMs entstehen, ist Gemini 2.5 Flash in der Preview-Version hoch eingestiegen. Unter den Top 7 AI-Modellen liegen dort nun 4 von Google, neben GPT-4.5 und GPT-4o von OpenAI sowie Grok-3 von xAI: