Launch

Google Gemini 2.5 Flash: Starkes neues KI-Modell mit niedrigen Preisen

Google Gemini am Smartphone. © Google / Canva Pro
Google Gemini am Smartphone. © Google / Canva Pro
Startup Interviewer: Gib uns dein erstes AI Interview Startup Interviewer: Gib uns dein erstes AI Interview

Google hat eine frühe Version von Gemini 2.5 Flash als Preview über die Gemini API in Google AI Studio und Vertex AI veröffentlicht. Das neue Modell baut auf dem Vorgänger 2.0 Flash auf und bringt laut Hersteller deutliche Verbesserungen bei den Reasoning-Fähigkeiten, behält dabei jedoch den Fokus auf Geschwindigkeit und Kosteneffizienz bei. Gemini 2.5 Flash ist die günstige Schwester des Top-Modells Gemini 2.5 Pro, das derzeit als das beste aller AI-Modelle gilt.

Die wichtigste Neuerung von Gemini 2.5 Flash ist die Einführung eines vollständig hybriden Reasoning-Ansatzes. Entwickler können nun den „Denkprozess“ des Modells aktivieren oder deaktivieren. Bei aktiviertem Denken analysiert das Modell zunächst den Prompt, zerlegt komplexe Aufgaben und plant seine Antwort, bevor es mit der eigentlichen Textgenerierung beginnt. Dieses Vorgehen verbessert laut Google die Qualität bei komplexen Aufgaben wie mathematischen Problemen oder Forschungsfragen.

Einstellbare „Denk-Budgets“ für Kostenkontrolle

Ein zentrales Feature für die Preisgestaltung ist die Möglichkeit, ein spezifisches „Denkbudget“ festzulegen. Dieses definiert die maximale Anzahl an Tokens, die das Modell während seiner Denkphase generieren darf, und erlaubt damit eine präzise Kontrolle über Kosten, Latenz und Qualität:

  • Ein Budget von 0 deaktiviert den Denkprozess komplett und bietet so die niedrigsten Kosten bei gleichzeitig verbesserter Leistung gegenüber 2.0 Flash
  • Entwickler können das Budget bis zu 24.576 Tokens für 2.5 Flash festlegen
  • Das Modell nutzt dabei nur so viel des Budgets, wie für die jeweilige Aufgabe nötig ist

Preis-Leistungs-Verhältnis

Google positioniert Gemini 2.5 Flash als das Modell mit dem besten Preis-Leistungs-Verhältnis im eigenen Portfolio. Laut Herstellerangaben erreicht es vergleichbare Metriken wie konkurrierende Modelle bei einem Bruchteil der Kosten und Größe. Besonders hervorzuheben ist die starke Leistung bei komplexen Anfragen in LMArena, wo es nur von Gemini 2.5 Pro übertroffen wird.

Beim Pricing hat Google stark darauf geachtet, die Konkurrenz zu unterbieten. Bei den Input- und Output-Preisen bleibt Gemini 2.5 deutlich unter jenen des Mitbewerbs und will sogar DeepSeek aus China unterbieten.

Comparison table showing price and performance metrics for LLMs

In der Chatbot Arena, wo die Rankings durch User-Bewertungen der LLMs entstehen, ist Gemini 2.5 Flash in der Preview-Version hoch eingestiegen. Unter den Top 7 AI-Modellen liegen dort nun 4 von Google, neben GPT-4.5 und GPT-4o von OpenAI sowie Grok-3 von xAI:

Werbung
Werbung

Specials unserer Partner

Die besten Artikel in unserem Netzwerk

Powered by Dieser Preis-Ticker beinhaltet Affiliate-Links zu Bitpanda.

Deep Dives

Startup & Scale-up Investment Tracker 2025

Die größten Finanzierungsrunden des Jahres im Überblick
#glaubandich CHALLENGE Hochformat.

#glaubandich CHALLENGE 2025

Österreichs größter Startup-Wettbewerb - 13 Top-Investoren mit an Bord
© Wiener Börse

IPO Spotlight

powered by Wiener Börse

Trending Topics Tech Talk

Der Podcast mit smarten Köpfen für smarte Köpfe
Die 2 Minuten 2 Millionen Investoren. © PULS 4 / Gerry Frank

2 Minuten 2 Millionen | Staffel 12

Die Startups - die Investoren - die Deals - die Hintergründe

BOLD Community

Podcast-Gespräche mit den BOLD Minds

IPO Success Stories

Der Weg an die Wiener Börse

Weiterlesen