Launch

Gemini: Googles neuestes AI-Modell will endlich GPT-4 von OpenAI schlagen

Jakob Steinschaden06. Dezember 2023, 16:55

Gemini, das AI-Modell von Google. © Google

Startup Interviewer: Gib uns dein erstes AI Interview

Auf der Jagd nach OpenAI ist es nun Google, das erstmals behaupten kann, ein besseres AI-Modell als GPT-4 zu veröffentlichen: Denn mit Gemini, dem Nachfolger von PaLM, hat der Internet-Konzern heute ein neues multimodales Large Language Model (LLM) vorgestellt, dass künftig auch seinen Chatbot Bard antreiben soll. Dieser wurde gegen ChatGPT frühzeitig gestartet, um dem Hype rund um OpenAI und dessen Großinvestor Microsoft etwas entgegen zu setzen. Gemini soll kann Text, Bilder, Audio und mehr gleichzeitig verstehen und Fragen zu komplizierten Themen beantworten können. Vor allem in Mathematik und Physik sei das AI-Modell besonders gut. Auch Programmiersprachen beherrscht es.

„Wir machen den nächsten Schritt auf unserer Reise mit Gemini, unserem bisher leistungsfähigsten und allgemeinsten Modell, das in vielen führenden Benchmarks die beste Leistung bietet. Unsere erste Version, Gemini 1.0, ist für verschiedene Größen optimiert: Ultra, Pro und Nano. Dies sind die ersten Modelle der Gemini-Ära und die erste Umsetzung unserer Vision, die wir hatten, als wir Anfang des Jahres Google DeepMind gründeten. Diese neue Ära von Modellen stellt eine der größten wissenschaftlichen und technischen Anstrengungen dar, die wir als Unternehmen unternommen haben“, heißt es in einer Botschaft von Google-CEO Sundar Pichai. Die zugekaufte Tochterfirma Deepmind wurde dieses Jahr stärker in Google integriert – als Reaktion auf das OpenAI-Microsoft-Bündnis.

In vielen Benchmarks besser als GPT-4 von OpenAI

Was also kann Gemini nun? „Von natürlichem Bild-, Audio- und Videoverständnis bis hin zu mathematischen Schlussfolgerungen übertrifft die Leistung von Gemini Ultra den aktuellen Stand der Technik bei 30 der 32 weit verbreiteten akademischen Benchmarks, die in der Forschung und Entwicklung großer Sprachmodelle (LLM) verwendet werden“, heißt es seitens Google. Da ist vor allem GPT-4 gemeint, das aktuelle AI-Modell von OpenAI, das auch in zahlreichen Microsoft-Produkten verbaut ist.

Hier die Vergleichs-Benchmarks zwischen Gemini Ultra und GPT-4 von OpenAI, wie sie Google veröffentlicht hat:

A chart showing Gemini Ultra’s performance on common text benchmarks, compared to GPT-4 (API numbers calculated where reported numbers were missing).

A chart showing Gemini Ultra’s performance on multimodal benchmarks compared to GPT-4V, with previous SOTA models listed in places where capabilities are not supported in GPT-4V.

Dass Google mit Gemini nachlegt und damit PaLM 2 ablöst, war auch dringend notwendig. Denn verschiedene Tests – etwa dieser zu Halluzinationen – haben PaLM keine guten Noten ausgestellt, und die Nutzung von Google Bard reicht bei weitem nicht an jene von ChatGPT heran. Die veröffentlichten Benchmark-Testergebnisse sind durchaus bemerkenswert. Bisher hat es noch keine andere Firma gewagt, sich mit GPT-4 öffentlich zu vergleichen – auch nicht die milliardenschweren Silicon-Valley-Startups, die bisher nur den Vergleich zu GPT-3.5 machten.

Ranking: ChatGPT halluziniert am wenigsten, Googles PaLM am meisten

Zuerst auf Englisch bei Bard integriert

Wo also wird man Gemini zuerst ausprobieren können? Zuerst wird die „Pro“-Version (und damit nicht das stärkste Modell) in der englischsprachigen Version von Bard integriert. Außerdem wird das neue Smartphone Pixel 8 Pro mit der „Nano“-Version ausgestattet, damit es etwa aufgenommene Sprachnachrichten zusammenfassen kann. „In den kommenden Monaten wird Gemini in weiteren unserer Produkte und Dienste wie Search, Ads, Chrome und Duet AI verfügbar sein“, heißt es seitens Google, außerdem werde man Gemini auch in weiteren Regionen der Welt bringen. Die „Ultra“-Version und damit das stärkste Gemini-Modell wird erst 2024 in Bard integriert werden.

Entwickler:innen, die Gemini in ihre eigenen Apps einbauen möchten, werden dies ab dem 13. Dezember tun können. Dann können Devs auf die Gemini-API in Google AI Studio oder via Google Cloud Vertex AI auf Gemini Pro zugreifen. Das Google AI Studio ist dabei kostenlos, bei Google Cloud Vertex AI werden voraussichtlich Kosten anfallen.