Mistral AI: Das neueste AI-Modell des Startups ist bereits in freier Wildbahn
Es wurde vor einigen Wochen zuerst unter dem Kürzel „miqu-1-70B“ (das Kürzel deutet auf 70 Milliarden Parameter hin) gesichtet und kann nun schon ausprobiert werden: Das von vielen sehnsüchtig erwartete nächste Large Language Model des französischen Ausnahme-Startups Mistral AI kann unter dem Namen „Mistral Next“ bereits in der „Chatbot Arena“ der Large Model Systems Organization (LMSYS Org) der Universität Berkeley ausprobiert werden.
Mistral hat die AI-Modell-Szene mit bereits zwei Veröffentlichungen – nämlich Mistral 7B und Mixtral 8X7B – aufgemischt und gezeigt, dass es mit anderen KI-Modellen wie GPT-3.5 oder Llama von Meta durchaus mithalten kann. Mit dem neuesten Modell aber steht dem Vernehmen nach nun der große Angriff auf die beiden führenden AI-Modelle, nämlich GPT-4 von OpenAI und Gemini von Google, an.
Noch sind wenige Daten und Fakten zu Mistral Next bekannt. Jedenfalls aber kann man die Chat-Version des Modells kostenlos ausprobieren und gegen eine Reihe anderer LLMs in der Chatbot Arena antreten lassen. Als „Gegner“ kann man unter anderem GPT-4 von OpenAI, Gemini Pro von Google, Claude 2.1 von Anthropic oder Llama 70B von Meta auswählen. Das erlaubt es, die gleiche Aufgabe bzw. Frage an die zwei ausgewählten Modelle zu stellen und die Antworten direkt zu vergleichen.
Mistral Next könnte GPT-4 angreifen
Noch gibt es aber keine statistisch aussagekräftige Zahlen, die bestätigen, dass Mistral Next auf dem Level von GPT-4 von OpenAI antworten kann. Im „LMSYS Chatbot Arena Leaderboard“ liegen derzeit mehrere Varianten von GPT-4 sowie Gemini Pro vor „Mistral Medium“ – dabei handelt es sich um die stärkste Version von Mixtral 8x7B. Es wäre also nicht verwunderlich, wenn Mistral Next an GPT-4 herankommt.
Jedenfalls ist erstaunlich, wie schnell Mistral AI mit einer Handvoll Entwickler:innen in kurzer Zeit gekommen ist. Das Startup wurde erst im April 2023 gegründet, hat aber bisher bereits zwei LLMs abgeliefert, die sich mit Modellen von OpenAI, Google oder Meta messen können.
Im Dezember 2023 bewerteten Investoren die blutjunge Firma mit 2 Milliarden Dollar. Die Köpfe des Startups sind Hochkaräter: CEI Arthur Mensch ist ehemaliger Research Scientist bei Google DeepMind, Guillaume Lample ehemaliger Research Scientist bei Meta und Kopf von LlaMA, und CTO Timothée Lacroix ehemaliger Software Engineer bei Meta.
Im Unterschied zu Google und OpenAI fährt Mistral AI die Strategie, seine AI-Modelle unter Apache 2.0-Lizenz zu veröffentlichen. Diese Lizenz bedeutet vereinfacht gesagt, dass die Software frei in jedem Umfeld verwendet, modifiziert und verteilt werden darf. Wer diese LLMs aber nicht auf eigenen Rechnern laufen lassen kann oder will, der bekommt Zugang auch via API. Das bietet dem Pariser Startup letztendlich auch eine Erlösquelle.
Mistral AI’s neuestes Open-Source-Modell soll an GPT-4 herankommen