Mistral AI: Mit Pixtral Large und Le Chat zur vollwertigen ChatGPT-Konkurrenz
Das französische Startup Mistral AI hat ein neues Grundmodell namens “Pixtral Large“ gelauncht. Es handelt sich dabei um ein multimodales Modell mit 124 Milliarden Parametern. Darüber hinaus wurde der kostenlose Chatbot „Le Chat“ weiter ausgebaut. Er soll sowohl Echtzeit-Websuche durchführen, Dokumente und Bilder analysieren als auch Bildmaterial kreieren können. Mistral wird damit zu einem ernsthaften und direkten Konkurrenten von OpenAI – nur im Audiosektor besteht noch Aufholbedarf.
Pixtral Large und multimodale KI
Im Bereich der KI bestehen laut Mistral große Herausforderungen darin, Modelle zu entwickeln, die in der Lage sind, gleichzeitig mehrere Datentypen wie Text, Bilder und Audio zu verstehen und Schlussfolgerungen daraus zu ziehen. Während LLMs dabei an ihre Grenzen stoßen, sollen multimodale Modelle verschiedene Datentypen effektiver und besser verarbeiten können. Dafür brauche es allerdings erhebliche Rechenressourcen, große Datensätze und eine gut durchdachte Architektur.
Dies will Mistral mit Pixtral Large gelungen sein – es soll sowohl Text- als auch visuelle Daten „bestens verarbeiten können“. Außerdem soll es ideal für die Interpretation von Diagrammen und die Analyse von Dokumenten sein. Das neue 124-Milliarden-Parameter-Modell baut einerseits auf seinem Vorgänger Mistral Large 2 auf, der im Sommer 2024 vorgestellt wurde. Andererseits basiert es auf dem ersten multimodalen Modell, Pixtral 12-B, das im September veröffentlicht wurde.
Parameter sind die Variablen innerhalb eines KI-Modells, die während des Trainings angepasst werden, um Eingaben in Ausgaben zu übersetzen. Sie bestimmen, wie das Modell Daten verarbeitet und Muster erkennt. Die Faustregel lautet: Je mehr Parameter, desto fähiger und leistungsfähiger das Modell.
Kontextfenster von 128.000 Token
Auf der Plattform X postete Arthur Mensch, CEO und Mitbegründer von Mistral AI: „Bei Mistral ist uns bewusst geworden, dass man Modelle und Produktschnittstellen mitgestalten muss, um die beste KI-Erfahrung zu schaffen. Pixtral wurde mit Blick auf hochwirksame Front-End-Anwendungen trainiert und ist ein gutes Beispiel dafür.“
Pixtral Large soll mit seinem Kontextfenster von 128.000 Token bis zu 30 hochauflösende Bilder pro Eingabe oder etwa ein 300-seitiges Buch verarbeiten können. Dies entspräche den führenden Modellen der OpenAI GPT-Serie. Auch in verschiedenen Benchmarks, darunter MathVista, DocVQA und VQAv2, soll Pixtral Large die beste Leistung zeigen.
Nicht wirklich Open Source
Das neue Mistral-Modell gibt es auf Hugging Face zum freien Download – allerdings nur mit einer speziellen Mistral AI Research License. Das bedeutet, Mistral AI-Forscher:innen und Entwickler:innen dürfen die multimodale KI für „forschungsorientierte Anwendungen“ nutzen.
Kommerzielle Entwicklungen sind nicht erlaubt bzw. müssen über die API von Mistral auf dem von Le Platforme verwalteten Webservice erfolgen. Oder es wird eine separate Lizenz über das Kontaktformular direkt beim Unternehmen beantragt. Pixtral Large ist also nicht wirklich Open Source.
Konkurrenzkampf
Das Update von Mistrals kostenlosem AI-Tool „Le Chat“ umfasst die Erweiterung durch neue Pixtral Large-Funktionen. Grundsätzlich wurde es laut dem französischen Startup für verschiedene Anwendungsfälle entwickelt, wie etwa zu Forschungszwecken, zur Ideenfindung und um Aufgaben zu automatisieren – Text-, Bild- und interaktive Funktionalitäten inklusive.
Von der Konkurrenz wie ChatGPT, Perplexity und Claude möchte es sich durch den „umfassenden Funktionsumfang“ und über seine niederschwellige Zugänglichkeit abheben. Denn andere Anbieter bieten ähnliche Premium-Funktionen im kostenpflichtigen Abonnement an – Mistral gibt an, kostenlos bleiben zu wollen.
Die neuen Funktionen von Le Chat
Mit Le Chat ist es nun möglich, Echtzeit-Web-Suchen durchzuführen und Ergebnisse mit transparenten Quellenangaben zu erhalten. Mit der interaktiven Canvas-Funktion sollen User:innen Dokumente, Präsentationen und Entwürfe in einem interaktiven Bereich gemeinsam bearbeiten können.
Durch die erweiterte Dokumenten- und Bildanalyse, basierend auf Pixtral Large, soll Le Chat komplexe PDFs verarbeiten und zusammenfassen können. Auch sei es möglich, Grafiken, Tabellen und Gleichungen zu extrahieren.
Mistral ist eine Partnerschaft mit dem AI-Startup Black Forest Labs eingegangen, die Le Chat nun eigene Bilderzeugungsfunktionen verliehen hat. User:innen sollen damit qualitativ hochwertige Bilder direkt in der Chat-Oberfläche erstellen können.
Als letzte Erweiterung wird die Automatisierung von Aufgaben genannt. Im Tool sollen jetzt anpassbare KI-Agenten integriert sein, die repetitive Aufgaben automatisch erledigen können. Dazu kann das Zusammenfassen von Besprechungsprotokollen oder die Bearbeitung von Rechnungen zählen.
Le Chat testen
User:innen, die die neuen Le Chat-Funktionen ausprobieren möchten, müssen sie als Beta-Funktionen auf der Weboberfläche aktivieren. Außerdem ist ein Mistral-, Google- oder Microsoft-Konto erforderlich.
Was Le Chat nicht drauf hat, sind fortschrittliche Sprach- und Audiofunktionen, wie sie im ChatGPT Advanced Voice Mode von OpenAI zu finden sind. Auch Gemini Live von Google liefert hier aktuell die bessere Performance.
Mistral als starker europäischer KI-Anbieter
Aktuell ist es dennoch so, dass große US-Unternehmen vorzugsweise mit OpenAI, Anthropic und Microsoft arbeiten – das zeigt eine kürzlich von Kong durchgeführte Umfrage. Aber Mistral könnte einen Trumpf im Ärmel haben: Durch Trumps Wahlsieg und des damit wachsenden Einflusses von Elon Musk auf die Tech-Welt ist es wahrscheinlich, dass sich Mistral als bester und entscheidender europäischer KI-Player etablieren wird – und zwar ohne Kontrolle aus den USA.