Figure: Roboter-Startup zeigt eigenes AI-Modell Helix, verzichtet auf OpenAI

Das AI-Robotik-Unternehmen Figure hat mit „Helix“ ein neues Vision-Language-Action (VLA) Modell vorgestellt, das Wahrnehmung, Sprachverständnis und Steuerung in einem System vereint. Die Innovation liegt besonders in der präzisen Kontrolle des gesamten humanoiden Oberkörpers inklusive Handgelenke, Torso, Kopf und einzelner Finger. Figure hat sich bekannterweise von den AI-Modellen von OpenAI losgesagt, weil man auf eigene Modelle setzen will.
Das System besteht aus zwei Hauptkomponenten: Einem Vision Language Model (VLM) mit 7 Milliarden Parametern für das Verstehen von Szenen und Sprache, sowie einem 80 Millionen Parameter starken Transformer-Modell für die motorische Steuerung. Während das VLM mit 7-9 Hz arbeitet, erfolgt die Bewegungssteuerung mit 200 Hz.
Fähigkeiten und Limitierungen Helix kann:
- Nahezu beliebige kleine Haushaltsgegenstände greifen und manipulieren
- Mit zwei Robotern gleichzeitig koordiniert arbeiten
- Natürlichsprachliche Anweisungen in Echtzeit umsetzen
- Auf handelsüblicher Embedded-Hardware laufen
Einschränkungen bestehen bei:
- Der Größe manipulierbarer Objekte
- Der Komplexität längerer Handlungsabläufe
- Der Robustheit bei stark variierenden Umgebungsbedingungen
Das System wurde mit etwa 500 Stunden überwachtem Training entwickelt – deutlich weniger als vergleichbare Ansätze. Figure betont, dass dies erst der Anfang sei und plant eine massive Skalierung des Trainings.
Bedeutung für die Robotik
Helix markiert einen wichtigen Schritt in Richtung flexibler Robotersysteme für unstrukturierte Umgebungen. Die Kombination aus sprachlicher Steuerung und präziser Motorik könnte neue Anwendungen im Haushalts- und Servicebereich ermöglichen. Allerdings bleibt abzuwarten, wie robust das System im realen Einsatz funktioniert.
Figure ist neben Boston Dynamics, Tesla, Nvidia und einigen anderen Unternehmen einer jener Player, die humanoide Roboter in Industrie, aber auch im Heimeinsatz etablieren möchten. argumentiert wird dabei oft und gerne, dass es nicht um den Ersatz menschlicher Arbeitskraft geht, sondern um das Füllen von Lücken im Arbeitsmarkt, wo Fachkräfte fehlen.