AI schafft das Kugellabyrinth nach 6 Stunden schneller als der Mensch
Mit zwei Drehknöpfen ein Kügelchen durch ein Labyrinth lotsen und vermeiden, dass sie in eines der Löcher fällt: Das Spiel Kugellabyrinth findet sich in Millionen von Kinderzimmern weltweit – und mittlerweile auch in einem AI-Labor an der ETH Zürich. Denn dort haben Forscher:innen es geschafft, eine Künstliche Intelligenz innerhalb von nur sechs Stunden so zu trainieren, dass diese das Kugellabyrinth schneller schafft als jeder Mensch.
„Das Lernen im realen Labyrinth wurde in 6,06 Stunden durchgeführt und umfasste 1,2 Millionen Zeitschritte bei einer Kontrollrate von 55 Samples pro Sekunde. Der KI-Roboter übertrifft die bisher schnellste Zeit, die von einem extrem erfahrenen menschlichen Spieler erzielt wurde, um über 6 %“, heißt es seitens Thomas Bi und Prof. Raffaello D’Andrea, die das Experiment durchgeführt haben. Das besondere sei, dass eine AI erstmals einen Menschen bei einer physischen Aufgabe schlagen würde – bisher waren es stets virtuelle Games, in denen AIs trainiert wurden.
„Genau wie wir Menschen lernt auch der Roboter durch Erfahrung. Während er das Spiel spielt, nimmt er Beobachtungen auf und erhält Belohnungen auf der Grundlage seiner Leistung, alles durch die „Augen“ einer Kamera, die auf das Labyrinth hinunterschaut. Die gesammelten Erfahrungen werden in einem Speicher abgelegt. Anhand dieses Speichers lernt der modellbasierte Verstärkungslern-Algorithmus, wie sich das System verhält, und erkennt auf der Grundlage seines Verständnisses des Spiels, welche Strategien und Verhaltensweisen erfolgversprechender sind (der „Kritiker“)“, heißt es weiter.
Eine besondere Erkenntnis: Während dem Lernvorgang sei der Bot auch auf Abkürzungen für die Kugel gekommen, lernte also auch innerhalb weniger Stunde, zu tricksen. Man hätte durch weitere Instruktionen diese Trickserei auch wieder austrainieren müssen. Die Forschung wurde am Institut für Dynamische Systeme und Regelungstechnik der ETH Zürich durchgeführt. Das Institut ist seit seiner Gründung vor 15 Jahren führend in den Bereichen Robotik, Systeme und Steuerung. Auf der Webseite bzw. via Github wollen die Forscher:innen nun bald Informationen zu Hardware sowie den Code veröffentlichen.