Google’s Gemini: Live-KI-Videoanalyse will Nutzerfragen beantworten

Mit der KI schreiben und sprechen kennt man bereits – jetzt arbeiten Techriesen wie Google daran, Echtzeit-KI-Videofunktionen in Gemini zu integrieren. Diese sollen Bildschirminhalte interpretieren und Nutzer:innen entsprechend Auskunft geben. Das neue Tool steht bereits in den Startlöchern.
Echtzeit-KI-Videofunktionen von Gemini
Für einige Google One AI Premium-Abonnent:innen wurden bereits KI-Bildschirm- und Kamerafunktionen für Gemini gelauncht. Das KI-Tool soll nun durch die Smartphone-Bildschirme in Echtzeit „sehen“ und Inhalte entsprechend analysieren können. Ein Beispiel: Eine Frau zeigt Gemini durch die Kamera verschiedene Farbmuster und fragt die KI, welche die ideale Wahl für eine getöpferte Vase im mittelalterlichen Stil sei. Das Gezeigte wird analysiert, und prompt liefert Gemini eine passende Antwort: Der olivgrüne Ton passt am besten.
Im Video werden die neuen Bildschirmlesefunktionen von Gemini demonstriert.
Launch der Live-KI-Videoanalyse bestätigt
Die neuen Funktionen wurden knapp ein Jahr nach der ersten Präsentation von Googles „Project Astra“ gelauncht. Das Ziel dabei sei, die KI der nächsten Generation zu erforschen.
„Stellen Sie sich eine KI vor, die nicht nur auf Ihre Sprachbefehle reagiert, sondern wirklich die Welt um Sie herum versteht. Eine KI, die Ihre Bedürfnisse vorausahnt, proaktiv Hilfe anbietet und sich auf natürliche, menschenähnliche Gespräche einlässt“, heißt es von Seiten Googles.
Dass gerade der Launch der neuen Live-KI-Videoanalyse vorbereitet wird, die Fragen in Echtzeit beantworten kann, bestätigte Google-Sprecher Alex Joseph gegenüber The Verge.
Googles Vorsprung bei KI-Assistenten
Alphabet, Googles Mutterkonzern, könnte sich mit den beiden Funktionen „Interpretation von Bildschirminhalten“ und der „Live-KI-Videoanalyse“ einen Vorsprung holen. Denn Apple und Amazon arbeiten aktuell noch an neuen KI-Upgrades für Siri und Alexa. Beide sollen über ähnliche Funktionen verfügen wie die, die Astra jetzt zu aktivieren beginnt.
Der iPhone-Hersteller gab erst vor Kurzem bekannt, das geplante Siri-Update aufgrund technischer Herausforderungen verschoben zu haben. Die Veröffentlichung sei nun für Mai 2025 geplant, wenn iOS 18.5 auf den Markt kommt. Bezüglich spezifischer Funktionen wie der Live-KI-Videoanalyse im Rahmen von Alexa-Plus hat Amazon bisher keine detaillierten Informationen veröffentlicht. Fest steht: Der Wettbewerbsdruck im Bereich der intelligenten Sprachassistenten ist enorm.
Kaiko Systems holt sich 6 Mio. € für KI-gestützte Maritime Operations Platform