Innovation

Google’s Gemini: Live-KI-Videoanalyse will Nutzerfragen beantworten

Das neue Gemini-KI-Feature stammt aus Project Astra, einem Forschungsprototyp zur Erforschung der zukünftigen Fähigkeiten eines universellen KI-Assistenten. © Google DeepMind
Das neue Gemini-KI-Feature stammt aus Project Astra, einem Forschungsprototyp zur Erforschung der zukünftigen Fähigkeiten eines universellen KI-Assistenten. © Google DeepMind
Startup Interviewer: Gib uns dein erstes AI Interview Startup Interviewer: Gib uns dein erstes AI Interview

Mit der KI schreiben und sprechen kennt man bereits – jetzt arbeiten Techriesen wie Google daran, Echtzeit-KI-Videofunktionen in Gemini zu integrieren. Diese sollen Bildschirminhalte interpretieren und Nutzer:innen entsprechend Auskunft geben. Das neue Tool steht bereits in den Startlöchern.​

Echtzeit-KI-Videofunktionen von Gemini

Für einige Google One AI Premium-Abonnent:innen wurden bereits KI-Bildschirm- und Kamerafunktionen für Gemini gelauncht. Das KI-Tool soll nun durch die Smartphone-Bildschirme in Echtzeit „sehen“ und Inhalte entsprechend analysieren können. Ein Beispiel: Eine Frau zeigt Gemini durch die Kamera verschiedene Farbmuster und fragt die KI, welche die ideale Wahl für eine getöpferte Vase im mittelalterlichen Stil sei. Das Gezeigte wird analysiert, und prompt liefert Gemini eine passende Antwort: Der olivgrüne Ton passt am besten.

Im Video werden die neuen Bildschirmlesefunktionen von Gemini demonstriert.

Launch der Live-KI-Videoanalyse bestätigt

Die neuen Funktionen wurden knapp ein Jahr nach der ersten Präsentation von Googles „Project Astra“ gelauncht. Das Ziel dabei sei, die KI der nächsten Generation zu erforschen.

„Stellen Sie sich eine KI vor, die nicht nur auf Ihre Sprachbefehle reagiert, sondern wirklich die Welt um Sie herum versteht. Eine KI, die Ihre Bedürfnisse vorausahnt, proaktiv Hilfe anbietet und sich auf natürliche, menschenähnliche Gespräche einlässt“, heißt es von Seiten Googles.

Dass gerade der Launch der neuen Live-KI-Videoanalyse vorbereitet wird, die Fragen in Echtzeit beantworten kann, bestätigte Google-Sprecher Alex Joseph gegenüber The Verge.

Googles Vorsprung bei KI-Assistenten

Alphabet, Googles Mutterkonzern, könnte sich mit den beiden Funktionen „Interpretation von Bildschirminhalten“ und der „Live-KI-Videoanalyse“ einen Vorsprung holen. Denn Apple und Amazon arbeiten aktuell noch an neuen KI-Upgrades für Siri und Alexa. Beide sollen über ähnliche Funktionen verfügen wie die, die Astra jetzt zu aktivieren beginnt.

Der iPhone-Hersteller gab erst vor Kurzem bekannt, das geplante Siri-Update aufgrund technischer Herausforderungen verschoben zu haben. Die Veröffentlichung sei nun für Mai 2025 geplant, wenn iOS 18.5 auf den Markt kommt. Bezüglich spezifischer Funktionen wie der Live-KI-Videoanalyse im Rahmen von Alexa-Plus hat Amazon bisher keine detaillierten Informationen veröffentlicht. Fest steht: Der Wettbewerbsdruck im Bereich der intelligenten Sprachassistenten ist enorm.

Kaiko Systems holt sich 6 Mio. € für KI-gestützte Maritime Operations Platform

Werbung
Werbung

Specials unserer Partner

Die besten Artikel in unserem Netzwerk

Powered by Dieser Preis-Ticker beinhaltet Affiliate-Links zu Bitpanda.

Deep Dives

Startup & Scale-up Investment Tracker 2025

Die größten Finanzierungsrunden des Jahres im Überblick
#glaubandich CHALLENGE Hochformat.

#glaubandich CHALLENGE 2025

Österreichs größter Startup-Wettbewerb - 13 Top-Investoren mit an Bord
© Wiener Börse

IPO Spotlight

powered by Wiener Börse

Trending Topics Tech Talk

Der Podcast mit smarten Köpfen für smarte Köpfe
Die 2 Minuten 2 Millionen Investoren. © PULS 4 / Gerry Frank

2 Minuten 2 Millionen | Staffel 12

Die Startups - die Investoren - die Deals - die Hintergründe

BOLD Community

Podcast-Gespräche mit den BOLD Minds

IPO Success Stories

Der Weg an die Wiener Börse

Weiterlesen