Künstliche Intelligenz

ChatGPT kann nun „sehen“ und versteht Echtzeit-Videos

OpenAI führt ChatGPT-Videoerkennung ein © OpenAI
OpenAI führt ChatGPT-Videoerkennung ein © OpenAI
Startup Interviewer: Gib uns dein erstes AI Interview Startup Interviewer: Gib uns dein erstes AI Interview

ChatGPT versteht jetzt Echtzeit-Videos und kann „sehen“, berichtet TechCrunch. Entwickler OpenAI hat nun die Echtzeit-Videofunktionen veröffentlicht, die er vor fast sieben Monaten erstmals vorgeführt hat. Am Donnerstag gab das Unternehmen während eines Livestreams bekannt, dass der Advanced Voice Mode, seine menschenähnliche Konversationsfunktion für ChatGPT, nun „sehen“ kann. Mit der ChatGPT-App können User, die ChatGPT Plus, Team oder Pro abonniert haben, ihre Handys auf Objekte richten und die Anwendung in nahezu Echtzeit antworten lassen.

AI Melange ☕️ mit ASFINAG-CIO Bernd Datler über KI auf der Autobahn

ChatGPT-Feature kann auch Bildschirm ansehen

Der erweiterte Sprachmodus mit Sehvermögen kann auch verstehen, was auf dem Bildschirm eines Geräts durch Bildschirmfreigabe zu sehen ist. Er kann z. B. verschiedene Einstellungsmenüs erklären oder Vorschläge zu einer Matheaufgabe geben. Der Rollout des Advanced Voice Mode mit Sehvermögen wird am Donnerstag beginnen und in der nächsten Woche abgeschlossen sein. Aber nicht alle Nutzer:innen werden Zugang erhalten. So gibt es derzeit noch keinen Zeitplan für die EU, die Schweiz, Island, Norwegen oder Liechtenstein.

Das neue Echtzeitvideo-Feature hat sich mehrfach verzögert – angeblich auch deshalb, weil OpenAI die Funktion ankündigte, lange bevor sie produktionsreif war. Im April versprach OpenAI, dass der erweiterte Sprachmodus „innerhalb weniger Wochen“ kommen würde. Monate später erklärte das Unternehmen, dass es mehr Zeit benötige. Als der erweiterte Sprachmodus schließlich im Frühherbst für einige Nutzer:innen verfügbar war, fehlte die visuelle Analysekomponente. Im Vorfeld des Starts am Donnerstag hat sich OpenAI darauf konzentriert, den reinen Sprachmodus für weitere Plattformen und User in der EU verfügbar zu machen.

Perplexity: Wie das AI-Unicorn in Österreich skalieren will

Google und Meta entwickeln ähnliche Funktionen

Konkurrenten wie Google und Meta arbeiten an ähnlichen Funktionen für ihre jeweiligen Chatbot-Produkte. In dieser Woche hat Google seine Echtzeit-Videoanalyse-KI-Funktion Project Astra einer Gruppe von „vertrauenswürdigen Tester:innen“ auf Android zur Verfügung gestellt.

Werbung
Werbung

Specials unserer Partner

Die besten Artikel in unserem Netzwerk

Deep Dives

#glaubandich CHALLENGE Hochformat.

#glaubandich CHALLENGE 2025

Österreichs größter Startup-Wettbewerb - 13 Top-Investoren mit an Bord
© Wiener Börse

IPO Spotlight

powered by Wiener Börse

Austrian Startup Investment Tracker

Die Finanzierungsrunden 2024

Trending Topics Tech Talk

Der Podcast mit smarten Köpfen für smarte Köpfe

2 Minuten 2 Millionen | Staffel 11

Die Startups - die Investoren - die Deals - die Hintergründe

The Top 101

Die besten Startups & Scale-ups Österreichs im großen Voting

BOLD Community

Podcast-Gespräche mit den BOLD Minds

IPO Success Stories

Der Weg an die Wiener Börse

Weiterlesen