ChatGPT kann nun „sehen“ und versteht Echtzeit-Videos
ChatGPT versteht jetzt Echtzeit-Videos und kann „sehen“, berichtet TechCrunch. Entwickler OpenAI hat nun die Echtzeit-Videofunktionen veröffentlicht, die er vor fast sieben Monaten erstmals vorgeführt hat. Am Donnerstag gab das Unternehmen während eines Livestreams bekannt, dass der Advanced Voice Mode, seine menschenähnliche Konversationsfunktion für ChatGPT, nun „sehen“ kann. Mit der ChatGPT-App können User, die ChatGPT Plus, Team oder Pro abonniert haben, ihre Handys auf Objekte richten und die Anwendung in nahezu Echtzeit antworten lassen.
AI Melange ☕️ mit ASFINAG-CIO Bernd Datler über KI auf der Autobahn
ChatGPT-Feature kann auch Bildschirm ansehen
Der erweiterte Sprachmodus mit Sehvermögen kann auch verstehen, was auf dem Bildschirm eines Geräts durch Bildschirmfreigabe zu sehen ist. Er kann z. B. verschiedene Einstellungsmenüs erklären oder Vorschläge zu einer Matheaufgabe geben. Der Rollout des Advanced Voice Mode mit Sehvermögen wird am Donnerstag beginnen und in der nächsten Woche abgeschlossen sein. Aber nicht alle Nutzer:innen werden Zugang erhalten. So gibt es derzeit noch keinen Zeitplan für die EU, die Schweiz, Island, Norwegen oder Liechtenstein.
Das neue Echtzeitvideo-Feature hat sich mehrfach verzögert – angeblich auch deshalb, weil OpenAI die Funktion ankündigte, lange bevor sie produktionsreif war. Im April versprach OpenAI, dass der erweiterte Sprachmodus „innerhalb weniger Wochen“ kommen würde. Monate später erklärte das Unternehmen, dass es mehr Zeit benötige. Als der erweiterte Sprachmodus schließlich im Frühherbst für einige Nutzer:innen verfügbar war, fehlte die visuelle Analysekomponente. Im Vorfeld des Starts am Donnerstag hat sich OpenAI darauf konzentriert, den reinen Sprachmodus für weitere Plattformen und User in der EU verfügbar zu machen.
Google und Meta entwickeln ähnliche Funktionen
Konkurrenten wie Google und Meta arbeiten an ähnlichen Funktionen für ihre jeweiligen Chatbot-Produkte. In dieser Woche hat Google seine Echtzeit-Videoanalyse-KI-Funktion Project Astra einer Gruppe von „vertrauenswürdigen Tester:innen“ auf Android zur Verfügung gestellt.