OpenAIs AI-Agent „Operator“ ist nicht in Europa verfügbar
Die Liste an AI-Services, die in der EU nicht verfügbar sind, in den USA aber schon wieder immer länger: Nach dem Launch des AI-Agenten „Operator“ von OpenAI, der Aufgaben am Computer des Nutzers ausführen können soll, wird klar, dass man ihn hierzulande nicht nutzen kann. Generell muss man, um auf eine Vorab-Version Zugriff zu bekommen, das 200 Dollar teure Monatsabo für ChatGPT Pro abschließen, dass auch den Videogenerator Sora beinhaltet – und in den USA leben.
„Operator is unavailable in your region“, bekommen Nutzer:innen in Europa derzeit beim Versuch, den KI-Agenten aufzurufen, am Bildschirm angezeigt. Mit einem VPN sollte es gehen, wie gesagt benötigt man aber jedenfalls das 200-Dollar-Abo für ChatGPT Pro. Erst im weiteren Verlauf sollen Plus, Team und Enterprise-User ebenfalls Zugriff erhalten. Wann Europa dran ist, bleibt abzuwarten. Operator ist neben Meta AI, Apple Intelligence und einigen Llama-Modellen der nächste AI-Dienst, der vorerst nicht in Europa verfügbar ist.
Jedenfalls: Der AI-Agent soll den Web-Browser des Users bedienen können, um dort Aufgaben zu erledigen, die man ansonstne händisch machen müsste. Operator wird von einem neuen Modell namens Computer-Using Agent (CUA) unterstützt. CUA kombiniert die Sehfähigkeiten von GPT-4o mit fortgeschrittenem logischem Denken durch verstärkendes Lernen und ist darauf trainiert, mit grafischen Benutzeroberflächen (GUIs) zu interagieren – den Schaltflächen, Menüs und Textfeldern, die Menschen auf einem Bildschirm sehen“, heißt es seitens OpenAI.
Operator kann Browser bedienen
Der Operator könne so mit einem Browser „sehen“ (durch Screenshots) und „interagieren“ (mit allen Aktionen, die eine Maus und eine Tastatur ermöglichen), was ihn in die Lage versetzt, im Web zu agieren, ohne dass benutzerdefinierte API-Integrationen erforderlich sind. Warum OpenAI Operator vorerst nicht nach Europa bringt, kann mehrere Gründe haben. Denn derzeit ist die erste Version darauf spezialisiert bestimmte Web-Dienste bedienen zu können.
OpenAI kooperiert dabei mit den sehr US-lastigen Services DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack und Uber. So soll der Operator etwa ein Taxi rufen, Essen bestellen oder Flüge suchen können. Komplett selbstständig ist der KI-Agent dann aber nicht, der Mensch kann jederzeit eingreifen und die Kontrolle über Maus und Tastatur zur Eingabe zurückgewinnen. Auch an den entscheidenden Punkten wie Logins, Zahlungsdaten oder das Lösen von CAPTCHAs wird der User proaktiv auffordert, die Aufgaben zu übernehmen.
Während OpenAO mit dem Operator und Anthropic mit seinem „Computer Use“ sich auf den Desktop-Computer fokussieren, ist das AI-Startup Perplexity vorgeprescht und hat eine Android-Version seines AI-Agenten veröffentlicht, die selbstständig Apps bedienen können soll. Der Assistent funktioniert bisher nur mit ausgewählten Apps wie Spotify, YouTube und Uber sowie mit E-Mail-, Messaging- und Uhr-Apps.
OpenAI vs Perplexity vs Anthropic vs Gemini: Jetzt kommen die AI-Agenten!