ChatGPT Search verwendet auch Medien, die nie einen Deal mit OpenAI machten
Einer der großen Nachteile von AI-Modellen bisher war oft, dass ihr Wissen zu einem bestimmten Datum abgeschnitten wurde. Das hängt mit den Daten zusammen, mit denen die LLMs trainiert wurden. Diesen Nachteil merzt nun OpenAI bei ChatGPT aus und hat eine neue Suchfunktion, die aktuelle Ergebnisse aus dem Internet in die Antworten des Chatbots holt, nun offiziell integriert.
„Stellen Sie eine Frage in einer natürlichen, unterhaltsamen Art und Weise, und ChatGPT kann Ihnen mit Informationen aus dem Internet antworten. Gehen Sie mit Folgefragen tiefer, und ChatGPT wird den gesamten Kontext Ihres Chats berücksichtigen, um eine bessere Antwort für Sie zu finden“, heißt es dazu seitens OpenAI. Zuerst in den Genuss kommen zahlende Plus- bzw. Teams-Nutzer:innen, später sollen auch die User der Gratis-Version die Funktion bekommen.
Der Start der Suchfunktion wird generell als weiterer Großangriff auf Google gewertet. Google selbst hat ChatGPT bereits seinen eigenen Chatbot Gemini entgegen gestellt, der die Internetsuche schon länger beherrscht – insofern zieht OpenAI hier in der Funktionalität mit Google gleich.
Die Deals mit Medienunternehmen
Die Internet-Quellen, die ChatGPT in seinen Antworten nutzt, werden in einer rechten Spalte noch einmal gelistet. Über diese Snippets kommt man dann direkt zur Originalquelle, wo man den zitierten Inhalt dann in voller Länge lesen kann – von Google News und ähnlichen Diensten kennt man das ja bereits. Man hoffe, dass die Anbieter von Inhalten „neue Möglichkeiten erhalten, ein breiteres Publikum zu erreichen“, heißt es seitens OpenAI. „Wir hoffen, dass wir den Nutzern dabei helfen können, Verlage und Websites zu entdecken und gleichzeitig mehr Auswahl in die Suche zu bringen.“
OpenAI hat in den vergangenen Monaten in allen großen westlichen Kernmärkten (USA, Deutschland, Frankreich, Italien, Spanien, Großbritannien) jeweils ein oder mehrere Medienunternehmen offiziell als Partner genannt, von denen man News-Content beziehen will, und die im Gegenzug dafür, „geeignete Zitate und direkte Links“ sowie auch Geldbeträge und/oder Credits für die Nutzung von kostenpflichtigen OpenAI-Diensten in den Redaktionen erhalten. Folgende Medien wurden offiziell als Partner bestätigt.
- Associated Press (AP)
- Reuters
- Dotdash Meredith
- Le Monde
- Axel Springer (u.a. Business Insider, Bild, Welt, Politico)
- Vox Media (u.a. The Verge)
- Hearst (San Francisco Chronicle, Men’s Health, Cosmopolitan uvm.)
- GEDI ( L’Espresso, La Repubblica)
- Conde Nast (Vogue, QC, Glamour, New Yorker)
- Time
- The Atlantic
- News Corp (WSJ, New York Post, The Sun uvm.)
- Financial Times
- Prisa Media (El País)
Zahlreiche deutsche, österreichische und Schweizer Medien werden zitiert
Doch das bedeutet nicht, dass nicht auch der Content von vielen anderen Medien von ChatGPT durchsucht, verarbeitet, zitiert und verlinkt wird. Wie Trending Topics in einem ersten Check feststellen konnte, finden sich etwa Der Standard, Kleine Zeitung (Styria), ORF.at, Kurier.at, oe24.at, vienna.at (Russmedia), heute.at oder APA News sich sehr schnell als Quellen in den Antworten, die ChatGPT auf Fragen etwa zum aktuellen Stand der Koalitionsverhandlungen in Österreich gibt. Daneben zitiert der AI-Chatbot auch zahlreiche deutsche und Schweizer Medien, unter anderem ZDF, ARD, SFR, Stern, taz, BR, Tages-Anzeiger, Watson und einige mehr.
Laut OpenAI stünde es jedem Medium frei, seine Crawler von den eigenen Webseiten auszuschließen. Auch hier wird es kompliziert, denn es gibt verschiedene Content-Crawler. Zum einen gibt es den OAI-SearchBot, der gezielt nach Inhalten sucht, die er in der neuen Suchfunktion verwenden kann. Daneben gibt es noch den GPTBot, der ganz generell Inhalte zum Training der AI-Modelle von OpenAI crawlt. Beide Bots kann man über robots.txt-Tags von der eigenen Webseite aussperren.