Lobby

OpenAI will ungehindert Daten scrapen, um mit chinesischer AI mithalten zu können

Jakob Steinschaden,

co-written by Newsrooms.AI14. März 2025, 09:51

OpenAI-Logo. © Ishmael Daro (CC BY 2.0)

Startup Interviewer: Gib uns dein erstes AI Interview

Der ChatGPT-Macher OpenAI fürchtet um die so wichtigen Trainingsdaten für seine künftigen AI-Modelle. Aus einem Dokument, das an die US-Regierung adressiert ist, geht nun hervor, wie das milliardenschwere KI-Startup gegen strenge Copyright-Regeln vorgeht. Denn klar ist: OpenAI musste und muss weite Teile der im Internet verfügbaren Texte, Bilder und Videos scrapen, um an Material fürs KI-Training zu kommen. Chris Lehane, OpenAIs Global Affairs-Chef, macht deswegen Druck. OpenAI würde gegen chinesische KI-Unternehmen in Rückstand geraten, wenn es nicht weiter Daten ungehindert scrapen könne.

Lehane argumentiert für die Anwendung der amerikanischen “Fair Use”-Doktrin auf KI-Training. Er betont, dass die Modelle nicht urheberrechtlich geschützte Werke replizieren würden, sondern aus ihnen lernen und Muster extrahieren, um etwas grundlegend Neues zu schaffen. Diese Vorgehensweise stehe im Einklang mit den Kernzielen des Urheberrechts und habe wesentlich zur Führungsposition der USA in der KI-Entwicklung beigetragen, indem sie Innovation und Investitionen fördere.

Probleme in der EU und UK zu erwarten

In der Europäischen Union sieht OpenAI problematische Entwicklungen durch die Einführung von “Text- und Data-Mining-Ausnahmen” mit breiten “Opt-out”-Möglichkeiten für Rechteinhaber. Dies führe zu einer unvorhersehbaren Verfügbarkeit wichtiger KI-Trainingsdaten und behindere die Innovation, besonders für kleinere Unternehmen mit begrenzten Budgets. Ähnliche Bedenken äußert OpenAI bezüglich Großbritanniens, wo die Regierung erwägt, Rechteinhabern die Möglichkeit zu geben, ihre Rechte vorzubehalten, was ähnliche regulatorische Hürden schaffen würde.

OpenAI verbindet die Copyright-Frage explizit mit nationaler Sicherheit und Wettbewerbsfähigkeit. Das Unternehmen warnt, dass Chinas KI-Entwickler wahrscheinlich ungehinderten Zugang zu Daten haben werden, während amerikanische Unternehmen ohne “Fair Use”-Zugang ins Hintertreffen geraten könnten. Dies würde nach Ansicht von OpenAI nicht nur die amerikanische Führungsrolle gefährden, sondern auch den Erfolg “demokratischer KI” beeinträchtigen.

Als Lösungsansatz schlägt OpenAI vor, dass die US-Regierung internationale Diskussionen zum Urheberrecht aktiv mitgestaltet, den Datenzugang für amerikanische KI-Unternehmen sicherstellt, mehr Zugang zu Regierungsdaten fördert und in politischen Debatten und Rechtsstreitigkeiten eingreift, wenn grundlegende innovationsfördernde Prinzipien gefährdet sind. OpenAI betont, dass generative KI-Modelle die nächste Innovationsgrenze darstellen und unter dem Schutz bewährter Urheberrechtsprinzipien die amerikanische Technologieführerschaft stärken werden.