Startup entdeckt versteckte Markierungen in Texten von OpenAI o3 und o4 mini

Die neuesten Modelle von OpenAI, o3 und o4 mini, hinterlassen offenbar unsichtbare Wasserzeichen in ihren Texten. Dies geht aus einer aktuellen Untersuchung des auf künstliche Intelligenz spezialisierten Startups Rumi hervor. Die Wasserzeichen bestehen aus speziellen Unicode-Zeichen, die mit bloßem Auge nicht von regulären Leerzeichen zu unterscheiden sind.
„Unsere Tests zeigen, dass die neueren und fortschrittlicheren GPT-o3 und o4-mini Modelle spezielle Zeichen-Wasserzeichen in generierten Texten einbetten“, erklärt das Forschungsteam von Rumi. Die Markierungen treten vor allem bei längeren Antworten auf, beispielsweise wenn die KI aufgefordert wird, einen ausführlichen Essay zu verfassen. Bei Rumi handelt es sich um ein US-Startup, das Universitäten dabei hilft, AI-Tools für Studierende und Lehrende sinnvoll einzusetzen – und rät von der Verwendung (oft fehlerhafter) KI-Detektoren ab.
Bei den entdeckten Wasserzeichen handelt es sich hauptsächlich um sogenannte „Narrow No-Break Spaces“ (NNBSP, Unicode U+202F), die wie normale Leerzeichen aussehen, aber einen anderen ASCII-Code haben. Ältere Modelle wie GPT-4o scheinen diese Funktion nicht zu verwenden.
Nachweis und Entfernung
Die versteckten Zeichen können durch Einfügen des Textes in spezielle Online-Tools oder Code-Editoren wie Sublime Text oder Visual Studio Code sichtbar gemacht werden. Die Anordnung dieser Zeichen folgt einem systematischen Muster, was auf eine bewusste Implementierung durch OpenAI hindeutet.
Laut Rumi ist die Entfernung dieser Wasserzeichen allerdings relativ einfach: „Sobald Nutzer über diese Funktion Bescheid wissen, kann eine einfache Suchen-und-Ersetzen-Operation diese speziellen Zeichen entfernen“, so die Experten des Startups.
Vor- und Nachteile des Wasserzeichenverfahrens
Die Entdeckung kommt zu einem brisanten Zeitpunkt. ChatGPT ist derzeit für Studenten kostenlos verfügbar, und viele werden die KI vermutlich für ihre Abschlussarbeiten und Projekte nutzen. Rumi weist auf eine problematische Dynamik hin: „Studenten, die sich dieser unsichtbaren Marker nicht bewusst sind und ChatGPT-generierte Inhalte direkt kopieren, könnten Konsequenzen gegenüberstehen. Gleichzeitig werden Studenten, die von dieser Änderung wissen, einen erheblichen Vorteil haben, was die Ungleichheit bei der Bewertung von KI-Nutzung im Bildungsbereich weiter verschärft.“
Im Gegensatz zu KI-Detektoren, deren Genauigkeit oft zu wünschen übrig lässt, bietet dieser Ansatz einen eindeutigen Nachweis für aus ChatGPT kopierte Texte. Die Wahrscheinlichkeit von Falschbeschuldigungen ist praktisch null, da Studenten solche speziellen Unicode-Zeichen normalerweise nicht in akademischen Arbeiten verwenden würden.
„Der Hauptnachteil ist, dass dies wahrscheinlich nur eine vorübergehende Maßnahme ist“, erklärt Rumi. „Studenten werden schnell von der Methode erfahren und können sie leicht umgehen, indem sie Tools verwenden, um alle Wasserzeichen durch Standardzeichen zu ersetzen.“
Langfristige Lösungsansätze
Statt auf leicht zu umgehende Wasserzeichen zu setzen, plädiert Rumi für einen prozessorientierten Ansatz: „Wir befürworten einen prozessorientierten Ansatz für studentisches Schreiben, der die Entwicklung von Ideen durch mehrere Entwürfe verfolgt, anpassbare KI für Aufgaben einbezieht und die Reflexion über Forschungs- und Schreibentscheidungen betont“, so das Unternehmen.
OpenAI hat bisher keine offizielle Stellungnahme zu dieser Funktion abgegeben. Experten vermuten, dass das Unternehmen die Funktion möglicherweise vollständig entfernen könnte, sollte das Thema breite Aufmerksamkeit erlangen – ähnlich wie es beim Abschalten des eigenen KI-Detektors aufgrund von Ungenauigkeiten geschah.