Neue Google-Datenschutzrichtlinien: Die KI darf künftig mit unserem Content lernen
Google hat die eigenen Datenschutzrichtlinien geändert – damit die eigene KI fleißig lernen kann. Die Richtlinien besagen nun explizit, dass das Unternehmen das Recht hat, so ziemlich alles zu sammeln und zu analysieren, was Menschen im Internet teilen. Gut möglich also, dass Bard (so heißt die Google-KI) künftig auch mit Kalendereinträgen, Google-Doc-Texten oder E-Mails der Nutzer:innen lernt.
Trainieren mit öffentlichen Quellen
Einige Abschnitte der Datenschutzrichtlinie sollen sich laut Techspot geändert haben: Zuvor hieß es, dass die Daten der Menschen zur Schulung von Sprachmodellen verwendet werden, wobei aber nur Google Translate erwähnt wurde. In der aktualisierten Version ist die Rede von „KI-Modellen“, sie nennt speziell Bard und Cloud AI neben Translate (frei übersetzt): „Wir können Informationen sammeln, die öffentlich online oder aus anderen öffentlichen Quellen verfügbar sind, um Googles KI-Modelle zu trainieren und Produkte und Funktionen wie Google Translate, Bard und Cloud-KI-Fähigkeiten zu entwickeln.“ Nicht final geklärt ist, was „öffentliche Quellen“ sind und wie diese genutzt werden dürfen.
Streit um Urheberrecht und Datenschutz
So soll etwa auch ChatGPT mit tausenden Wikipedia-Einträgen „gelernt“ haben. Dieser Umstand traf damals schon nicht auf allzu viel Gegenliebe, bei persönlichen Daten ist – zumindest in Europa – das Spaß dann aber wirklich schnell vorbei: Italien hatte etwa Ende März bekanntgegeben, dass die Datenschutzbehörde ChatGPT wegen der Sammlung personenbezogener Daten sowie fehlenden Alterskontrollen sperrt. „ChatGPT muss gestoppt werden, bis es die Datenschutzbestimmungen einhält. Die italienische Datenschutzbehörde hat mit sofortiger Wirkung die vorläufige Einschränkung der Verarbeitung der Daten italienischer Nutzer gegenüber OpenAI, dem US-Unternehmen, das die Plattform entwickelt und verwaltet, angeordnet. Gleichzeitig hat die Behörde eine Untersuchung eingeleitet“, hieß es damals.
OpenAI hat auch mit einer Klage wegen Urheberrechtsverletzung und Verletzung der Privatsphäre zu kämpfen, das Unternehmen soll urheberrechtlich geschützte Bücher ohne Genehmigung zur Schulung seiner KI-Systeme verwendet haben. Getty Images wiederum verklagte bereits Anfang des Jahres Stable Diffusion. Der Vorwurf: Eine „dreiste Verletzung des geistigen Eigentums von Getty Images in einem atemberaubenden Ausmaß“ (wir haben berichtet).