Meta wird bald Daten europäischer User für KI-Training verwenden

Nach dem Debakel rund um sein neues KI-Modell Llama 4 (Trending Topics berichtete) setzt Meta nun auch in der EU alles daran, um an mehr Daten von Nutzern zu gelangen. Meta hat soeben angekündigt, seine KI-Modelle mit öffentlichen Inhalten europäischer Nutzer zu trainieren – also von Usern, die Instagram, Facebook oder Messenger versenden. WhatsApp-Daten würden nicht verwendet werden, heißt es.
Das Unternehmen wird öffentliche Beiträge und Kommentare von erwachsenen Nutzern auf seinen Plattformen sowie Interaktionen mit Meta AI für das Training seiner Modelle verwenden. Die Maßnahme folgt auf die kürzliche Einführung von Meta AI in Europa, das etwa bei Instagram integriert ist und das Chatten mit dem KI-Chatbot via Direktnachrichten ermöglicht.
OpenAI und Google machen es ja auch
Meta begründet diesen Schritt mit der Notwendigkeit, KI-Systeme zu entwickeln, die speziell auf europäische Nutzer zugeschnitten sind. Das Unternehmen argumentiert, dass seine generativen KI-Modelle mit vielfältigen Daten trainiert werden müssen, um die Nuancen und Komplexitäten europäischer Gemeinschaften zu verstehen. Dies umfasst Dialekte, Umgangssprache, lokales Wissen und länderspezifische Verwendung von Humor auf den Meta-Plattformen.
In seiner Ankündigung verweist Meta explizit auf andere Technologieunternehmen wie Google und OpenAI, die bereits Daten europäischer Nutzer für das Training ihrer KI-Modelle verwendet haben. „Wir folgen dem Beispiel von Google und OpenAI, die beide bereits Daten von europäischen Nutzern für das Training ihrer KI-Modelle verwendet haben“, heißt es seitens Meta.
Das Unternehmen betont, dass seine Vorgehensweise transparenter sei als die vieler Branchenkollegen. Das Unternehmen folgt damit einem in der Technologiebranche etablierten Muster, wird jedoch nach eigener Darstellung offener über den Prozess informieren.
Datenschutzmaßnahmen und regulatorische Konformität
Meta hat mehrere Schutzmaßnahmen implementiert. Private Nachrichten zwischen Freunden und Familienmitgliedern werden nicht für das Training der generativen KI-Modelle verwendet. Zudem werden keine öffentlichen Daten von EU-Nutzern unter 18 Jahren für Trainingszwecke genutzt.
Nutzer in der EU werden per App und E-Mail über die geplante Datennutzung informiert und erhalten einen Link zu einem Formular, mit dem sie der Verwendung ihrer Daten widersprechen können („Opt-out“). Meta verspricht, diese Widerspruchsformulare zu respektieren.
Das Unternehmen hatte im vergangenen Jahr das Training seiner Large Language Models mit öffentlichen Inhalten ausgesetzt, während Regulierungsbehörden die rechtlichen Anforderungen klärten. Nach eigenen Angaben begrüßte Meta die im Dezember vom Europäischen Datenschutzausschuss (EDPB) abgegebene Stellungnahme, die bestätigte, dass der ursprüngliche Ansatz des Unternehmens den rechtlichen Verpflichtungen entspricht.