KI-Fallen: So schützt Du Deine Daten
KI-Fallen im Internet: So schützt Du Deine Daten
KI-generierte Beiträge überschwemmen das Internet. Oft werden von den Chatbots urheberrechtswidrig private Daten verwendet. Hier erfährst Du, wie man das verhindert.
Die Möglichkeiten der Künstlichen Intelligenz wachsen exponentiell und es ist derzeit zu beobachten, dass das Internet, insbesondere die Sozialen Medien, von KI-generierten Beiträgen überschwemmt wird. Leider ist ein weiterer Trend unbestreitbar: Hersteller der KI-Beiträge missachten häufig das Urheberrecht privater Nutzer und verwenden hemmungslos deren Daten, um die KI-Chatbots zu trainieren und Content zu kreieren.
Google, Open AI, Microsoft und Meta sammeln systematisch Daten im Internet und verwenden diese für die Entwicklung ihrer Chatbots. Wenn Du also Fotos, Videos oder Texte postest, besteht die Gefahr, dass Deine Daten im Rechenzentrum eines dieser Chatbot-Entwickler landen.
Die Künstliche Intelligenz nutzt Wahrscheinlichkeitsberechnungen, um Antworten zu generieren und wird mit Inhalten aus dem Internet trainiert. Dabei geht es meist um das Erkennen von Abfolgen bestimmter Wörter. Sogenannte KI-Crawler, die das Internet ununterbrochen auf der Suche nach Daten für die KI durchforsten, verfolgen das Ziel, möglichst viele Daten zu sammeln. Mit diesen Daten wird die KI gefüttert, sodass die Modelle immer genauer und korrekter auf Anfragen reagieren.
Leider geht es den Entwicklern zunächst nur um die Optimierung der technischen Aspekte, denn je besser die KI funktioniert, desto größer wird der eigene Marktanteil. Die rechtliche Seite wird oft vernachlässigt. Auf das Urheberrecht derjenigen, die diese Webinhalte produziert haben, wird keine Rücksicht genommen. Die KI bedient sich somit ohne Gegenleistung. Es ist den großen Tech-Firmen gelungen, die Bezahlung von Texten zu verweigern, obwohl diese Basis ihrer Geschäftsmodelle sind.
Aus diesem Grund haben verschiedene Verwerter wie Zeitungen und Verlage rechtliche Schritte eingeleitet, damit die juristische Grauzone geklärt wird. Bisher gibt es keine allgemein gültigen Gerichtsurteile oder Gesetze.
Verbraucherzentrale Nordrhein-Westfalen klagt gegen Meta
Die Verbraucherzentrale NRW hat per Eilantrag Klage gegen Meta, den Mutterkonzern der Facebook-Gruppe, eingereicht. Grund dafür war, dass Meta zuvor erklärt hatte, ab Mai 2025 mit den Daten aller Instagram- und Facebook-Nutzer die Meta-KI zu trainieren. Das bedeutet nicht weniger, als dass sich Meta an sämtlichen Texten, Kommentaren, Videos, Einträgen, Posts, Reaktionen, Likes und Fotos bedienen wollte. Einzige Prämisse war, dass es sich um öffentliche Inhalte handelt, der jeweilige Nutzer es also versäumt hat, die Profileinstellungen so anzupassen, dass nur die eigenen Kontakte Zugriff haben. Eine weitere Einschränkung besteht darin, auf die Verwendung von Daten minderjähriger Nutzer zu verzichten.

Leider scheiterte das Eilverfahren beim Verwaltungsgericht Köln. Dieses bezog sich bei seiner Entscheidung auf die rechtliche Einordnung des Falls durch die Datenschutzbehörde Irlands, deren Zuständigkeit Meta in Europa unterliegt. Nach Einschätzung der irischen Datenschutzbehörde lässt sich die Vorgehensweise des Sammelns von Daten zum Zwecke des KI-Trainings durchaus mit dem EU-Recht vereinbaren.
Facebook- und Instagram-User konnten der Nutzung ihrer Daten nur bis zum 26.05.2025 widersprechen. Hast Du diese Frist versäumt? Dann sind Deine Daten mittlerweile Teil des Meta-KI-Netzes. Es ist unmöglich, persönliche Daten nachträglich herauszufiltern. Du kannst allerdings der Nutzung von Daten widersprechen, die du künftig bei Instagram oder Facebook eingibst. Verwende dafür die jeweiligen Formulare auf Facebook oder Instagram.
Was geschieht mit Daten bei WhatsApp?
Der Messenger-Dienst WhatsApp ist ebenfalls Teil des Meta-Konzerns. Dort werden jedoch keine Daten zum Zwecke des KI-Trainings gesammelt. Alle Chats sind zuverlässig per Ende-zu-Ende-Verschlüsselung geschützt. Meta kann darauf nicht zugreifen. Sendest Du jedoch Anfragen an die Meta-AI, werden diese wiederum ausgewertet und die Daten gesammelt.
Problematisch ist in diesem Zusammenhang, dass man den blau-violetten Kreis (Symbol der Meta AI) weder deaktivieren noch entfernen kann. Wenn Du die Sammlung Deiner Daten verhindern willst, solltest Du das Symbol nicht antippen und auf die Nutzung dieser Funktion verzichten.
Wie kannst Du Deine weiteren Social-Media-Accounts schützen?
Der Meta-Konzern ist zwar ein mächtiger Player im Run um KI-Vorherrschaft, aber auch andere Social-Media-Dienste sehen die Potenziale, die sich in massenhaften Privatdaten verbergen.

Besonderes Augenmerk solltest Du dabei auf X (Twitter-Nachfolger) richten. Dieser Dienst verwendet ebenfalls öffentlich gepostete Daten, um damit Grok, den xAI-Chatbot, zu trainieren. Aber keine Sorge, Du kannst auch in diesem Fall der Nutzung Deiner Daten widersprechen.
Gehe dabei wie folgt vor:
- Öffne das X-Menü
- Gehe auf „Mehr”
- Wähle dort „Einstellungen und Datenschutz”
- Klicke auf „Datenschutz und Sicherheit”
- Wähle den Punkt „Grok und unabhängige Kooperationspartner”
- Lösche das Zustimmungs-Häkchen bei der Einstellung „Erlauben, dass deine öffentlichen Daten sowie deine Interaktionen, Eingaben und Ergebnisse bei Grok und xAI für Training und Feinabstimmung herangezogen werden”.
An dieser Stelle sind außerdem zwei weitere Optionen vorgesehen, die jedoch inaktiv sind und auch nicht aktiviert werden sollten. Die beiden Kontrollkästen dürfen nicht ausgefüllt sein.
Wie sieht es bei LinkedIn aus?
Dieses soziale Netzwerk geht grundsätzlich anders vor und vermeidet weitgehend die Nutzung privater Userdaten. Dennoch solltest Du auch dort die Einstellungen überprüfen:
- Klicke in der Menüleiste auf Dein Profilbild
- Jetzt im Bereich „Einstellungen” „Datenschutz” auswählen
- Dort „Daten zur Verbesserung generativer KI” anklicken

Hier erfährst Du, dass LinkedIn keine Nutzerdaten für das KI-Training verwendet. Diese Seite verschwindet jedoch, wenn man sie erneut aufruft und erscheint erst wieder nach vorherigem Aus- und Einloggen.
Verwenden TikTok und YouTube Deine Daten für das KI-Training?
Selbstverständlich setzt auch TikTok Künstliche Intelligenz ein. Mit dieser Technologie werden die Video-Feeds auf die User zugeschnitten. Darüber hinaus verwendet die Firma ByteDance, die hinter TikTok steht, ihrerseits Nutzerdaten für das KI-Training, geht aber nicht transparent damit um, in welcher Form und in welchem Ausmaß dies geschieht. Leider ist in der TikTok-App auch keine Option vorhanden, der Nutzung privater Daten zu widersprechen.
YouTube verwendet ebenfalls Methoden des maschinellen Lernens, um seinen Nutzern personalisierte Vorschläge zu machen und Videos zu empfehlen, aber auch um Verstöße gegen das Urheberrecht aufzudecken und Untertitel zu erzeugen. Bei YouTube ist es ebenfalls unmöglich, der Datennutzung zu widersprechen. Wenn Du nicht möchtest, dass Dein Nutzerverhalten in die KI einfließt, solltest Du Videos nicht gelistet oder ausschließlich privat hochladen. Damit lässt sich zumindest das Risiko minimieren, dass Deine Daten im KI-Pool landen.
Was solltest Du im Hinblick auf Datenschutz bei KI-Anfragen beachten?
Viele Nutzer verwenden Chatbots wie ChatGPT, um Bewerbungen oder andere Anschreiben zu formulieren. Dabei ist es unvermeidbar, der KI private Daten zu übermitteln. Doch es gibt eine Möglichkeit, das Weiterleiten privater Details in den Datenpool zu verhindern.
Der Software-Entwickler Frank Börncke generierte zu diesem Zweck das Open-Source-Tool „Private Prompts”, mit dessen Hilfe Deine privaten durch erfundene Daten substituiert werden. Dein Name, Deine Adresse sowie andere sensible Daten wie Kontonummern oder Telefonnummern werden überschrieben und können dementsprechend nicht von der KI verwendet werden.

Definiere bei jeder Anfrage, welche Deiner Angaben automatisiert durch andere ersetzt werden. Danach formulierst Du Deinen Prompt und klickst dann auf „Mask”. Die Software ersetzt nun die fraglichen Angaben. Kopiere und anschließend den Prompt und füge diesen in die Maske des Chatbots ein.
Nachdem der Chatbot eine Antwort generiert hat, kopierst Du diese in das Open-Source-Tool, wählst „Unmask” und der Prozess des Einsetzens anderer Daten wird rückgängig gemacht. Zusätzlich bietet diese nützliche Software einen Prompt-Manager für die Verwaltung oft genutzter Prompts.
Private Prompts: Open-Source-Tool zur Maskierung privater Daten
Nahezu auf jedem PC oder Notebook ist mittlerweile ein KI-Tool wie ChatGPT installiert und diese Modelle benötigen Daten, um zu lernen und sich weiterzuentwickeln. Es ist nicht verwunderlich, dass sogar private Websites ins Visier der KI-Crawler geraten. Doch auch davor kann man sich schützen.
Zu diesem Zweck solltest Du die Crawler dieser Anwendungen in die Datei „robots.txt” aufnehmen, welche sich im Stammverzeichnis der Website befindet. Die Datei hatte ursprünglich das Ziel, Suchmaschinen-Crawler darüber zu informieren, welche Bereiche in den Index übernommen werden und welche privat bleiben.

Diese Funktion wurde ausgeweitet, sodass auch die Crawler von ChatGPT & Co. adressiert werden. Auf diese Weise unterbindest Du die Nutzung Deiner Website-Daten. Dafür musst Du bei „robots.txt” für jedes KI-Modell die Erlaubnis zur Datennutzung entziehen. Zwischen den einzelnen Befehlen ist jeweils eine Leerzeile erforderlich. Der technische Fortschritt der KI-Modelle schreitet jedoch unaufhaltsam voran und einige KI-Modelle enthalten Programmierungen, damit derartige Verbote ignoriert werden.
Eine bessere Methode des Datenschutzes besteht darin, die IP-Adressbereiche der verschiedenen Crawler zu sperren. Das scheitert allerdings daran, dass die KI-Modelle, bis auf Open AI, ihre IPv4-Adressen geheim halten.

Ausweg: Rate Limiting
Diese Option bietet zumindest einen gewissen Schutz vor dem Abgreifen privater Daten. Fragt eine bestimmte Quelle zu häufig nach Daten, wird nur eine limitierte Anzahl an Anfragen beantwortet.
Anfragen-Texte effektiv schützen
Nicht nur die Website-Inhalte sind Ziel der Chatbots, sondern auch die Anfragen-Texte, mit denen sich User an das KI-Modell wenden. Dieses Problem ist nicht gänzlich vermeidbar. Du kannst jedoch die Generierung eines persönlichen Profils auf Basis der Anfragen unterbinden.
Am sichersten gelingt das, wenn Du ausschließlich KI-Modelle nutzt, bei denen Du Dich nicht registrieren musst. Das ist bei den folgenden Chatbots möglich:
- ChatGPT
- Le Chat
- Meta AI
- Perplexity
Darüber hinaus ist es empfehlenswert sicherzustellen, dass man sich im Inkognito- oder im Inprivate-Modus des Browsers befindet, wenn man die KI etwas fragt.
Was bietet Microsoft Copilot in Sachen Datenschutz?
Microsoft stellt mit dem KI-Modell Copilot einen Chatbot zur Verfügung, der in die anderen Anwendungen wie Excel, Powerpoint und Word integriert und daher sehr benutzerfreundlich ist. Viele User verwenden Microsoft Copilot, um sich beim Erstellen von E-Mail-Antworten, Briefen oder Texten in Präsentationen unterstützen zu lassen.

Copilot benötigt dafür den Zugriff auf die Inhalte von Texten, Briefen und E-Mails. In den meisten Unternehmen gilt jedoch, dass firmeninterne Korrespondenzen und Dokumente vertraulich sind und somit nicht nach außen gelangen dürfen.
Um eine Nutzung von Microsoft Copilot auch im geschäftlichen Kontext zu ermöglichen, hat Microsoft eine umfassende Erklärung hinsichtlich des Datenschutzes generiert und versichert, dass alle Daten verschlüsselt verwendet und niemals für das KI-Training der Anwendung hinzugezogen werden. Ein zusätzlicher Schutz besteht darin, dass sämtliche Daten innerhalb der EU bleiben und den strengen europäischen Datenschutzgesetzen unterliegen.
Wofür nutzt Meta Deine Daten?
Wie oben geschildert benötigt Meta massenhaft Daten, um die KI-Modelle zu trainieren und sich eine führende Position im hart umkämpften Wettbewerb auf dem Gebiet der Künstlichen Intelligenz zu sichern.
Deshalb ist Meta bestrebt, möglichst viele User-Daten der Social Media Dienste Facebook und Instagram zu nutzen. Du fragst Dich, auf welche Weise Deine Daten für das KI-Training verwendet werden?
- Alle Textnachrichten oder Kommentare sind Beispiele für den Sprachgebrauch und damit geeignet, die KI dahingehend zu trainieren. KI-Modelle verbessern dadurch die Formulierungen, sodass sich Antworten grammatikalisch nicht von Sätzen menschlicher Nutzer unterscheiden. Ein weiterer Aspekt betrifft das Erfassen von emotionalem Subtext, sodass die KI sogar erkennt, ob mit dem Text eine negative oder positive Stimmung vermittelt wird.
- Zusätzlich dient das KI-Training dazu, die Nutzerprofile zu optimieren. Dafür werden Texte, Antwortverhalten wie die Schnelligkeit der Reaktionen und andere persönliche Nutzergewohnheiten analysiert. Die KI lernt, das Verhalten der User zu deuten, Interessen zu verstehen und sogar Vorhersagen zu treffen. Du erhältst also nicht ohne Grund Werbung und andere Inhalte, die perfekt auf Dein Profil abgestimmt sind.
- Mit Foto- und Videomaterial wird wiederum die Gesichtserkennung der KI trainiert. Außerdem dienen Bilder und Videos dazu, die Bilderstellung-Funktionen der KI selbst zu perfektionieren.