Plagiate: So fahnden Sie online nach Text- und Bild-Kopien

Plagiate stellen im Internet ein großes Problem dar. Content wird gestohlen oder als eigener ausgegeben. Die folgenden Tools helfen Ihnen, Plagiate online leicht aufzustöbern.
In den schier unendlichen Weiten des Internets gibt es gigantische Mengen an Content. Dennoch lassen sich benötigte Informationen über eine Google-Suche in den meisten Fällen relativ leicht finden. Da überrascht es nicht, dass immer mehr Menschen keine eigenen Inhalte erstellen, sondern einfach Webcontent von Dritten übernehmen. Copy & Paste macht es möglich. Wenn der Content mit Quellenangaben versehen wird, ist das auch durchaus legitim. Von Content.iebstahl spricht man erst, wenn die Inhalte als die eigenen ausgegeben werden. Am häufigsten werden Informationen aus der Wikipedia übernommen, doch auch private Websites und Blogs bieten oft interessante Inhalte.
Vor allem zwei Gruppen von Personen fallen immer wieder als Plagiatoren auf. Zum einen sind das Schüler und Studenten, die sich auf diese Weise die Arbeit mit Hausaufgaben und Abschlussarbeiten erleichtern. Aber auch Doktoranden ziehen immer wieder Informationen aus dem Netz, ohne diese sachgerecht und mit Quellenangaben zu kennzeichnen. Einige dieser Personen beherrschen einfach nicht die richtigen Zitierregeln, andere wollen absichtlich täuschen und sich mit fremden Federn schmücken. Die zweite Gruppe, die immer wieder durch Plagiate auffällt, sind Website-Betreiber und Publisher. Diese wollen mit den gestohlenen Informationen schnell und kostengünstig Traffic für ihren Webauftritt generieren und dann mittels Werbung Geld verdienen.
RSS-Feeds machen es den Content.ieben besonders leicht, an nützliche Informationen und Inhalte zu gelangen. Ein solcher Feed sendet automatisch alle Artikel an den Dieb, sodass dieser sich nur noch bedienen muss. Für die Verfasser der Artikel sind vor allem die "professionellen" Content.iebe ärgerlich. Während im Bildungswesen gestohlene Inhalte bei Entdeckung lediglich dem Plagiator schaden, wird Duplicate Content (doppelter Webinhalt) von Google mit aller Macht verfolgt und bestraft. Hierunter leiden nicht nur die Plagiatoren, sondern auch die eigentlichen Verfasser der Inhalte.
Google für die Suche nach Plagiaten nutzen
Wer vermutet, dass die eigenen Webinhalte gestohlen werden oder dass die eigenen Schüler fremde Inhalte als eigene ausgeben, der kann sich über eine Google-Suche einen ersten Eindruck von der Situation verschaffen:
- Für Lehrende gibt es sogar die spezielle Suchmaschine Google Scholar. Ein verdächtiger Ausschnitt eines Artikels, der zum Beispiel nicht zum sonstigen Stil des Verfassers oder des Schülers passt, wird kopiert und in das Google-Suchfeld eingegeben.
- Hierbei ist wichtig, den Auszug in Anführungszeichen zu setzen, damit exakt nach der eingegebenen Wortfolge gesucht wird.
- Entscheidend ist zudem, einen Auszug zu wählen, der weder zu lang noch zu kurz ist. In den meisten Fällen genügt es, zwei bis drei aufeinanderfolgende Sätze, Überschriften oder Images einzugeben.
- Anschließend zeigt Google alle Ergebnisse an, in denen die eingegebenen Sätze in exakt dieser Wortfolge vorkommen.
- Hierbei handelt es sich um eine recht einfache Methode, die zum Auffinden gestohlener Webinhalte und zum Aufdecken von Betrügereien bei Schülerarbeiten gut geeignet ist.
- Allerdings verfügt Google über keine Batch-Suche und erkennt auch leichte Umstellungen der Wörter oder Veränderungen im Satzbau nicht.
- Wenn sich ein Content.ieb also die Mühe macht, den Inhalt leicht zu bearbeiten, funktioniert dieses Vorgehen nicht.
- Die Google-Suche eignet sich nur dazu, extrem dreisten Content.iebstahl aufzudecken. Wenn erfahrene Content.iebe überführt werden sollen, ist der Einsatz einer Plagiatsuchmaschine angeraten.
Plagiatfinder online einsetzen
Das Internet bietet eine ausgesprochen große Anzahl an Plagiatsuchmaschinen. Viele dieser Suchmaschinen sind für das Bildungswesen konzipiert und werden daher vorrangig von Lehrenden verwendet. Ein besonders beliebtes Tool ist in diesem Zusammenhang Turnitin. Der Vorteil bei solchen Suchmaschinen besteht darin, dass sie neben dem Internet auch Arbeiten und Bibliotheken hinsichtlich der Suchbegriffe untersuchen. Somit ist das Suchumfeld größer, und die Wahrscheinlichkeit, Plagiate aufzuspüren, steigt. Häufig ist ein solcher spezieller Service jedoch kostenpflichtig. Bei einigen Angeboten ist lediglich ein Log-In erforderlich, bei anderen fällt eine monatliche Gebühr an. Zu den kostenlosen Tools gehört beispielsweise plagiatefinder.de. Solche Plagiatsuchmaschinen nutzen mittels API Google für ihre Suche. Allerdings hat der Onlineriese im Mai 2016 die hierfür benötigte API deaktiviert, weswegen eine Vielzahl solcher Suchmaschinen aktuell nicht genutzt werden kann. Es gibt nur eine begrenzte Zahl an Plagiatsuchmaschinen mit eigener Suchroutine. Hierzu gehört zum Beispiel Copyscape. Dieses Tool prüft, ob Inhalte der eigenen Website irgendwo im Netz bereits vorkommen. Wenn allerdings ganze Inhalte überprüft werden sollen, ist der Webdienst PlagScan sehr empfehlenswert. Dieses Tool spürt Plagiate zuverlässig auf, ist allerdings nicht gratis zu erwerben.
Schwierigkeiten beim Einsatz von Plagiatsuchmaschinen
In den meisten Fällen lassen sich Plagiate mit den kostenpflichtigen Plagiatsuchmaschinen zuverlässiger aufspüren als mit einer Google-Suche. Das liegt unter anderem daran, dass Techniken wie Fingerprinting oder eine Bag-of-Words-Analyse zum Einsatz kommen. Diese entdecken nämlich nicht nur Quellen mit Plagiaten, sondern sind zusätzlich in der Lage, Plagiate zu entdecken, in denen Wörter oder Sätze geändert wurden. Allerdings bringt diese Art der Plagiatsuche ein Problem mit sich: Nur, wenn die Algorithmen professionell genug sind und die verfügbare Datenbank groß genug ist, werden brauchbare Ergebnisse erzielt. Ein Zugriff auf die Google-Dienste ist aufgrund der abgeschalteten API nicht mehr möglich und andere Suchmaschinen bieten keine APIs an oder verlangen hierfür Geld. Aus diesem Grund nutzen viele Anbieter eigene Tools.
Diese sind allerdings zumeist nicht in der Lage, alle relevanten Quellen aufzuspüren. Die Internetsuche läuft noch weitgehend passabel ab, eine Überprüfung von Büchern und Dokumenten bieten solche Lösungen jedoch nur in den seltensten Fällen. Prinzipiell sind solche Plagiatsuchmaschinen sinnvoll, Anwender müssen sich jedoch bewusst sein, dass nicht alle möglichen Quellen von Plagiaten überprüft werden. Das gilt zum Beispiel für unveröffentlichte wissenschaftliche Arbeiten, die irgendwo in irgendeiner Bibliothek stehen. Wurden aus einer solchen Arbeit Plagiate gezogen, lassen sich diese mithilfe technischer Hilfsmittel kaum ausfindig machen.
Plagiate mittels Plagiatsuchmaschinen tarnen
Im Allgemeinen ist nur ein Bruchteil der wissenschaftlichen Arbeiten, die vor 2005 erschienen sind, in digitaler Form erhältlich. Das liegt daran, dass nur die wenigsten Arbeiten nachträglich digitalisiert werden. Ist eine solche Arbeit also nicht in Buchform erschienen, kann sie von den Plagiatsuchmaschinen nicht auf Plagiate hin untersucht werden. Hier hilft den Lehrenden nur ihr gesunder Menschenverstand. Hinzu kommt eine beachtliche Zahl an Inhalten, die nicht öffentlich zugänglich sind. Hierzu zählen beispielsweise bestimmte Onlineportale, Websites für Hausarbeiten sowie offizielle Universitätsbibliotheken. Dementsprechend haben weder Suchmaschinen noch Plagiatfinder Zugriff auf solche Inhalte.
Ein weiteres Problem stellt die Tatsache dar, dass auch den Plagiatoren die Suchmaschinen und Plagiatfinder zur Verfügung stehen. Sie können mittels solcher Tools beispielsweise erkennen, ob sich ihre Plagiate im Web auffinden lassen. Tritt dieser Fall ein, passen sie die Plagiate einfach so lange an, bis die entsprechenden Tools diese nicht mehr finden. Nicht zuletzt sind Fremdsprachen ein großes Problem von Suchmaschinen. Wird ein Zitat einfach in eine fremde Sprache übernommen und nicht mit der entsprechenden Quelle versehen, ist das ebenfalls ein Plagiat. Die Sprachbarriere verhindert jedoch, dass solche Plagiate von den Suchmaschinen gefunden werden können.
Bilderdieben auf die Schliche kommen
Neben Textinhalten werden häufig Bilder kopiert und ohne Berechtigung genutzt. Solche gestohlenen Bilder lassen sich allerdings vergleichsweise leicht aufspüren. Das ist vor allem der Google-Bildersuche zu verdanken. Hier muss lediglich die Bild-URL oder das jeweilige Foto im Suchfeld eingegeben werden. Das ist über das Kamerasymbol mühelos möglich. Anschließend zeigt Google alle Quellen des öffentlichen Internets an, in denen sich das entsprechende Bild befindet. Allerdings werden die Suchergebnisse von Google nicht unbedingt übersichtlich angezeigt. Deswegen setzen viele Nutzer auf andere Anbieter, wenn sie ein Bildplagiat aufspüren wollen. Hierzu gehören zum Beispiel TinEye, ImageRaider, Karma Decay und Imagewiki. Ziel dieser Tools ist stets, dem Nutzer genau anzeigen zu können, wann und wo bestimmte Bilder kopiert wurden.
Sehr beliebt ist vor allem Imagewiki. Hier haben Nutzer die Möglichkeit zu prüfen, ob Bilddateien mit Urheberinformationen versehen sind. Das ist selbst dann noch möglich, wenn ein Bild bereits verlinkt und geteilt wurde. Dadurch haben beispielsweise Fotografen die Möglichkeit, ihre Bilder selbst dann zu schützen, wenn sie diese in ihrem eigenen Blog nicht mit Kopierschutzmaßnahmen versehen haben. Durch die Aufnahme in den Katalog von Imagewiki können die Bilder stets bis zum Urheber zurückverfolgt werden. Zu beachten ist dabei jedoch, dass es sich bei Imagewiki um ein unterstützendes Tool und um keine "offizielle" Datenbank handelt. Die Ergebnisse sind für viele Fotografen dennoch eine große Hilfe. Wenn allerdings tatsächliche Plagiate von Bildern aufgespürt werden sollen, sind TinEye und ImageRaider besonders zweckdienlich. Indessen ist die Erfolgschance solcher Algorithmen meist stark eingeschränkt. Wenn ein Bild zum Beispiel wegen eines bestimmten Javascripts nicht bei den Suchmaschinen auftaucht, wird es entsprechend auch nicht in der Bildersuche angezeigt.
Fazit: Bei der Suche nach Plagiaten gibt es nach wie vor kein Allheilmittel
Insgesamt lässt sich feststellen, dass der Erfolg von Plagiatfindern massiv davon abhängt, wie gut die Technik ist, die dem jeweiligen Tool zugrunde liegt. Den Suchmaschinen sind klare Grenzen gesetzt, was unter anderem auf die Trennung von Online- und Offline-Bereich sowie auf das häufig nicht frei zugängliche Deep Web zurückzuführen ist. Dementsprechend können auch Plagiatsuchmaschinen nicht auf alle verfügbaren Quellen zurückgreifen. Durch den Einsatz von Tools wie PlagScan lassen sich zwar alle indizierbaren Quellen anzeigen, jedoch werden hierdurch nicht alle Inhalte erfasst, und dementsprechend wird nur ein Bruchteil der möglichen Ergebnisse angezeigt. Das bedeutet, dass die Plagiatsuchmaschinen bei der Aufdeckung von Plagiaten in Schüler- und Studentenarbeiten oder bei unzulässigen Übernahmen von Webinhalten gute Dienste leisten. Im wissenschaftlichen Bereich hingegen lassen sich Plagiate jedoch häufig nur durch ein fundiertes Hintergrundwissen aufspüren. Das ist ein Grund dafür, dass viele Universitäten bereits heute eigene Plagiatsuchdienste einsetzen. Doch auch diese Dienste haben mit den genannten Problemen zu kämpfen