Introduction
Introduction Statistics Contact Development Disclaimer Help
# taz.de -- Student entwickelt KI, die KI erkennt: Entlarvende Logik
> Tim Tlok aus Seevetal hat einen Detektor gebaut, der KI-generierte Texte
> von menschengemachten unterscheiden kann. KI-geplagte Lehrkräfte freuen
> sich.
Bild: Hat fünf Monate lang fast jeden Tag am KI-Detektor gearbeitet: Tim Tlok
Osnabrück taz | Haben Sie sich schon mal gefragt, ob der Text, den Sie
gerade lesen, von einem Menschen oder von einer KI geschrieben wurde? Seit
einigen Jahren sind sogenannte Large Language Models (LLM) immer
erfolgreicher darin, menschengemachte Texte zu imitieren. Das bekannteste
LLM ist ChatGPT.
Das menschliche Auge kann kaum noch unterscheiden, ob ein Text menschlich
ist oder nicht. Deshalb wird parallel an sogenannten KI-Detektoren
geforscht. Also an künstlicher Intelligenz, die [1][künstliche Intelligenz]
überführt. Der Student Tim Tlok hat im Rahmen seiner Masterarbeit an der
Fachhochschule Wedel einen solchen KI-Detektor gebaut, der mit
deutschsprachigen Texten trainiert wurde.
Als Tlok Ende 2022 ein Thema für seine Masterarbeit suchte, fiel ihm auf,
dass KI-Detektoren nur im englischsprachigen Raum erforscht sind. „Das ist
ein Problem, denn LLM können in nahezu jeder Sprache Texte generieren, aber
Detektoren nur englische KI-Texte zuverlässig entlarven“, sagt Tlok.
Dass niemand zuvor einen Detektor für deutschsprachige KI-Texte gebaut hat,
versteht Tlok selbst nicht. Wahrscheinlich liege es daran, dass man die
Daten, mit denen man den Detektor trainiert, selbst zusammenstellen und
erzeugen muss, glaubt der 25-Jährige. Er trainierte seinen Detektor mit
jeweils 70.000 KI-generierten und menschlich gemachten Texten.
## Zuverlässigkeit von 98 Prozent
Für die menschlich gemachten Texte nutzte er öffentlich zugängliche
wissenschaftliche Datenbanken von Hochschulen, Reddit-Einträge, Tweets und
frei zugängliche Zeitungsartikel. Er achtete darauf, dass die Texte
verschiedene Längen hatten und aus verschiedenen Genres stammten, also zum
Teil spontan, zum Teil intensiv redigiert veröffentlicht wurden, um eine
möglichst breite Datenbasis zu haben.
Für die KI-generierten Texte schrieb er acht Anweisungsvorlagen für
ChatGPT, zum Beispiel: „Schreibe mir einen Zeitungsartikel zum Thema X“
oder: „Schreibe mir einen besonders menschlich wirkenden Tweet“. Diese
Vorlagen führte sein Computer aus, dafür lief er Tag um Nacht. „Meiner
Stromrechnung geht es zum Glück trotzdem gut“, sagt Tlok und lacht.
Ab und zu ging er zum Sport oder traf Freunde, aber fünf Monate lang gab es
für ihn nur die Arbeit am Detektor. Sieben Tage die Woche saß er am PC in
seiner Wohnung in Seevetal in Niedersachsen. „Ich bin schon sehr
ehrgeizig“, sagt er und schmunzelt. Auch seine Mutter sei sehr stolz
gewesen, als es im September plötzlich auf das Masterzeugnis auch noch
einen Innovationspreis obendrauf gab.
Der Detektor hat nach Angaben der Hochschule eine Zuverlässigkeit von 98
Prozent, das stimmt Tlok zuversichtlich. „In meinen Augen wird es immer
möglich sein, KI-generierte Texte zu erkennen“, sagt er. Die Funktionsweise
ist sehr durchschaubar. Vereinfacht gesagt ist die Logik von LLM, dass
immer das wahrscheinlichste Wort an das vorangegangene angereiht wird.
Selbst bei vermeintlich berechenbaren Texten wie [2][Nachrichtenmeldungen]
hat sein Detektor gute Erfolgsquoten. „Wir Menschen sprechen mit
unwahrscheinlicheren Worten, als uns bewusst ist“, sagt er.
Mit seinem Detektor macht Tlok sich jetzt selbstständig, denn das Interesse
ist groß. „Ich treffe da einen Nerv der Zeit“, sagt er. Hochschulen wollen
prüfen, ob Studierende ihre [3][Hausarbeiten selbst schreiben].
Plagiatsprüfer*innen wollen ihren Service um KI-Prüfung erweitern.
Und Berufsschullehrer rufen Tlok an, weil sie überprüfen wollen, ob
Schüler*innen ihre [4][Hausaufgaben wirklich selbst gemacht haben].
26 Feb 2024
## LINKS
[1] /Schwerpunkt-Kuenstliche-Intelligenz/!t5924174
[2] /Axel-Springer-Verlag/!5919470
[3] /Kuenstliche-Intelligenz-erwuenscht/!5909055
[4] /ChatGPT-loest-Bildungskrise-aus/!5920652
## AUTOREN
Theresa Moosmann
## TAGS
Schwerpunkt Künstliche Intelligenz
Niedersachsen
Sprache
Bildung
Schreiben
Bot
Reddit
Schwerpunkt Künstliche Intelligenz
CDU
Schwerpunkt Künstliche Intelligenz
Schwerpunkt Künstliche Intelligenz
## ARTIKEL ZUM THEMA
Das Ende einer KI-Kolumne: Hinterher sind wir alle klüger
Die taz und KI-Kolumnist*in Anic T. Wae gehen fortan getrennte Wege. Hier
kommen fünf Dinge, die Anics Schöpfer durch sie gelernt haben.
Börsengang von Reddit: Ist das noch Nische?
Schon Jahre vor dem Börsengang mischte das Online-Forum Reddit die
Weltmärkte auf. Nun gibt es selbst Aktien aus – zum Ärger vieler Nutzer.
Künstliche Intelligenz an Hochschulen: Zauberwort und Risiko
Die Hochschulen beschäftigen sich zunehmend mit künstlicher Intelligenz.
Das führte zu Euphorie – und der Sorge, durch KI das Lernen zu verlernen.
Verbotene SA-Parole: CDU-Politiker löscht Nazi-Hashtag
Union-Vizefraktionschef Sepp Müller entschuldigt sich für eine Formulierung
auf Facebook. Sie stamme von ChatGPT, sagte er der taz.
FAQ zum neuen AI Act der EU: KI bekommt Regeln
Künstliche Intelligenz hilft bei der Überwachung, aber auch bei der
Verbreitung von Hass und Fake News. Die EU schafft nun weltweit einmalig
Recht.
Zukunft von KI: Habt keine Angst
2023 war das Jahr der künstlichen Intelligenz. Um die Zukunft der
Technologie zu gestalten, brauchen wir Mut, Utopie und Spaß.
You are viewing proxied material from taz.de. The copyright of proxied material belongs to its original authors. Any comments or complaints in relation to proxied material should be directed to the original authors of the content concerned. Please see the disclaimer for more details.