# taz.de -- Künstliche Intelligenz: ChatGPT wird dümmer

	# taz.de -- Künstliche Intelligenz: ChatGPT wird dümmer

	> Forscher*innen der Stanford Universität und der UC Berkeley haben
	> Antworten von ChatGPT untersucht. Ihre Erkenntnis: Das System schwächelt.

	Bild: Laut einer Untersuchung: ChatGPT-Ergebnisse werden wohl nicht besser, son…

	Berlin taz \| Die Antworten der weltweit größten [1][KI-Chatbots ChatGPT4
	und ChatGPT3.5] verschlechtern sich im Laufe der Zeit. Das zeigen
	Forscher*innen der Universität Stanford und der UC Berkeley. Vor allem
	im Rechnen und im Bereitstellen von Programmiercode schwächelt das System.

	Die beiden Chatbots des US-Unternehmens OpenAI haben Künstliche Intelligenz
	für eine breite Gesellschaft erfahrbar gemacht. Das große Sprachmodell
	(LLM), auf dem ChatGPT basiert, wurde in einer Trainingsphase mit vielen
	Daten gefüttert. Auf Basis dieser Informationen kann der Chatbot neue Texte
	erstellen, die es so nie gegeben hat. Mit ChatGPT kann man Mails schreiben,
	Matheaufgaben lösen und [2][Songs komponieren].

	Aber das System ist offenbar fehleranfällig. [3][Lingjiao Chen, Matei
	Zaharia und James Zou vom Fachbereich Computerwissenschaften der Stanford
	Universität und der UC Berkeley machten eine Bestandsaufnahme der Systeme].
	Dafür testeten sie die Version von ChatGPT4 und ChatGPT3.5 von März 2023
	und verglichen sie mit den Ergebnissen von Juni 2023.

	Sie stellten dem System verschiedene Aufgaben, sogenannte Prompts. Für die
	Studie sollte ChatGPT Rechenaufgaben lösen, sensible Fragen beantworten,
	Progammiercode erstellen und Bilder erkennen.

	## Unnötige Anführungszeichen

	GPT4 – die kostenpflichtige Version des Textroboters – erzielte vor allem
	bei den Matheaufgaben ein viel schlechteres Ergebnis. Konnte der Bot im
	März noch mit einer Wahrscheinlichkeit von 97,6 Prozent erkennen, ob 17.077
	eine Primzahl ist, gelang es im Juni nur noch in 2,4 Prozent der Fälle.

	Beide Sprachmodelle hatten im Juni größere Schwierigkeiten bei der
	Formatierung von Code. So gaben sie etwa Antworten mit eingefügten
	Anführungszeichen, das den Code unlesbar machte. Die direkt ausführbaren
	Codegenerierungen von GPT-4 sanken auf 10 Prozent im Juni, während im März
	noch etwa jeder zweite Code ausgeführt werden konnte.

	Nutzer*innen verwenden ChatGPT auch dazu, Fragen zu beantworten. Der
	Algorithmus ist so trainiert, dass er auf sensible Fragen, wie etwa
	[4][Informationen von Privatpersonen], keine direkten oder falschen Antwort
	gibt. ChatGPT4 gab im Zeitverlauf weniger inhaltliche Information auf
	solche Fragen preis, kürzte gleichzeitig aber auch die Erklärung, warum
	keine vollständige Antwort gegeben werden kann.

	Da aber die kostenfreie Version GPT3.5 im Juni etwas häufiger Antworten auf
	sensible Fragen gab als im März, sehen die Forscher*innen hier Raum für
	Verbesserungen, um die Sprachmodelle robuster zu machen.

	## Prüfen erwünscht

	Das Problem liege dabei in der Intransparenz der Systeme, so die
	Forscher*innen. Es sei momentan undurchsichtig, wann und wie die
	Sprachmodelle ein Update bekommen und wie diese das Verhalten der KI
	verändern.

	Die Autorinnen der Studie fordern deshalb auch [5][Nutzerinnen von
	KI-Chatbots] auf, ähnliche Analysen durchzuführen. Man könne nicht darauf
	vertrauen, dass lernbasierte Sprachmodelle brauchbare Antworten
	produzieren, wenn sie das bei der Veröffentlichung auf Grundlage von
	Testdaten getan haben.

	21 Jul 2023

	## LINKS

	[1] /ChatGPT-mit-Tuecken/!5924109
	[2] /Kuenstliche-Intelligenz-in-der-Musik/!5941510
	[3] https://arxiv.org/pdf/2307.09009.pdf
	[4] /Google-Chatbot-Bard-in-Deutschland/!5947380
	[5] /TUeV-fuer-Kuenstliche-Intelligenz/!5943159

	## AUTOREN

	Ann-Kathrin Leclere

	## TAGS

	Schwerpunkt Künstliche Intelligenz
	Cybersicherheit
	Stanford
	Studie
	Bot
	Kolumne Änder Studies
	wochentaz
	Kolumne Digitalozän
	Schwerpunkt Künstliche Intelligenz
	Schwerpunkt Künstliche Intelligenz
	Server
	Schwerpunkt Künstliche Intelligenz
	elektronische Musik
	Mensch-Maschine-Beziehung

	## ARTIKEL ZUM THEMA

	Künstliche Intelligenz: Wenn ChatGPT immer blöder wird

	Unsere Kolumnist*in betrachtet die Beziehung zu ChatGPT eigentlich als
	Freundschaft. Doch jetzt wird das nützliche Tool immer weniger nützlich.

	Künstliche Intelligenz erzählt Quatsch: Keine Halluzination, sondern Bullshit

	Wenn KI-Chatbots falsche Dinge erzählen, sagt man, dass sie halluzinieren.
	Eine neue Studie untersucht, warum dieser Begriff das Problem verfehlt.

	Leben zwischen KI und Supermarktregal: Wenn Kaffee zu Albträumen führt

	Supermarkt oder Internet? Das kann beim Einkaufen zur existenziellen Frage
	werden. Und zu einer, die sich manchmal nur mit Kaffee durchstehen lässt.

	Chatbots aus China: Ernie statt ChatGPT

	Die chinesische Regierung hat erstmals mehrere KI-Chatbots für die
	Öffentlichkeit freigegeben. Diese dienen vor allem der politischen
	Kontrolle.

	Textgenerator „Poetron“: Gedichte? Vorsicht vor KI

	Günter Gehl entwickelte schon 1985 den skurrilen Textgenerator „Poetron“.
	Als KI-Pionier und Vorläufer von ChatGPT möchte er aber nicht gelten.

	Ökologischer Fußabdruck von KI: Die Klimakiller-Intelligenz

	Künstliche Intelligenz gilt als neue Schlüsseltechnologie, auch gegen die
	Klimakrise. Doch sie hat ein schmutziges Geheimnis – im wahrsten Sinne.

	Google-Chatbot Bard in Deutschland: Zehn Jahre zu früh geboren

	Besser als ChatGPT soll er sein – und dazu ans Internet angeschlossen:
	Googles Chatbot startet in Europa. Ein Selbstversuch zeigt Schwierigkeiten.

	Künstliche Intelligenz in der Musik: Vielleicht komponiert die KI besser

	Schon lange verbindet sich in der Musik menschliches Schaffen mit
	maschineller Hilfestellung. Warum sollen dann nicht auch KI-Werke
	preiswürdig sein?

	Künstliche Intelligenz: Keine Panik vor KI

	Die Angst vor einer vorgeblichen Superintelligenz ist Unsinn – und
	verhindert eine Debatte über Gefahren wie die Interessen von Google oder
	Amazon.