# taz.de -- KI und Hörbücher: Die Maschine übernimmt unsere Stimme

	# taz.de -- KI und Hörbücher: Die Maschine übernimmt unsere Stimme

	> KI könne keine echten Sprecher ersetzen, glauben noch viele. Wirklich?
	> Unser Autor ist selbst Hörbuchsprecher und befürchtet das Ende seines
	> Jobs.

	Bild: Wer wird künftig noch ins Mikro sprechen?

	Es begann mit einem Präsentationsauftritt auf einer Plattform des
	amerikanischen Hörbuch-Vertriebs Audible namens ACX. Die Digitalbörse, die
	sich innerhalb der letzten Jahre zu einem soliden Geschäftsmodell für einen
	ziemlich unübersichtlichen Markt entwickelt hat, bringt mithilfe einer
	Software Autoren und Verlage auf der einen Seite und Sprecher auf der
	anderen zusammen. Mit durchautomatisierten Kommunikationsmöglichkeiten bis
	hin zur Honorarabrechnung.

	Gut für jene, die ihr eigenes Aufnahmestudio besitzen und alle
	tontechnischen Qualitätsstandards erfüllen, die an Hörbücher angelegt
	werden. Und die auf diese Weise den wachsenden internationalen Markt mit
	ständig neuer Ware füttern. Es gibt schließlich Bücher und Sprecher wie
	Sand am Meer. Aber im Kontrast dazu nur wenige professionelle
	Hörbuchverlage. Und die bremsen wie ein Flaschenhals die Flut aus.

	ACX war vor ein paar Jahren eine ideale Anlaufstelle für einen
	Quereinsteiger ins Sprechergeschäft wie mich. Denn hier kam mein erstes
	Hörbuch zustande, „Manifestieren mit dem Gesetz der Anziehung“, ein Stoff
	aus der esoterischen Ratgeberecke. Ich nahm danach ein bis zwei Sachbücher
	im Jahr auf, wurde aber irgendwann neugierig auf eine ganz andere Welt:
	Belletristik. Die Ansprüche an die Sprecher sind höher, und es sind
	schauspielerische Mittel und ein facettenreicher Einsatz der Stimme
	gefragt.

	Ich bin nicht so vermessen, zu glauben, ich spiele in der Liga eines
	Christian Brückner, Spitzname „Die Stimme“. Oder als könnte ich meinem
	Lieblings-Hörbuch-Erzähler, dem Engländer Simon Vance, das Wasser reichen.
	Doch viele Jahre Radioerfahrung, ein erstklassiges Mikrofon und jede Menge
	erarbeitetes Wissen für den Umgang mit den Reglern des digitalen Mischpults
	scheinen auch mir ein gutes Fundament. Wie gut? Im Moment genieße ich vor
	allem eines: Ich stehe im Unterschied zu vielen in dem Metier nicht unter
	dem Druck, mit Hörbüchern meinen Lebensunterhalt einzuspielen.

	## Der digitale Ozean

	Trotzdem wäre es völlig naiv, die Welle zu ignorieren, die derzeit wie ein
	Tsunami über den riesigen digitalen Ozean auf uns zurollt. KI wird viele
	von uns plattmachen. Auch wenn, wie etwa eine private Umfrage in einer
	Facebook-Gruppe zeigt, deren 4.400 Mitglieder sich intensiv für Hörbücher
	interessieren, aktuell noch eine völlig andere Wahrnehmung vorherrscht: „KI
	wird mir niemals einen echten Sprecher ersetzen.

	„Ob Hörbuch oder Buch, wenn draufstehen wird ‚KI‘, werde ich diese nicht
	nehmen“, lautet die durchgängige Haltung. Angereichert mit Gelübden wie
	„Ich zahle und höre nichts mit KI-Sprecher“ und Parolen wie „KI kann ein…
	wahren Sprecher niemals ersetzen. Das klingt kalt. Die Hörer merken das.“
	Ich sag mal: In Gottes Ohr. Man sollte trotz solcher Einschätzungen davon
	ausgehen, dass für unsereins eine ziemlich gespenstische Zeit angebrochen
	ist.

	Schauspielergewerkschaften in den USA oder Fachverbände wie der Verband
	Deutscher Sprecher:innen e. V. (VDS) in Deutschland fahren
	berechtigterweise apokalyptische Kampagnen. Sie haben erkannt, „dass
	menschliche Stimmen durch KI-generierte Stimmen, denen es an Empathie,
	emotionaler Tiefe und kulturellem Kontext fehlt, ersetzt werden“, [1][wie
	der VDS schreibt].

	Wobei man der Genauigkeit halber darauf hinweisen sollte, dass es im
	Unterschied zur Vergangenheit nicht mehr um die Perfektionierung von
	„künstlichen Stimmen von Robotern“ geht, wie lautstark rebellierende
	deutsche Synchronsprecher die Entwicklung zuletzt charakterisierten.

	Die Entwicklung ist viel perfider. Die weitgehend perfektionierte
	Sprecher-KI von heute nutzt und kopiert echte Profis und nimmt bei
	stundenlangen Arbeitsproben deren differenzierte Artikulationsmodalitäten
	auf. Und der Fundus wird nicht kleiner, sondern wächst rapide. Wenn die FAZ
	recht behält, die vor ein paar Monaten vermeldete, dass künstliche
	Intelligenz [2][„schon jetzt täuschend echte Klone menschlicher Stimmen“]
	produziert und „hilflose gesetzliche Regulierungsversuche mit erhobenem
	Zeigefinger“ zu spät kommen, können wir wohl einpacken.

	Dann reduziert sich das Thema nur noch auf Urheberrechtsfragen: Gehört
	meine Stimme mir? Kann ich sie verkaufen oder vermieten? Kann ich Diebe und
	Betrüger verklagen? Sind die Nutzungsrechte so viel wert, dass es sich
	lohnt, sie zu verhökern? Welche Verwertungsgesellschaft kümmert sich um das
	Ganze? Die Frage nach der Transparenz wird bei Audible – bis jetzt noch –
	redlich gehandhabt. KI-Hörbücher kommen mit dem Etikett „Virtual Voice“
	daher. Aber dass das so bleibt, mag man nicht glauben.

	## Geistesarbeiter zweiter Klasse

	Die Strategie, die im Mai in einer Pressemitteilung angekündigt wurde, gab
	keine Zusicherungen, sondern verbreitete nur Floskeln. KI sei die „große
	Chance, die Verfügbarkeit von Hörbüchern zu erweitern“, erklärte
	Audible-CEO Bob Carrigan. „Wir werden in der Lage sein, mehr Geschichten
	zum Leben zu erwecken.“ Gut für Autoren. Gut für die Umsätze von Audible
	und die Mutterfirma Amazon. Schlecht auf jeden Fall für Übersetzer, die
	schon seit mehr als einem halben Jahrhundert als Geistesarbeiter zweiter
	Klasse behandelt werden und in diesem System ebenfalls von Maschinen
	ersetzt werden.

	Und sicher auch schlecht für Sprecher. Wir sind nur ein weiteres schwaches
	Glied in jener Techno-Kette, in der die Merkantilisierung der Kreativität
	dazu dient, die Produktionsverhältnisse einer auf Massenumsätze ausgelegten
	globalen Kulturindustrie voranzutreiben. Geist und Ingenium? Originalität
	und Sinnlichkeit? Alles versinkt im Sumpf der totalen Simulation.

	Eine der Abspielplattformen für Bücher aus dem KI-Universum ist übrigens
	Youtube, wie Nathalie de Ahna weiß, die vor fünf Jahren begann, ihren Kanal
	„[3][Lie liest vor“] mit einem Katalog von über 500 urheberrechtsfreien
	Märchen zu bespielen. Aufnehmen, bearbeiten, hochladen – es war viel
	Arbeit. Aber sie begann sich dank wachsender Abonnentenzahlen und
	Werbeeinnahmen irgendwann auszuzahlen. „Wenn du gut bist und Ausdauer
	hast“, sagt sie, „dann kannst du davon leben.“

	Auch wenn die Zielgruppe – Menschen mit Schlafstörungen, die sich gerne
	etwas vorlesen lassen, was „tatsächlich beruhigt und nicht nervt“ – kein…
	Cent für diesen Service bezahlen muss. Oder besser: Man konnte davon leben.
	Denn seit einem guten halben Jahr wächst die anonyme Konkurrenz. „Da kommen
	jede Woche neue Youtube-Kanäle dazu. Alles KI-Stimmen.“ Vor allem ein
	Anbieter namens [4][„ElevenLabs“], gegründet vor drei Jahren in New York,
	hat sich zu einer gut geölten Maschine entwickelt. Denn die synthetisierten
	Stimmen können in jeder Weltsprache kichern, seufzen, hörbar atmen und eine
	Sprachmelodie abspulen, die wirklich sehr menschlich klingt.

	Und so ist man längst auf dem Weg zum Marktführer und beliefert Spotify und
	Audible. Das hat die in der Nähe der holländischen Universitätsstadt Leiden
	lebende Nathalie de Ahna, die auf einem zweiten Kanal mit „[5][Lies
	Kurzgeschichten“] inzwischen auch eigene Texte publiziert, auf die Idee
	gebracht, ihre Stimme von „ElevenLabs“ testweise klonen zu lassen. Ein
	Experiment, um abschätzen zu können, wie groß die Wahrscheinlichkeit ist,
	Menschen zu düpieren, die nicht begreifen, dass die anonymen Stimmen eine
	eigenartige Monotonie ausstrahlen.

	Und die nur dann mit der Stirn runzeln, wenn die Aufnahmen klassische
	KI-Schnitzer enthalten: seltsam oder komplett falsch ausgesprochene
	Eigennamen und Zahlen. Die Sprecherin hat sich über die „seelenlose Kopie“
	ihrer Stimme „furchtbar erschrocken“, sagt sie. „Am Anfang bist du
	fasziniert, aber nach einer Weile genervt, weil du selber denkst, ich mache
	das aber viel besser. Nämlich mit viel mehr Seele dahinter.“ Aber fällt so
	etwas Nutzern aus, die auf der Suche nach kostenlosem Stoff sind?

	## Markt für Hörbücher wächst

	De Ahna hat sich im nächsten Schritt bewusst dagegen entschieden, ihre
	Stimme zu verkaufen. Sie wurde allerdings seitdem bereits von einer Firma
	angefragt, ob sie so etwas machen würde. „Ich habe mir den Vertrag
	zuschicken und bewusst von einer KI kontrollieren lassen. Die hat gemeint,
	um Gottes Willen, mach das bloß nicht. Du verkaufst Rechte an allem und für
	immer. Du kannst das niemals zurückdrehen.“ Heroischer Idealismus hin oder
	her: Zurückdrehen konnte schon Don Quijote nichts.

	Übrigens: Der Umsatz mit Hörbüchern steigt beharrlich, sowohl bei
	Download-Anbietern wie Audible als auch bei Streaming-Plattformen wie
	Storytel. Die jüngste Marktanalyse von [6][Media Control] aus dem letzten
	Oktober bestätigte den Trend. Die Zuwachsrate gegenüber 2023 lag bei 6
	Prozentpunkten, das entspricht dem gesamten Marktanteil von CDs alleine.

	Ich habe übrigens nicht vor, meine Stimme klonen zu lassen. Solange es
	Autoren und Verlage gibt, die sich gegen die Entfremdung stemmen, gilt für
	diese Arbeit dasselbe, was auch in anderen Wirtschaftszweigen seit Beginn
	der Industrialisierung von Kreativen und Kunsthandwerkern aller Art
	praktiziert wurde.

	Man kann sich diesem Meer aus lauter Massenware entgegenstemmen. Aber es
	braucht dazu ein Publikum, das genau das zu schätzen weiß. Wie groß das
	ist, wird sich schon bald zeigen.

	26 Aug 2025

	## LINKS

	[1] https://www.sprecherverband.de/aktuelles/filmveroeffentlichung-kuenstlerisc…
	[2] https://www.faz.net/aktuell/technik-motor/digital/kuenstliche-intelligenz-w…
	[3] https://lieliestvor.de/
	[4] https://www.youtube.com/watch?v=Vs6vJwmJL0Y
	[5] https://www.youtube.com/@lieskurzgeschichten
	[6] https://www.media-control.de/media-control-hoerbuch-kompass-1.-hj.-2023.htm…

	## AUTOREN

	Jürgen Kalwa

	## TAGS

	Schwerpunkt Künstliche Intelligenz
	Arbeitskampf
	Technik
	Künste
	Zukunftsvision
	Reden wir darüber
	Social-Auswahl
	Schwerpunkt Künstliche Intelligenz
	Schwerpunkt Künstliche Intelligenz
	Elektronik
	Kolumne Autokorrektor
	Kolumne Feed Interrupted
	Wissenschaft

	## ARTIKEL ZUM THEMA

	KI-Bilder im Netz: Schwerkraft? Ist überbewertet

	Ein Wasserfall überm Bett? Super Idee. Oder doch nicht? Mit Künstlicher
	Intelligenz erzeugte Bilder überfluten Plattformen wie Pinterest.

	Synchronsprecher gegen Stimmen-Kopie: Gericht stoppt KI-Stimmenklau

	Manfred Lehmann hat gegen einen Youtuber gewonnen, der seine Stimme per KI
	nachgeahmt hat. Das Urteil schützt erstmals auch „Kunststimmen“.

	IFA in Berlin: Die Roboter rufen

	Anfang September zieht die Internationale Funkausstellung allerlei
	Technik-Begeisterte zur Berliner Messe. Die Branche scheint das zu
	brauchen.

	Mensch-Maschine-Beziehung: Fleisch gewordene Dystopie

	Wenn Algorithmen bald die Welt beherrschen, geht menschliche Solidarität
	verloren. Schon jetzt lässt sich eine geschäftsmäßige Herablassung
	beobachten.

	Wie KI unser Denken verändert: Verletzter Stolz

	Künstliche Intelligenz verändert unser Denken. Eine Herausforderung ist,
	dass sie uns das Gefühl nimmt, Dinge eigenständig erarbeitet zu haben.

	SWR-Serie zu Frauen in der Wissenschaft: Schweißen, tüfteln, forschen

	Die SWR-Serie „Women of Science“ will junge Frauen für MINT-Berufe
	begeistern. Ein wenig mehr Action hätte der Produktion gutgetan.