Werden Synchronsprecher bald durch digitale Sprecher ergänzt?

Eine KI anstatt einer menschlichen Stimme bei der Synchronisation von Filmen in anderen Sprachen – ist das die Zukunft? Bislang noch nicht. Aber die Zukunft könnte durchaus so aussehen. Beispiel „Die Simpsons“: Die äußerst beliebte Cartoonserie flimmert schon seit über 30 Jahren über die Bildschirme. Während jedoch die Figuren wie Homer, Marge, Bart, Lisa oder Maggie in den Folgen kein bisschen altern, kommen die Synchronsprecher:innen langsam, aber sicher in die Jahre und mit dem Alter verändert sich natürlich auch ihre Stimme. Das damit einhergehende Problem: Das Publikum hat sich bereits an die Stimmen gewöhnt. Einige Sprecher:innen begleiten die Kultfiguren praktisch schon ihr ganzes Leben.
Bei den Fans sind die Stimmen im Gedächtnis abgespeichert und fest mit der jeweiligen Figur verbunden. Wenn es irgendwann, etwa weil ein Synchronsprecher älter wird und die erwachsene Stimme dadurch nicht mehr so richtig zu einer jugendlichen Figur passt, wird in der Regel der/die Synchronsprecher:in ausgetauscht.
Es gibt natürlich auch Fälle, in denen der/die Synchronsprecher:in aufhört oder wegen Krankheit oder sonstigem nicht weiter synchronisieren kann und deshalb ein Ersatz her muss. Für das Publikum ist das zunächst immer sehr ungewohnt, für einige auch regelrecht irritierend. Aus diesem Grunde sind die Produzent:innen der „Simpsons“ nun auf die Idee gekommen, einige Stimmen mithilfe einer künstlichen Intelligenz zu erzeugen.
Finanzieller Aspekt spielt auch eine Rolle
Das Älterwerden der Synchronsprecher:innen ist aber nur ein Teilapekt, der die Produzent:innen von „Die Simpsons“ auf die Idee gebracht hat, mit künstlicher Intelligenz zu hantieren. Die Sprecher:innen von Home, Marge, Bart und Co. sind mittlerweile auch gehaltsmäßig so etwas wie die Stars unter den Synchronsprecher:innen. Während sie vor rund 20 Jahren noch um die 30.000 Dollar pro Folge verdienten, kamen sie im Jahr 2008 schon auf 400.000 Dollar. Pro Folge wohlgemerkt! Das heutige Gesamthonorar ist nicht bekannt, dürfte jedoch für alle Sprecher erheblich darüber liegen.
Über Klauseln in ihren Verträgen kassieren die Sprecher:innen auch Tantiemen für Wiederholungen einzelner Sendungen, sodass sie sich im Laufe der Jahre ein erhebliches Vermögen „ersprochen“ haben. Der Konzern 20th Century Studios (ehemals Fox) legte den Sprecher:innen kürzlich buchstäblich die Pistole vor die Brust und verlangte von diesen einen 30-prozentigen Gehaltsverzicht.
Schon aus Mangel an Alternativen stimmten die Synchronsprecher:innen irgendwann zu. Darunter auch Harry Shearer, der seine Stimme gleich mehreren Figuren in der Kultserie verleiht und, nicht gerade begeistert, ebenfalls zustimmen musste. Die Verantwortlichen der 20th Century Sudios hatten ihm laut eines Artikels im Magazin „Wired“ wohl gedroht, so bald wie möglich ganz auf ihn verzichten zu wollen, falls er sich weigern sollte, den neuen Auflagen zuzustimmen.
Die Serie „Die Simpsons“ feierte im Jahr 1989 ihre Premiere. Bis heute umfasst sie über 700 Episoden in 32 Staffeln. In der deutschen Fassung sind in dieser Zeit nur zwei Synchronsprecher:innen durchgängig vertreten gewesen. Alle anderen wurden bereits ein- oder mehrfach temporär, manche auch vollständig ersetzt.
Rund um die Simpsons ist mittlerweile eine Franchise mit zahlreichen Merchandising-Artikeln entstanden. Selbst in einigen Spielautomaten in Online-Casinos dienen sie als Protagonisten. MrCasinova’s Auswahl deutscher Casinos zeigt, bei welchen Anbietern mit den Simpsons gespielt werden kann. Seit 2007 gibt es auch ein Videospiel mit den Simpsons, das parallel zum Kinofilm aus dem Jahr 2007 entwickelt wurde und allein knapp 400 Millionen Dollar einspielte. Für das kommende Jahr ist ein neuer Release geplant.
Ersatz durch eine KI technisch in jedem Fall möglich
Bedenkt man, dass es „Die Simpsons“ schon seit dreißig Jahren gibt, kann man sich leicht vorstellen, dass in diesen Jahren jede Menge Tonmaterial zusammengekommen ist. Das „Stimmarchiv“ ist also prall gefüllt, sodass die grundsätzlichen Voraussetzungen für den Einsatz einer Künstlichen Intelligenz, zumindest was das zur Verfügung stehende Material betrifft, gegeben sind. Die 20th Century Studios hat auch schon erfolgreich mit der Künstlichen Intelligenz experimentiert. Nachdem im Jahr 2013 Marcia Wallace, ihrerseits Sprecherin von Edna Krabappel, Barts Lehrerin, infolge einer Lungenentzündung verstorben war, musste auch ihre Figur den Serientod sterben, weil man damals noch weit von den technischen Möglichkeiten, insbesondere dem Einsatz von Künstlicher Intelligenz entfernt war.
In einer jüngeren Episode wurde Edna Krabappel jedoch mithilfe von Audio-Aufnahmen und einer KI mit Erfolg wiederbelebt. Bedeutet: Die Stimme kam in einer glaubhaften Art und Weise und nicht hölzern zusammengefügt herüber.
Das Ergebnis wurde bei den 20th-Century-Studios-Verantwortlichen entsprechend euphorisch aufgenommen. Einigen Sprecher:innen der Simpsons-Figuren dürfte in diesem Moment zum ersten Mal der Angstschweiß über die Stirn gelaufen sein, da der Konzern diesen Erfolg auch zum Anlass nahm, die Gehaltsstruktur der Stimmgeber:innen neu zu überdenken.
Kanadischer KI-Forscher experimentiert seit Jahren
Zum Einsatz künstlicher Intelligenz sagte der kanadische KI-Forscher und Medienproduzent Tim McSmythurs gegenüber des Magazins „Wired“, dass „man kann auf jeden Fall eine Episode der Simpsons mit einer KI produzieren könne, bei der die Stimmen der Charaktere in einer glaubwürdigen Art und Weise vertont werden.“
Für seinen YouTube-Kanal hat der KI-Forscher eine Episode der Simpsons nachgestellt. Die Stimme von Homer hat er dabei durch eine KI simulieren lassen. Hierbei hat er ein eigenes generisches Audio-Modell eingesetzt, das er im Laufe seiner Forschungstätigkeit selbst entwickelt hat. Das Programm kann theoretisch jede Stimme in einem Film in englische Sprache mit der Stimme eines bestimmten Sprechers umwandeln. Hauptsache, es liegt genügend Stimmmaterial vor.
Für Homer hat er sein Modell eine Zeit lang täglich etwa drei Stunden lang mit Audiomaterial, also jede Menge Daten gefüttert. Im Beispiel Homer warf das Programm anschließend unterschiedliche Aufnahmen aus, von denen jede etwas anders klang. Das Gleiche hat er auch mit Reden von Joe Biden und dem Star Wars-Schauspieler Adam Driver gemacht.
Die ausgeworfenen Stimmen wirken im Ergebnis tatsächlich täuschend echt, alles läuft synchron und flüssig. Lediglich hinsichtlich der Stimmlage in emotionalen Momenten der Figuren muss noch nachgebessert werden, da die Stimmen mit den jeweiligen Emotionen nicht 100 % mitkamen.