Kunst gegen KI: Stirbt dieser Beruf aus?

7 Minuten
Synchronsprecher leisten einen kreativen Job, doch auch hier stellt sich die Frage: Wie lange dauert es, bis KI übernimmt? Ich bin hin- und hergerissen und sehe beide Seiten. In diesem Beitrag erkläre ich das Problem und teile meine Gedanken dazu.
Ein vintage Mikrofon steht vor einem dunklen Hintergrund und wirft einen Schatten.
Stirbt der Job des Synchronsprechers demnächst aus?Bildquelle: Carsten Drees / inside digital (generiert mit Gemini 2.0 Flash)

Es braut sich was zusammen über dem Berufsfeld jener Menschen, die unsere Serien und Filme so überzeugend in unsere Sprache bringen. In Deutschland – wie auch in vielen anderen Ländern – schauen wir ja meist synchronisierte Fassungen. Anderswo setzt man lieber auf das Original mit Untertiteln. Und dann gibt’s Länder wie Russland oder Polen, wo oft einfach über das Original drüber geredet wird – nicht selten sogar mit nur einer Stimme für alle Figuren.

Synchronisierte Filme und Serien in Deutschland

Kurz gesagt: In Deutschland ist die Synchronisation auf einem richtig hohen Niveau. Oft trägt die gute Synchro sogar zum Erfolg einer Serie bei. Bei „Die Zwei“ war der Erfolg dank der humorvollen deutschen Synchronisation viel größer als im englischen Original. Auch Bud-Spencer- und Terence-Hill-Filme sind hierzulande für ihre witzigen Synchronisationen bekannt.

Doch nun scheint ein Wendepunkt erreicht. KI hält auch Einzug in den Film und es wird überlegt, die Stimmen einfach durch künstliche Intelligenz zu ersetzen. Das betrifft nicht nur uns, aber in Deutschland regt sich Widerstand. Mehrere Synchronsprecher wehren sich gegen diese Entwicklung, da ihnen quasi ihre Stimmen weggenommen werden. Schau dir dazu am besten den Clip des Verbands Deutscher Sprecher:innen e.V. (VDS) an:

Empfohlener redaktioneller Inhalt
Dieser externe Inhalt von YouTube ergänzt den Artikel. Du hast die Wahl, ob du diesen Inhalt laden möchtest.
Externer Inhalt
Ich bin damit einverstanden, dass externer Inhalt geladen wird. Personenbezogene Daten werden womöglich an Drittplattformen übermittelt. Nähere Informationen enthält die Datenschutzerklärung.

Über 300.000 Aufrufe erhielt dieses Video und fast tausend, oft sehr emotionale Kommentare noch dazu. Auch ein TikTok-Video mehrerer deutscher Synchron-Sprecher ging viral. Daraus lässt sich schon ablesen, dass all diese Synchron-Schauspieler ihre Arbeit mit sehr viel Herz erledigen – und viele Menschen mit ebenso viel Herz fordern, dass diese Stimmen auch zukünftig ihren Job nicht an eine KI verlieren. Vermutlich denkst du dir bereits, dass auf diese Worte ein „aber“ folgt.

Das nahende Ende der Synchronsprecher?

Und jetzt kommt das große „aber“: Was, wenn KI tatsächlich eine Stimme so gut nachahmen kann wie das menschliche Original? Aktuell ist das noch schwierig, wie Viaplay mit seiner Serie „Murderesses“ erfahren musste. Das Unternehmen wollte die Serie in einer „Hybrid AI“-Übersetzung nach Deutschland bringen. Einige Hauptrollen sind klassisch synchronisiert, bei kleineren Rollen hilft das Start-up Deepdub künstlich nach. Das Resultat war so katastrophal, dass Magenta TV die Serie nach nur zwei Folgen absetzte.

Doch zurück zu der Frage: Was, wenn KI eine menschliche Stimme wirklich perfekt nachbilden könnte? Können wir wirklich glauben, dass synthetische Stimmen keine Emotionen und Empathie simulieren können? Wenn man sich die rasanten Fortschritte der letzten zwei Jahre anschaut, ist es gar nicht so abwegig. Und selbst wenn die KI-Stimmen heute noch unperfekt klingen, wird sich das in Zukunft sicher ändern.

Die KI bietet natürlich viele Vorteile: Sie arbeitet schneller, zuverlässiger und vor allem günstiger. Doch sie hat auch einen Trick drauf, den menschliche Sprecher nicht beherrschen: KI spricht alle Sprachen der Welt.

Klingt Deadpool bald auf der ganzen Welt wie Ryan Reynolds?

Was passiert also, wenn in Deutschland zwar echte Stimmen gewünscht sind, aber aus den USA bereits eine perfekt synchronisierte KI-Fassung auf den Markt kommt? Ryan Reynolds wird in Deutschland von Dennis Schmidt-Foß gesprochen, der zudem auch Chris Evans (Captain America) oder Michael C. Hall (Dexter) seine Stimme leiht. 

Wir sind natürlich an den Sound seiner Stimme gewöhnt, aber er klingt nun einmal anders als Ryan Reynolds. KI kann dafür sorgen, dass Ryan künftig weltweit mit seiner eigenen Stimme zu hören ist. Das ist etwas, was ein noch so begabter Künstler wie Schmidt-Foß nicht bieten kann.

Ein weiterer Vorteil von KI-Stimmen ist, dass oft nach dem Dreh festgestellt wird, dass eine Szene nachvertont werden muss. Ein gutes Beispiel dafür ist der Film „Fall“, in dem zwei Frauen auf einem 600 Meter hohen Turm hängen und ziemlich viel fluchen. Das F-Wort wurde jedoch so häufig verwendet (30-mal), dass der Film mit seinem PG-13-Rating durchgefallen wäre. Und dieses Rating ist wichtig, damit möglichst viele Zuschauer den Film im Kino sehen können.

Also wurde mit der TrueSync-Technik des Unternehmens Flawless nachgebessert: Statt „fuck“ sagen die Schauspielerinnen jetzt „freaking“, und dank der Technik stimmt auch die Lippensynchronität perfekt. Und das Ganze war deutlich günstiger als aufwändige Nachdrehs am Original-Set. Sieh und hör selbst: 

Empfohlener redaktioneller Inhalt
Dieser externe Inhalt von YouTube ergänzt den Artikel. Du hast die Wahl, ob du diesen Inhalt laden möchtest.
Externer Inhalt
Ich bin damit einverstanden, dass externer Inhalt geladen wird. Personenbezogene Daten werden womöglich an Drittplattformen übermittelt. Nähere Informationen enthält die Datenschutzerklärung.

Am Ende spricht die Schauspielerin sogar Japanisch und Spanisch, und das alles ist perfekt lippensynchron. Ehrlich gefragt: Habt ihr das Gefühl, dass in den Versionen anderer Sprachen weniger Emotion rüberkommt? Das wirkt auf mich jedenfalls schon ziemlich überzeugend.

Auf der einen Seite haben wir also hochprofessionelle, gut bezahlte Synchronsprecher, die diese Filme umsetzen. Auf der anderen Seite stehen KI-Tools, die das Ganze schneller, günstiger und in allen gewünschten Sprachen erledigen können. Tools, die Schauspieler weltweit mit einer einzigen Stimme ausstatten und Nachvertonungen im Handumdrehen lippensynchron machen.

Ganz ehrlich, Leute: Mir gehen langsam die Argumente aus, warum die KI diesen Job nicht übernehmen sollte. Vielleicht steht da tatsächlich eine Berufsgattung und Kunstform vor dem Aussterben. Schicksale wie diese sind nicht selten existenzbedrohend. Aber, seien wir ehrlich: Du siehst in Deiner Stadt auch kaum noch Fassmacher, Droschkenkutscher oder Laternenanzünder – und kommst auch gut zurecht, oder?

Okay, eine Sache wäre da noch …

Ein wichtiger Punkt fehlt hier noch, den wir nicht übersehen sollten: Was ist es den Unternehmen mit den gut trainierten Modellen eigentlich wert, ihnen das Reden mit echten Stimmen beizubringen? Dass Midjourney so beeindruckende Bilder kreieren kann, liegt daran, dass die KI mit Millionen, wenn nicht Milliarden von Bildern trainiert wurde. Ähnlich verhält es sich bei der Stimme: Auch hier muss das Modell immer wieder unzähligen Stimmen lauschen, um letztlich wie ein Mensch klingen zu können.

Vielleicht hast du vom großen Streik der SAG-AFTRA (Screen Actors Guild – American Federation of Television and Radio Artists) 2024 in den USA gehört. Die Gewerkschaft fordert klare Regelungen, um sicherzustellen, dass die Stimmen von Schauspieler nicht ohne ihre Zustimmung und faire Bezahlung durch KI-Technologien genutzt werden.

Ich stehe ganz klar auf der Seite der Gewerkschaft. Es darf nicht sein, dass Synchronsprecher für einen Tag gebucht und bezahlt werden, nur damit ihre Stimme für das KI-Training genutzt wird – und dann auf ewig weiter verwendet wird, ohne dass der Mensch noch einen Cent dafür erhält.

Wir brauchen faire Lizenzmodelle, bei denen die Künstler gerecht verdienen, wenn ihre Stimmen in Filmen, Serien, aber auch in Werbung und Videospielen zu hören sind.

Mein persönliches Fazit

Zum Schluss möchte ich noch einmal zusammenfassen: Ich habe zu Beginn gesagt, dass ich hin- und hergerissen bin, und das hat sich auch im Verlauf dieses Textes nicht geändert. Ich finde weiterhin, dass Voice Actors für ihre Kunst fair bezahlt werden sollten – dazu gehört, dass sie für die Nutzung ihrer Stimmen zum Trainieren von Sprachmodellen entlohnt werden. Und jedes Mal, wenn eine Stimme explizit einem Schauspieler oder einer Schauspielerin zugeordnet werden kann, muss dafür gezahlt werden, sei es in einem Spiel oder anderswo.

Aber ganz ehrlich: Die Vorteile der KI habe ich dir ja genannt. Wenn eine Computerstimme Emotionen genauso gut transportieren kann wie ein Mensch, wie will man dann verhindern, dass immer mehr Unternehmen in der Filmindustrie auf die praktischere, günstigere und schnellere KI-Technologie zurückgreifen? Für uns in Deutschland hätte das auch den Vorteil, dass wir ein Leben lang immer derselben Stimme lauschen könnten. Wir müssten nicht damit leben, dass Columbo irgendwann eine neue deutsche Stimme bekam oder Homer Simpson heute anders klingt als früher.

Machen wir uns nichts vor: Es wird viele Menschen treffen, die uns mit ihrer Arbeit viel Freude gemacht haben. Aber die Wahrheit ist, dass KI unsere Welt verändern wird – und uns viele Jobs kosten könnte. Glaub mir, der Verfasser dieses Textes weiß genau, dass das Damoklesschwert auch über dem Beruf des Tech-Redakteurs schwebt. Genau deshalb sage ich dir: Es ist besser, sich heute als morgen mit KI auseinanderzusetzen. Denn im Verbund mit künstlicher Intelligenz können wir unsere Jobs eher sichern als mit Scheuklappen!

Lass uns gerne in den Kommentaren darüber reden, wie du zu diesem Thema stehst. Ist KI schon so weit, um zu übernehmen? Oder bist du aus ethischen Gründen generell dagegen oder schaust einfach eh nur Filme im Original?

Und was sagst du?

Bitte gib Dein Kommentar ein!
Bitte gibt deinen Namen hier ein