Direkt zum Inhalt

Vertragsbedingungen - Generative KI

Finden Sie Ihre Stimme
Introtext

Empfehlungen zur Vertragserstellung für Sprachsynthesen zum Einsatz in generatver KI vom österreichischen Sprecherverband VOICE

Da die Synthetisierung von Stimmen und der Einsatz dieser mittels KI zum aktuellen Zeitpunkt beinahe unreguliert ist, sodass die Rechte der Beteiligten nicht eindeutig geschützt sind (z.B. Persönlichkeitsrecht, Urheberrecht, Vergütungsanspruch, Haftung uvm.), warnt VOICE seine Mitglieder eindringlich vor einem sorglosen Umgang mit derlei Produktionen.

Keine Gagenliste kann den vollständigen Verlust der Marktwirksamkeit eines/r Sprecher:in und der Selbstbestimmung über die eigene Stimme abbilden.

Aus diesem Grund gibt VOICE zum aktuellen Zeitpunkt keine Gagenempfehlungen für dieses Segment heraus.

Da der Einsatz von KI und synthetischen Stimmen nicht aufzuhalten ist und auch manch Gutes mit sich bringt (z.B.Barrierefreiheit), engagiert sich VOICE auch im internationalen Zusammenschluss der United Voice Artists für eine Regulierung dessen.

Nachfolgend finden Sie die Bedingungen, welche bei Aufträgen zur Sprachsynthese für die Nutzung in generativer KI unbedingt eingehalten, vor der Unterzeichnung einer NDA schriftlich bestätigt und vor der Aufnahme in einem Vertrag schriftlich festgehalten werden sollten:

Vertragsbedingungen

1. Vergütung

Die Vergütung sollte angemessen sein. Eine Vergütung ist angemessen, sofern sie folgende Faktoren berücksichtigt

  • Zeitinvestition und Arbeitsaufwand für die Aufnahme und etwaige Nachbearbeitung

  • Verwertungsrechte (Dauer, Medien, Produkte/Programme, Ort)

  • ggf. laufende Lizenzgebühren für Einzelauswertungen bei einzeln buchbarer Stimmennutzung (z.B. Portal, bei welchem einzeln Stimmen für einen bestimmten Nutzungszweck eingekauft werden können, z.B. für Telefonansagen, Werbespots usw.

  • Abdeckung etwaiger Exklusivität für den Verwertungszeitraum und damit Berufsverbot des/der Sprecher:in

  • Abdeckung der entstandenen Überpräsenz und des Stimmverbrauchs des/der Sprecher:in während und nach dem Verwertungszeitraum

2. Urheberrecht & Leistungsschutzrecht

Es sollte klar definiert sein, wer die Rechte an der synthetisierten Stimme besitzt und wie sie genutzt werden darf. In Österreich sind Sprecher:innen durch das Urheberrecht und das Leistungsschutzrecht geschützt.

3. Datenschutz

Der/die Kund:in muss sicherstellen, dass die persönlichen Daten des/der Sprecher:in geschützt sind. In Österreich ist der Datenschutz durch die Datenschutz-Grundverordnung (DSGVO) streng geregelt.

Die für die Synthese erforderlichen Daten sowie daraus resultierende Informationen dürfen zu keiner Zeit außerhalb des deutschsprachigen Rauns übertragen oder verarbeitet werden. Das heißt, die Server, auf welchen die KI gehostet wird und ebenso die Server, auf welchen der Algorithmus liegt und auf denen der Klon verarbeitet wird, sollten im deutschsprachigen Raum stehen, um einem Missbrauch vorzubeugen und angemessenen Datenschutz zu gewährleisten.

4. Persönlichkeitsrecht – Das Recht an der eigenen Stimme

Der/die Sprecher:in ist durch das Persönlichkeitsrecht, welches das Recht an der eigenen Stimme umfasst, besonders geschützt. Dieses Recht kann nicht übertragen werden, auch wenn es sich um eine Synthetisierung der eigenen Stimme handelt. Der/die Sprecherin sollte somit eine Verwertung der Aufnahmen, die über den ursprünglich vereinbarten Zweck hinausgeht, ablehnen können, auch wenn hierfür eine zusätzliche Vergütung angeboten wird.

5. Spezifische Produkte/Programme

Der Vertrag sollte genau angeben, für welche Produkte oder Programme die synthetisierte Stimme verwendet werden darf und in welchem Umfang diese Nutzer:innen zur Verfügung gestellt wird. Dies könnte eine bestimmte Software, ein bestimmtes Gerät, eine bestimmte Plattform oder eine bestimmte Dienstleistung sein. Es kann auch eine uneingeschränkte Nutzung vereinbart werden. Eine eindeutige Definition ist jedoch notwendig um die Vergütung und Nutzungsrechte (s.o.) angemessen festlegen zu können.

6. Ausschluss bestimmter Inhalte & Missbrauch

Der/die Sprecher:in sollte das Recht haben, bestimmte Arten von Inhalten auszuschließen. Dies könnte beispielsweise die Verwendung seiner/ihrer Stimme für politische, religiöse, erotische oder andere kontroverse Inhalte betreffen. Weiterhin sollte ein etwaiger Missbrauch der Stimme seitens des/der Kund:in verboten werden und von dieser/m auf eigene Kosten strafrechtlich verfolgt werden. 

Der/die Kund:in sollte hierfür die Sorgfaltspflicht tragen und den/die Sprecher:in bei Kenntnisnahme des Missbrauchs oder Verwendung in ausgeschlossenen Inhalten umgehend informieren müssen.

7. Zustimmung zu neuen Verwendungen

Wenn das Unternehmen die synthetisierte Stimme für ein neues Produkt, Programm, Funktion oder einen veränderten Nutzerkreis verwenden möchte, welche nicht im ursprünglichen Vertrag aufgeführt sind, sollte es die Zustimmung der Sprecher:innen schriftlich als Vertragsergänzung einholen müssen.

8. Qualität der Synthese

Der/die Sprecher:in könnte daran interessiert sein, wie gut die synthetisierte Stimme seine/ihre natürliche Stimme nachahmt und wie gut diese Sprache umsetzt (z.B. Phonetik, Sprachmelodie, Betonung, Ausdruck). Eine schlechte Synthese könnte seinen/ihren Ruf zusätzlich schädigen. Der/dem Sprecher:in sollte das Recht zugestanden werden, die Synthese nach Fertigstellung abzunehmen und vor der Veröffentlichung eine qualitativ treffendere und realitätsgetreuere Sprachsynthese der eigenen Stimme zu verlangen.

9. Vertragsbedingungen

Die Vertragsbedingungen sollten klar und verständlich sein und alle relevanten Punkte abdecken. In Österreich ist es besonders wichtig, dass der Vertrag den Anforderungen des Allgemein bürgerlichen Gesetzbuches (ABGB9) entspricht.

10. Anwalt & Anwaltskosten

Der/dem Sprecher:in sollte ein ausreichender zeitlicher Vorlauf gewährt werden, um den Vertrag durch eine/n selbst gewählte:n Anwält:in prüfen zu lassen. Eine anwaltliche Prüfung und Rechtsberatung bei Verträgen zu Sprachsynthese ist unabdinglich. Die Kosten hierfür sollten von der/dem Kund:in getragen werden.

11. Vertragssprache

Der Vertrag sollte auf Deutsch verfasst sein, damit der/die Sprecher:in ihn vollständig verstehen kann.

12. Gerichtsstand

Der im Vertrag angegebene Gerichtsstand muss Österreich sein.

13. Haftungsausschluss

Der/die Sprecher:in sollte von jeglicher Haftung für die mit seiner/ihrer synthetisierten Stimme hergestellten Inhalte freigesprochen werden. Sämtliche Haftung liegt bei dem/der Kund:in.

Diese:r sollte hierfür eine Haftpflichtversicherung abgeschlossen haben.

Bedenken

Um spezifische Bedenken zu adressieren, könnten Sprecher:innen und Kund:innen folgende Maßnahmen ergreifen:

Verlust der Kontrolle über die eigene Stimme

Um dies zu vermeiden, sollte der Vertrag klar definieren, wie und wo die synthetisierte Stimme verwendet werden darf. Der/die Sprecher:in sollte das Recht haben, bestimmte Verwendungen auszuschließen und die Zustimmung für neue Verwendungen zu verlangen. 

Verlust der Einzigartigkeit

Um die Einzigartigkeit der Stimme des/der Sprechers/Sprecherin zu bewahren, könnte der Vertrag eine Klausel enthalten, die die Verbreitung der synthetisierten Stimme begrenzt. Beispielsweise könnte die Verwendung auf bestimmte Produkte oder Dienstleistungen beschränkt werden.

Verlust von zukünftigen Einnahmen

Um dies zu vermeiden, könnte der/die Sprecher:in eine laufende Lizenzgebühr für die Nutzung der synthetisierten Stimme und die Zeit danach verlangen. Dies würde sicherstellen, dass der/die Sprecher:in weiterhin Einnahmen aus der Verwendung und dem Reputationsverlust seiner/ihrer Stimme erhält.

Datenschutz und Sicherheit

Um die persönlichen Daten des/der Sprechers/Sprecherin zu schützen, sollte der/die Kund:in strenge Datenschutz- und Sicherheitsmaßnahmen einhalten. Der Vertrag sollte auch Klauseln enthalten, die den Missbrauch der synthetisierten Stimme verbieten. 

Qualität der Synthese

Um sicherzustellen, dass die synthetisierte Stimme von hoher Qualität ist, sollte der/die Sprecher:in mit einem seriösen und erfahrenen Unternehmen zusammenarbeiten, das fortschrittliche Sprachsynthesetechnologien verwendet.

Rechtliche Bedenken

Um rechtliche Bedenken zu adressieren, sollte der/die Sprecher:in rechtlichen Rat einholen. Der Vertrag sollte die Rechte des/der Sprechers/Sprecherin an seiner/ihrer Stimme respektieren und schützen, einschließlich seiner/ihrer Urheberrechte, Leistungsschutzrechte und Persönlichkeitsrechte.

Ethik und Moral

Um ethische und moralische Bedenken zu adressieren, sollte der/die Sprecher:in das Recht haben, die Verwendung seiner/ihrer Stimme für bestimmte Zwecke auszuschließen. Der/die Kund:in sollte die ethischen und moralischen Werte des/der Sprechers/Sprecherin respektieren und seine/ihre Zustimmung für die Verwendung seiner/ihrer Stimme in bestimmten Kontexten einholen.

Durch die Zusammenarbeit und offene Kommunikation können Sprecher:innen und Kund:innen sicherstellen, dass die Synthese von Stimmen auf eine Weise erfolgt, die die Rechte und Interessen aller Beteiligten respektiert und somit Überraschungen oder langwierigen Rechtsstreitigkeiten und Schadensersatzforderungen vorbeugen.