Die eigene Stimme als Computerstimme

Die eigene Stimme ist unverwechselbar und Ausdruck der individuellen Persönlichkeit.

Bei fortschreitenden Krankheiten mit absehbarem Stimmverlust - oder bei bevorstehenden Operationen, die die Sprechfähigkeit beeinträchtigen -, kann es sinnvoll sein, die eigene Stimme aufzuzeichnen. Damit kann die persönliche Stimme nach einem Stimmverlust auf einem sogenannten Talker (Sprachcomputer) von ihrem Besitzer als Computerstimme genutzt werden.

Über unser Hilfsmittelberater-Netzwerk können Sie sich kostenfrei zum Thema „eigene Stimme bei Stimmverlust“ beraten lassen.

Kostenfreie Beratung


Die eigene Stimme bewahren - wie funktioniert das?

Von der eigenen, persönlichen Stimme werden mithilfe einer Tonaufnahmen die Merkmale der Stimme in einer Kopie gespeichert. Damit kann jede beliebige Aussage vom Computer mittels Sprachsynthese generiert werden.

Grundsätzlich gibt es Ansätze der klassischen Sprachsynthese, in der Laute oder Silben zusammengesetzt werden, und Modelle, die auf sogenanntes „Machine Learning“, das auch als Künstliche Intelligenz bezeichnet wird, zurückgreifen.

So bietet etwa "Meine eigene Stimme" aus Oldenburg eine Lösung an, die es erlaubt, die eigene Stimme zu konservieren, um sie später in einer Kommunikationshilfe einsetzen zu können.

Diese Möglichkeit wird genutzt von Menschen, die eine Beeinträchtigung ihrer Sprechfähigkeit erwarten, beispielsweise Patienten, die an ALS (Amyotrophe Lateralsklerose) erkrankt sind oder einer Kehlkopf-Operation / Laryngektomie entgegensehen.

Um eine eigene Stimme zu generieren, braucht Meine eigene Stimme Sprachaufnahme-Material in der Länge weniger Stunden, um alle typischen Lauten der deutschen Sprache abzubilden. In vielen Fällen übernimmt die gesetzliche Krankenversicherung bei einem später nötig gewordenen Einsatz der eigenen Stimme die Gesamtkosten einschließlich der Tonaufnahmen. Das aufgesprochene Material wird anschließend aufbereitet, so dass eine eigene Stimme als Computerstimme zur Verfügung steht. Diese kann über eine Kommunikationssoftware von „Meine eigene Stimme“ auf einem handelsüblichen PC oder mittels Zusatzsoftware als sogenannte SAPI-Stimme genutzt werden, die auf einer elektronischen Kommunikationshilfe installiert werden kann. Unter elektronischen Kommunikationshilfen versteht man Sprachcomputer, die Menschen bei der Kommunikation unterstützten oder diese gar erst ermöglichen, die über keine ausreichende eigene Lautsprache verfügen. Im Volksmund werden diese Sprachcomputer auch als Talker bezeichnet.

SAPI-Stimmen auf Sprachcomputern

SAPI (Speech Application Programming Interface) hat sich als eine Programmierschnittstelle für Sprachsynthese und Spracherkennung auf Windows-Systemen etabliert. Bereits in Windows 2000 waren systemseitig SAPI-Stimmen inkludiert oder konnten per Servicepack ergänzt werden, die aber in ihren Anfängen noch sehr blechern und roboterhaft klangen. Neuere SAPI-Stimmen nach SAPI-5-Standard klingen oftmals bereits sehr natürlich und sind fast nicht von einer natürlichen Stimme zu unterscheiden.

Was die SAPI-Schnittstelle leistet, ist eine Übersetzung von Text in Sprache - und von Sprache in Text, was hier aber nicht Gegenstand des Artikels sein soll. Ersteres nennt man Text-To-Speech (TTS). Vereinfacht bedeutet TTS, dass Text über eine Sprachausgabe laut ausgegeben wird. Auf diese Weise funktionieren alle dynamischen Kommunikationshilfen, bei denen die gewünschten Aussagen als Text hinterlegt sind - wobei der Text manchmal über Symbole angesteuert wird. Sprachcomputer mit TTS-Ansatz zeigen daher häufig den Text der gewünschten Aussage an, der über die Stimmausgabe laut ausgesprochen wird.

Die SAPI-Schnittstelle ermöglicht eine flexible Stimmauswahl auf Sprachcomputern. Das heißt, auch ohne die eigene, synthetische Stimme nutzen zu wollen, können auf Sprachcomputern meist unter mehreren deutschen Computerstimmen ausgewählt werden. Es stehen männliche als auch weibliche Stimmen, Erwachsenenstimmen und Kinderstimmen in vielen Dutzend Sprachen zur Verfügung, die sehr natürlich klingen.

Trotz vieler Anbieter und Sprecher ist die Auswahl begrenzt, wenn man daran denkt, dass sich in bestimmten Situationen viele Menschen treffen könnten, die alle mit einem Talker kommunizieren, etwa in einer Selbsthilfegruppe, in einer Rehaklinik oder in einer Schulklasse. So kann es vorkommen, dass mehrere Personen im selben Raum mit ein und derselben (fremden) Stimme sprechen. Auch Logopädinnen, Therapeuten, Ärzte und Lehrer kennen die Situation, in der verschiedene Menschen mit ein und derselben Computerstimme sprechen. Es fehlt dann der Wiedererkennungswert und das Merkmal der persönlichen Identität. Insbesondere im Bereich der deutschen Kinderstimmen ist die Auswahl geringer als z. B. im Bereich der englischen Stimmen für Erwachsene.

Einige der verfügbaren Stimmen sind nur über die Hilfsmittelfirma, die den jeweiligen Sprachcomputer liefert, erhältlich. In anderen Systemen kann ein Stimme einfach im Internet erworben und hinzu installiert werden, z. B. über besagte SAPI-Schnittstelle. Faktisch bedeutet dass, dass eine eigene Stimme, die SAPI-fähig ist, auf diesen Geräten grundsätzlich genutzt werden kann. Ob aber die persönliche Stimme tatsächlich installiert und eingebunden werden kann, ist vom Hersteller der Kommunikationshilfe abhängig und muss im Einzelfall für jedes Gerät im Vorfeld geklärt werden.

Über unser Netzwerk mit Hilfsmittelberatern an vielen Standorten im Bundesgebiet können wir Vor-Ort-Erprobungen von Sprachcomputern mit SAPI-Stimmen möglich machen.

Kostenfreie Beratung


Die eigene Stimme so früh wie möglich aufnehmen

Das Aufnehmen der persönlichen Stimme sollte bei fortschreitenden Krankheiten wie ALS möglichst frühzeitig angegangen werden, damit das Tonmaterial die ursprüngliche Stimme abbildet und noch nicht beeinträchtigt ist. In der Regel werden vordefinierte Sätze und Aussagen abgefragt und sollen vorgelesen werden. Dabei ist es im Falle von z. B. Meine eigene Stimme entscheidend, wie die Betonung und Satzmelodie eingesprochen wird, weshalb der Anbieter die Sprachaufnahme persönlich oder per Fernwartung begleitet. Die Aufnahme der eigenen Stimme kann mit behinderungsgerechter Hardware wie etwa einer Augensteuerung erfolgen, z. B. wenn bei ALS die Motorik eingeschränkt ist.

Andere Anbieter bieten kostenfreie Stimmaufnahmen an, die am heimischen PC über ein Webinterface durchgeführt werden können. Der spätere Abruf der eigenen Stimme ist mit Kosten verbunden und oftmals bindet man sich damit an eine bestimmte Kommunikationshilfe.


Ein Ausblick (Stand Februar 2023)

Zukünftig wird es mit maschinellem Lernen möglich sein, aus wenigen beliebigen Sätzen eine synthetische Stimme zu erstellen - mit Einschränkungen ist das heutzutage bereits der Fall. Das bedeutet, dass sogar wenn ein Stimmverlust bereits eingetreten ist, ein Generieren einer eigenen TTS-Stimme möglich ist, sofern genügend Tonmaterial vorliegt. Sprachnachrichten aus WhatsApp oder vom Anrufbeantworter, aufgezeichnete Hochzeitsreden und Ansprachen oder aufgenommene Gespräche auf Familienvideos kann dann dazu dienen, eine eigene Stimme zu erzeugen.

Auch bei nicht-medizinischen Anwendungen kann ein nachträgliches Generieren von nicht mehr zur Verfügung stehenden Stimmen nützlich sein, etwa bei bei der Vertonung alter Filme oder bekannten Markenstimmen, für die die Originalstimme nicht mehr zur Verfügung steht.

Ein großer Vorteil kommender KI-Lösungen wird ein immer natürlicheres Klangbild sein.

Bereits 2017 hat das kanadische Unternehmen Lyrebird, das von Studierenden der Universität Montréal gegründet wurde, eine Software vorgestellt, die beliebige Stimmen nachahmt. Für das Training sind nur wenige Minuten Sprachmaterial nötig. Auch von Googletochter DeepMind und Adobe war damals bereits bekannt, dass diese Unternehmen an Lösungen mit persönlichen Stimmen arbeiten. Zu dieser Zeit gab es bereits eine Kontroverse, wie künstliche Intelligenz beliebige Stimmen nachmachen kann und damit ein Täuschen mit bekannten Stimmen möglich macht, was von harmlosen Streichen bis hin zum kriminellen Missbrauch führen kann. So waren auf Videoportalen singende Donald Trumps oder Barack Obamas zu sehen, denen ihre eigene Stimme in den Mund gelegt wurden - mit Inhalten, die sie so nie von sich gegeben haben. Alle Anbieter eigener Stimmen dürften sich mittlerweile darüber einig sein, dass die eigene Stimme ein Ausdruck der ureigener Identität ist, die ohne Erlaubnis nur von ihrem Besitzer verwendet werden darf und dementsprechend gegen Missbrauch zu schützen ist.

Eigene Stimmen bieten viel Potenzial, nicht nur für Menschen, denen ein Stimmverlust droht. Die Einsatzmöglichkeiten einer gut klingenden eigenen Computerstimme dürften gewaltig sein und reichen vom oben genannten Einsatz aus medizinischen Gründen über markante Unternehmensstimmen, die einen Phonebot bespielen bis hin zu elektronischen Kinderbüchern, die mit der Stimme der Eltern vorlesen oder erklären können. Auch hier wird wieder klar, wie stark die eigene Stimme ein Ausdruck der persönlichen Identität ist - für sich selbst und für die Zuhörenden.

Mithilfe künstlicher Intelligenz eine eigene Stimme zu erzeugen, ist bislang noch sehr rechenintensiv, sofern die KI tatsächlich von der Pike an lernen soll, zu sprechen. Als Abwandlung für den Privatgebrauch dieser noch zu rechenintensiven Lösungen werden heutzutage aber bereits bestehende Grundstimmen moduliert, was zu einer ebenfalls persönlichen Stimme führt, die der Originalstimme nahe kommt, die aber mit weniger Rechenleistung auskommt.

Fazit und Beratungsangebot

Die eigene Stimme sich zu bewahren kann eine Option sein bei einem prognostizierten Stimmverlust.

Haben Sie Interesse an der Aufnahme Ihrer eigenen Stimme aus medizinischen Gründen (z. B. als ALS-Betroffener), so helfen wir Ihnen gerne weiter und vermitteln Ihnen Kontakte zu geeigneten Anbietern. Diese Beratung ist kostenfrei und kann auch von Logopäden, Ärzten, Therapeuten und Pflegern in Anspruch genommen werden.

Für die spätere Implementierung Ihrer eigenen Stimme in einen Sprachcomputer und zu Fragen der Kostenübernahme durch die gesetzlichen Krankenversicherungen stehen wir Ihnen über unser Hilfsmittelberater-Netzwerk mit vielen regionalen Beratungsstellen bundesweit zur Seite.

Kostenfreie Beratung




 
© 2023  Meine-Stimme.de