Initial test commit for github pages

This commit is contained in:
Thorsten Mueller 2020-09-28 17:52:40 +02:00
parent 37fca598cb
commit 5cc6f0e913
2 changed files with 66 additions and 0 deletions

1
docs/index.html Normal file
View File

@ -0,0 +1 @@
Hello World of free german tts

65
docs/test.md Normal file
View File

@ -0,0 +1,65 @@
# Eine freie Deutsche Stimme
Auch wenn die Überschrift stark nach einem politischen Statement klingt, geht es hier um ein völlig anderes Thema.
Derzeit gewinnt die sprachbasierte Bedienung von Maschinen rasant an Bedeutung. Viele kennen diese Kommunikation bereits aus ihrem Alltag mit Smartphones oder so genannten smarten Assistenten wie Apple Siri, Google Home oder Amazon Alexa.
Die Systeme der großen Hersteller bringen neben sehr vielen Vorteilen auch einige durchaus schwerwiegende Nachteile mit sich.
* Cloud basierend und stehen ständig im "Kontakt" mit den Servern der Hersteller
* Datenschutz nach deutschen oder europäischen Standards kann nicht garantiert werden
* Die Hoheit über die eigenen Daten wird aufgegeben (keine Kontrolle über deren Verwendung)
* Bedenken darüber, wer mithören könnte, da die Geräte konstant mit den Servern der Hersteller Daten austauschen
Daher (glaube ich), dass es einige Menschen gibt, die zwar die Vorteile solcher Systeme sehen, aber aufgrund von den genannten Datenschutzbedenken von deren Nutzung absehen.
# Alternativen
Glücklicherweise bilden sich auch Alternativen (u.a. OpenSource) heraus um der Marktmarkt der "Big Player" etwas entgegenzutreten. Einige davon sind:
* Mozilla Voice Projekte
* MyCroft AI
Diese (und andere) Communities arbeiten daran entsprechende Alternativen anzubieten. Jedoch steht hier oft die englische Sprache im Vordergrund. Dies ist gerade bei der Interaktion mit deutschsprachigen Anwendern natürlich nicht hilfreich.
# Freies deutsches TTS - was ist das?
Haben sie ihren persönlichen smarten Assistenten (oder Smartphone) schon einmal nach dem Wetter, Terminen, oder ähnlichem gefragt?
Falls ja nehme ich an, dass sie auch eine deutschsprachige Antwort erhalten haben, in einer gut verständlichen Qualität.
Technisch gesehen, waren sie genau dann ein Konsument von cloud basiertem TTS - also der Erzeugung der Antwort auf ihre Frage in deutscher Sprache.
Natürlich wissen Amazon, Google und Apple um die gute Qualität ihrer künstlichen Stimmen und sind u.a. daher nicht bereit, diese für eine private- und kostenfreie Offlinenutzung zur Verfügung zu stellen.
Und genau da liegt eines der großen Probleme in (quelloffenen) Alternativen. Selbst wenn große Anteile kostenfrei und offline zu betreiben sind, spätestens bei der Sprachausgabe sind sie auf die "Big Player" angewiesen, sofern sie einen gewissen Qualitätsanspruch haben.
# Wie hilft dieses Projekt
Vor einiger Zeit habe ich beschlossen meine persönliche Stimme zu spenden und habe dazu über 23 Stunden meiner Sprache aufgezeichnet auf Basis freier Texte. Damit kann mit aktuellen "Machine Learning" Techniken eine synthetische Stimme berechnet werden. Folgende Aspekte sind mir dabei wichtig:
* OpenSource Projekte und kleinere Communities sollen eine deutsche Stimme offline mit ausliefern können.
* Problemlose Nutzung für wissenschaftliche Zwecke, sowie Forschung und Bildung.
* Auch die kommerzielle Nutzung soll möglich sein.
* Keine Einschränkungen bezüglich der Nutzung (CC0-Lizenz).
# One voice show?
> Um ein historisches Zitat leicht abzuwandeln: "Es ist eine kleine Stimme für mich, aber eine große Stimme für die Menschheit".
Nein, es ist definitiv keine "one voice show"!
Die Stimme (die verfügbaren Originalaufnahmen, sowie das künstliche Modell davon) ist meine, aber ohne die Unterstützung weiterer Enthusiasten aus diesem Bereich wäre wohl niemals ein nutzbares Modell herausgekommen.
Daher bedanke ich mich herzlich bei allen Mitstreitern aus der "Gemeinschaft eines freien deutschen TTS Modells"
> Memo an mich: Auf englisch klingt das "Herr der Ringe" Zitat irgendwie besser
> "Fellowership of free german tts"
* Dominik Kreutz (github page)
* klären ob, bzw. wer mit welchem Namen gelistet sein möchte
# Aktueller Stand
Wir wissen, dass das aktuelle Modell qualitativ noch viel Luft nach oben hat. Aber wir sind weiterhin motiviert und probieren verschiedene Konfigurationen aus um in Zukunft hoffentlich ein noch besseres Modell zur Verfügung stellen zu können.
Da die Originalaufnahmen öffentlich sind, ist jeder eingeladen eigene Modell und Trainingskonfigurationen auszuprobieren.
# Zu guter Letzt
Da ich keinen großen Einfluss habe, welche Aussagen mit meiner Stimme zukünftig gemacht werden, möchte ich doch einige Punkte sagen, die mir persönlich wichtig sind:
Ich teile meine Stimme als Person, die daran glaubt, dass alle Menschen gleichberechtigt sind, unabhängig von Geschlecht, sexueller Orientierung, Religion, Hautfarbe oder den Geokoordinaten der Geburt. An eine Welt wo jeder Mensch zu jeder Zeit herzlich Willkommen ist und wo Bildung und Wissen für jeden frei verfügbar ist.
# Beispiele
* [Es ist im Moment klarer Himmel bei 18 Grad.](https://drive.google.com/file/d/1cDIq4QG6i60WjUYNT6fr2cpEjFQIi8w5/view?usp=sharing)
* [Ich verstehe das nicht, aber ich lerne jeden Tag neue Dinge.](https://drive.google.com/file/d/1kja_2RsFt6EmC33HTB4ozJyFlvh_DTFQ/view?usp=sharing)
* [Ich bin jetzt bereit.](https://drive.google.com/file/d/1GkplGH7LMJcPDpgFJocXHCjRln_ccVFs/view?usp=sharing)
* [Bitte warte einen Moment, bis ich fertig mit dem Booten bin.](https://drive.google.com/file/d/19Td-F14n_05F-squ3bNlt2BDE-NMFaq1/view?usp=sharing)
* [Mein Name ist MyCroft und ich bin funky.](https://drive.google.com/file/d/1dbyOyE7Oy8YdAsYqQ4vz4VJjiWIyc8oV/view?usp=sharing)