forked from extern/Thorsten-Voice
changed index page to short version
This commit is contained in:
parent
5e7318fbb1
commit
6c34cf0915
@ -1,60 +1,43 @@
|
|||||||
# tl;dr
|
# Motivation
|
||||||
---
|
|
||||||
|
|
||||||
<span style="font-family:Papyrus; font-size:3em;color:green"> Eine kostenfreie qualitativ hochwertige deutsche Stimme, die lokal erzeugt werden kann!</span>
|
<span style="font-size:1.5em;font-weight:bold">
|
||||||
|
Eine kostenfreie, qualitativ hochwertige, deutsche TTS Stimme, die offline erzeugt werden kann sollte jedem Projekt ohne Lizenzrechtliche Probleme zur Verfügung stehen.
|
||||||
---
|
</span>
|
||||||
|
|
||||||
|
|
||||||
# Eine freie Deutsche Stimme
|
# Egal aus welchem Bereich du kommst:
|
||||||
Auch wenn die Überschrift stark nach einem politischen Statement klingt, geht es hier um ein völlig anderes Thema.
|
* Privates Bastelprojekt
|
||||||
|
* OpenSource/Community Projekt
|
||||||
Derzeit gewinnt die sprachbasierte Bedienung von Maschinen rasant an Bedeutung. Viele kennen diese Kommunikation bereits aus ihrem Alltag mit Smartphones oder so genannten smarten Assistenten wie Apple Siri, Google Home oder Amazon Alexa.
|
|
||||||
|
|
||||||
Die Systeme der großen Hersteller bringen, neben sehr vielen Vorteilen, auch einige durchaus schwerwiegende Nachteile im Datenschutzbereich mit sich (Cloudzwang, mangelnde Hoheit über die eigenen Daten, Bedenken über "Mithörer", ...). Daher gibt es durchaus Menschen, die zwar die Vorteile solcher Systeme gerne nutzen möchten, aber aufgrund von den genannten Datenschutzbedenken von deren Nutzung absehen.
|
|
||||||
|
|
||||||
# Alternativen zu (_online Spracherzeugung_) von Amazon, Google, Apple, ...
|
|
||||||
Glücklicherweise bilden sich auch Alternativen (u.a. OpenSource) heraus um der Marktmarkt der "Big Player" etwas entgegenzutreten. Einige davon sind:
|
|
||||||
|
|
||||||
* Mozilla Voice Projekte
|
|
||||||
* MyCroft AI
|
|
||||||
|
|
||||||
Diese (und andere) Communities arbeiten daran entsprechende Alternativen anzubieten. Jedoch steht hier oft die englische Sprache im Vordergrund. Dies ist gerade bei der Interaktion mit deutschsprachigen Anwendern natürlich nicht hilfreich.
|
|
||||||
|
|
||||||
# Freies deutsches TTS - was ist das?
|
|
||||||
Die meisten haben sicherlich schon einmal einen persönlichen smarten Assistenten (oder Smartphone) nach dem Wetter, Terminen, oder ähnlichem gefragt.
|
|
||||||
Falls dem so ist und das Gerät eine gut verständliche deutsche Antwort geliefert hat wurden in diesem Fall "Cloud Resourcen" genutzt.
|
|
||||||
|
|
||||||
Natürlich wissen Amazon, Google und Apple um die gute Qualität ihrer künstlichen Stimmen und sind u.a. daher nicht bereit, diese für eine private- und kostenfreie Offlinenutzung zur Verfügung zu stellen.
|
|
||||||
Und genau da liegt eines der großen Probleme in (quelloffenen) Alternativen. Selbst wenn große Anteile kostenfrei und offline zu betreiben sind, spätestens bei der Sprachausgabe sind sie auf die "Big Player" angewiesen, sofern sie einen gewissen Qualitätsanspruch haben.
|
|
||||||
|
|
||||||
# Wie und wem hilft dieses Projekt
|
|
||||||
Das freie deutsche Dataset beinhaltet über 23 aufgezeichneter Stunden auf Basis freier Texte. Darauf basieren die mit machine learning trainierten TTS Modelle.
|
|
||||||
Die Nutzung ist **ohne Lizenzrechtliche Bedenken** möglich und steht somit allen Interessierten offen. Zum Beispiel:
|
|
||||||
|
|
||||||
* OpenSource Projekte/Communities
|
|
||||||
* Bildung/Forschung/Wissenschaft
|
* Bildung/Forschung/Wissenschaft
|
||||||
* kommerzielle Einsatzzwecke
|
* Kommerzielles Unternehmen
|
||||||
|
* ...
|
||||||
|
|
||||||
Gerade den kleinen Communities soll hiermit die Möglichkeit geboten zu werden offline TTS Funktion in ihren Projekten mit auszuliefern.
|
# Egal welcher Bereich dich interessiert:
|
||||||
|
* Smarte Sprachassistenten
|
||||||
|
* Navigationssysteme
|
||||||
|
* Smart Homes
|
||||||
|
* Sprechende Kühlschränke
|
||||||
|
* Vorlesen von Bildschirmtexten (Barrierefreiheit)
|
||||||
|
* Interaktive Robotik
|
||||||
|
* ...
|
||||||
|
|
||||||
# Beispiele
|
# Wer wir sind
|
||||||
|
Wir sind eine kleine motivierte Gruppe hobbymäßiger TTS-Enthusiasten die sich nach einem abgewandelten "Herr der Ringe Zitat" benannt hat - "**Fellowership of free german tts**"
|
||||||
|
|
||||||
|
# Wo wir aktuell stehen
|
||||||
|
Wir arbeiten weiterhin daran qualitativ noch bessere Modell zu trainieren, aber den aktuellen "stable" Stand kannst Du hier anhören:
|
||||||
* [Es ist im Moment klarer Himmel bei 18 Grad.](https://drive.google.com/file/d/1cDIq4QG6i60WjUYNT6fr2cpEjFQIi8w5/view?usp=sharing)
|
* [Es ist im Moment klarer Himmel bei 18 Grad.](https://drive.google.com/file/d/1cDIq4QG6i60WjUYNT6fr2cpEjFQIi8w5/view?usp=sharing)
|
||||||
* [Ich verstehe das nicht, aber ich lerne jeden Tag neue Dinge.](https://drive.google.com/file/d/1kja_2RsFt6EmC33HTB4ozJyFlvh_DTFQ/view?usp=sharing)
|
* [Ich verstehe das nicht, aber ich lerne jeden Tag neue Dinge.](https://drive.google.com/file/d/1kja_2RsFt6EmC33HTB4ozJyFlvh_DTFQ/view?usp=sharing)
|
||||||
* [Ich bin jetzt bereit.](https://drive.google.com/file/d/1GkplGH7LMJcPDpgFJocXHCjRln_ccVFs/view?usp=sharing)
|
* [Ich bin jetzt bereit.](https://drive.google.com/file/d/1GkplGH7LMJcPDpgFJocXHCjRln_ccVFs/view?usp=sharing)
|
||||||
* [Bitte warte einen Moment, bis ich fertig mit dem Booten bin.](https://drive.google.com/file/d/19Td-F14n_05F-squ3bNlt2BDE-NMFaq1/view?usp=sharing)
|
* [Bitte warte einen Moment, bis ich fertig mit dem Booten bin.](https://drive.google.com/file/d/19Td-F14n_05F-squ3bNlt2BDE-NMFaq1/view?usp=sharing)
|
||||||
* [Mein Name ist MyCroft und ich bin funky.](https://drive.google.com/file/d/1dbyOyE7Oy8YdAsYqQ4vz4VJjiWIyc8oV/view?usp=sharing)
|
* [Mein Name ist Mycroft und ich bin funky.](https://drive.google.com/file/d/1dbyOyE7Oy8YdAsYqQ4vz4VJjiWIyc8oV/view?usp=sharing)
|
||||||
|
|
||||||
# Aktueller Stand
|
# Interessiert?
|
||||||
Wir (eine Gruppe von netten TTS Enthusiasten) wissen, dass das aktuelle Modell qualitativ noch viel Luft nach oben hat. Aber wir sind weiterhin motiviert in Zukunft hoffentlich noch bessere Modelle zur Verfügung stellen zu können.
|
[Weitere Details, Downloads und Danksagungen findet ihr hier.](https://github.com/thorstenMueller/deep-learning-german-tts "Dataset Details und Thorsten-Modell Download")
|
||||||
|
|
||||||
# Zu guter Letzt
|
|
||||||
Da ich keinen großen Einfluss habe, welche Aussagen mit meiner Stimme zukünftig gemacht werden, möchte ich doch einige Punkte sagen, die mir persönlich wichtig sind:
|
|
||||||
|
|
||||||
Ich teile meine Stimme als Person, die daran glaubt, dass alle Menschen gleichberechtigt sind, unabhängig von Geschlecht, sexueller Orientierung, Religion, Hautfarbe oder den Geokoordinaten der Geburt. An eine Welt wo jeder Mensch zu jeder Zeit herzlich Willkommen ist und wo Bildung und Wissen für jeden frei verfügbar ist.
|
---
|
||||||
|
|
||||||
# Links
|
<span style="font-size:1.5em;font-weight:bold">
|
||||||
* https://github.com/thorstenMueller/deep-learning-german-tts/
|
Wir wünschen euch viel Spaß und Erfolg bei der Umsetzung eurer Projekte :-)
|
||||||
* https://medium.com/@thorsten_Mueller/why-ive-chosen-to-donate-my-german-voice-for-mankind-177beeb91675
|
</span>
|
||||||
* TODO Github Links der Mitstreiter
|
|
||||||
* TODO Modell (TTS Server Package) veröffentlichen
|
|
||||||
|
60
docs/index_longDesc.md
Normal file
60
docs/index_longDesc.md
Normal file
@ -0,0 +1,60 @@
|
|||||||
|
# tl;dr
|
||||||
|
---
|
||||||
|
|
||||||
|
<span style="font-family:Papyrus; font-size:3em;color:green"> Eine kostenfreie qualitativ hochwertige deutsche Stimme, die lokal erzeugt werden kann!</span>
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
|
||||||
|
# Eine freie Deutsche Stimme
|
||||||
|
Auch wenn die Überschrift stark nach einem politischen Statement klingt, geht es hier um ein völlig anderes Thema.
|
||||||
|
|
||||||
|
Derzeit gewinnt die sprachbasierte Bedienung von Maschinen rasant an Bedeutung. Viele kennen diese Kommunikation bereits aus ihrem Alltag mit Smartphones oder so genannten smarten Assistenten wie Apple Siri, Google Home oder Amazon Alexa.
|
||||||
|
|
||||||
|
Die Systeme der großen Hersteller bringen, neben sehr vielen Vorteilen, auch einige durchaus schwerwiegende Nachteile im Datenschutzbereich mit sich (Cloudzwang, mangelnde Hoheit über die eigenen Daten, Bedenken über "Mithörer", ...). Daher gibt es durchaus Menschen, die zwar die Vorteile solcher Systeme gerne nutzen möchten, aber aufgrund von den genannten Datenschutzbedenken von deren Nutzung absehen.
|
||||||
|
|
||||||
|
# Alternativen zu (_online Spracherzeugung_) von Amazon, Google, Apple, ...
|
||||||
|
Glücklicherweise bilden sich auch Alternativen (u.a. OpenSource) heraus um der Marktmarkt der "Big Player" etwas entgegenzutreten. Einige davon sind:
|
||||||
|
|
||||||
|
* Mozilla Voice Projekte
|
||||||
|
* MyCroft AI
|
||||||
|
|
||||||
|
Diese (und andere) Communities arbeiten daran entsprechende Alternativen anzubieten. Jedoch steht hier oft die englische Sprache im Vordergrund. Dies ist gerade bei der Interaktion mit deutschsprachigen Anwendern natürlich nicht hilfreich.
|
||||||
|
|
||||||
|
# Freies deutsches TTS - was ist das?
|
||||||
|
Die meisten haben sicherlich schon einmal einen persönlichen smarten Assistenten (oder Smartphone) nach dem Wetter, Terminen, oder ähnlichem gefragt.
|
||||||
|
Falls dem so ist und das Gerät eine gut verständliche deutsche Antwort geliefert hat wurden in diesem Fall "Cloud Resourcen" genutzt.
|
||||||
|
|
||||||
|
Natürlich wissen Amazon, Google und Apple um die gute Qualität ihrer künstlichen Stimmen und sind u.a. daher nicht bereit, diese für eine private- und kostenfreie Offlinenutzung zur Verfügung zu stellen.
|
||||||
|
Und genau da liegt eines der großen Probleme in (quelloffenen) Alternativen. Selbst wenn große Anteile kostenfrei und offline zu betreiben sind, spätestens bei der Sprachausgabe sind sie auf die "Big Player" angewiesen, sofern sie einen gewissen Qualitätsanspruch haben.
|
||||||
|
|
||||||
|
# Wie und wem hilft dieses Projekt
|
||||||
|
Das freie deutsche Dataset beinhaltet über 23 aufgezeichneter Stunden auf Basis freier Texte. Darauf basieren die mit machine learning trainierten TTS Modelle.
|
||||||
|
Die Nutzung ist **ohne Lizenzrechtliche Bedenken** möglich und steht somit allen Interessierten offen. Zum Beispiel:
|
||||||
|
|
||||||
|
* OpenSource Projekte/Communities
|
||||||
|
* Bildung/Forschung/Wissenschaft
|
||||||
|
* kommerzielle Einsatzzwecke
|
||||||
|
|
||||||
|
Gerade den kleinen Communities soll hiermit die Möglichkeit geboten zu werden offline TTS Funktion in ihren Projekten mit auszuliefern.
|
||||||
|
|
||||||
|
# Beispiele
|
||||||
|
* [Es ist im Moment klarer Himmel bei 18 Grad.](https://drive.google.com/file/d/1cDIq4QG6i60WjUYNT6fr2cpEjFQIi8w5/view?usp=sharing)
|
||||||
|
* [Ich verstehe das nicht, aber ich lerne jeden Tag neue Dinge.](https://drive.google.com/file/d/1kja_2RsFt6EmC33HTB4ozJyFlvh_DTFQ/view?usp=sharing)
|
||||||
|
* [Ich bin jetzt bereit.](https://drive.google.com/file/d/1GkplGH7LMJcPDpgFJocXHCjRln_ccVFs/view?usp=sharing)
|
||||||
|
* [Bitte warte einen Moment, bis ich fertig mit dem Booten bin.](https://drive.google.com/file/d/19Td-F14n_05F-squ3bNlt2BDE-NMFaq1/view?usp=sharing)
|
||||||
|
* [Mein Name ist MyCroft und ich bin funky.](https://drive.google.com/file/d/1dbyOyE7Oy8YdAsYqQ4vz4VJjiWIyc8oV/view?usp=sharing)
|
||||||
|
|
||||||
|
# Aktueller Stand
|
||||||
|
Wir (eine Gruppe von netten TTS Enthusiasten) wissen, dass das aktuelle Modell qualitativ noch viel Luft nach oben hat. Aber wir sind weiterhin motiviert in Zukunft hoffentlich noch bessere Modelle zur Verfügung stellen zu können.
|
||||||
|
|
||||||
|
# Zu guter Letzt
|
||||||
|
Da ich keinen großen Einfluss habe, welche Aussagen mit meiner Stimme zukünftig gemacht werden, möchte ich doch einige Punkte sagen, die mir persönlich wichtig sind:
|
||||||
|
|
||||||
|
Ich teile meine Stimme als Person, die daran glaubt, dass alle Menschen gleichberechtigt sind, unabhängig von Geschlecht, sexueller Orientierung, Religion, Hautfarbe oder den Geokoordinaten der Geburt. An eine Welt wo jeder Mensch zu jeder Zeit herzlich Willkommen ist und wo Bildung und Wissen für jeden frei verfügbar ist.
|
||||||
|
|
||||||
|
# Links
|
||||||
|
* https://github.com/thorstenMueller/deep-learning-german-tts/
|
||||||
|
* https://medium.com/@thorsten_Mueller/why-ive-chosen-to-donate-my-german-voice-for-mankind-177beeb91675
|
||||||
|
* TODO Github Links der Mitstreiter
|
||||||
|
* TODO Modell (TTS Server Package) veröffentlichen
|
43
docs/kurz.md
43
docs/kurz.md
@ -1,43 +0,0 @@
|
|||||||
# Motivation
|
|
||||||
|
|
||||||
<span style="font-size:1.5em;font-weight:bold">
|
|
||||||
Eine kostenfreie, qualitativ hochwertige, deutsche TTS Stimme, die offline erzeugt werden kann sollte jedem Projekt ohne Lizenzrechtliche Probleme zur Verfügung stehen.
|
|
||||||
</span>
|
|
||||||
|
|
||||||
|
|
||||||
# Egal aus welchem Bereich du kommst:
|
|
||||||
* Privates Bastelprojekt
|
|
||||||
* OpenSource/Community Projekt
|
|
||||||
* Bildung/Forschung/Wissenschaft
|
|
||||||
* Kommerzielles Unternehmen
|
|
||||||
* ...
|
|
||||||
|
|
||||||
# Egal welcher Bereich dich interessiert:
|
|
||||||
* Smarte Sprachassistenten
|
|
||||||
* Navigationssysteme
|
|
||||||
* Smart Homes
|
|
||||||
* Sprechende Kühlschränke
|
|
||||||
* Vorlesen von Bildschirmtexten (Barrierefreiheit)
|
|
||||||
* Interaktive Robotik
|
|
||||||
* ...
|
|
||||||
|
|
||||||
# Wer wir sind
|
|
||||||
Wir sind eine kleine motivierte Gruppe hobbymäßiger TTS-Enthusiasten die sich nach einem abgewandelten "Herr der Ringe Zitat" benannt hat - "**Fellowership of free german tts**"
|
|
||||||
|
|
||||||
# Wo wir aktuell stehen
|
|
||||||
Wir arbeiten weiterhin daran qualitativ noch bessere Modell zu trainieren, aber den aktuellen "stable" Stand kannst Du hier anhören:
|
|
||||||
* [Es ist im Moment klarer Himmel bei 18 Grad.](https://drive.google.com/file/d/1cDIq4QG6i60WjUYNT6fr2cpEjFQIi8w5/view?usp=sharing)
|
|
||||||
* [Ich verstehe das nicht, aber ich lerne jeden Tag neue Dinge.](https://drive.google.com/file/d/1kja_2RsFt6EmC33HTB4ozJyFlvh_DTFQ/view?usp=sharing)
|
|
||||||
* [Ich bin jetzt bereit.](https://drive.google.com/file/d/1GkplGH7LMJcPDpgFJocXHCjRln_ccVFs/view?usp=sharing)
|
|
||||||
* [Bitte warte einen Moment, bis ich fertig mit dem Booten bin.](https://drive.google.com/file/d/19Td-F14n_05F-squ3bNlt2BDE-NMFaq1/view?usp=sharing)
|
|
||||||
* [Mein Name ist Mycroft und ich bin funky.](https://drive.google.com/file/d/1dbyOyE7Oy8YdAsYqQ4vz4VJjiWIyc8oV/view?usp=sharing)
|
|
||||||
|
|
||||||
# Interessiert?
|
|
||||||
[Weitere Details, Downloads und Danksagungen findet ihr hier.](https://github.com/thorstenMueller/deep-learning-german-tts "Dataset Details und Thorsten-Modell Download")
|
|
||||||
|
|
||||||
|
|
||||||
---
|
|
||||||
|
|
||||||
<span style="font-size:1.5em;font-weight:bold">
|
|
||||||
Wir wünschen euch viel Spaß und Erfolg bei der Umsetzung eurer Projekte :-)
|
|
||||||
</span>
|
|
Loading…
Reference in New Issue
Block a user