Thorsten-Voice/README.md
2019-10-29 22:44:35 +01:00

926 B

english version below

Einleitung

Viele (aktuell so angesagte) smarte Assistenten wie Amazon Alexa, Google Home, Apple Siri und Microsoft Cortana benötigen zwingend eine Internetverbindung um u.a. die Funktionen STT (Sprache in Text) und TTS (Text in Sprache) in ordentlicher Qualität anzubieten. Es gibt aber auch Open Source Projekte die alternative Assistenten entwickeln. Für den Bereich "STT/TTS" werden jedoch gute Trainings-Testdaten (bspw. zum Deep-Learning) benötigt.

Was ist hier

Ich habe derzeit 5.000 Phrasen (Ziel: 30.000 Phrasen) eines deutschen Korpus (großen Dank an xxx) aufgenommen. Diese Daten stehen als WAV-Dateien mit CSV Index und alternativ einer SQlite DB (Basis Mimic-Recording-Studio) hier bereit.

Bitte

  • Verwende es bitte nicht für Böses!
  • Schicke mir eine Mail an (mailto) wenn du meine Stimme in einem Projekt einsetzt (auch nur testweise)

Dank

An den Ersteller des Corpus.