PVA: Die GTTS spricht jetzt anders

Schock in der Morgenstunde: Carola klingt nicht mehr nach Carola.

PVA: Die GTTS spricht jetzt anders

Mit Entsetzen habe ich heute morgen feststellen müssen, daß Google die Spracherzeugung von GTTS geändert hat und das nicht zum Besseren, sondern zurück in die Steinzeit 🙁

Der ganze Charakter der Stimme hat sich geändert, da die zugrundliegende Technik offensichtlich geändert wurde. Die Stimme ist jetzt nicht mehr natürlich, sondern erinnert wieder ganz stark an Pico2Wav.

Da wir beim PVA die erzeugten Texte Cachen gibt es jetzt natürlich die kuriose Situation, daß neue Sprachausgaben anders klingen als die bisherigen. Leider gibt es keine Einstellung, mit der man das ändern könnte, jedenfalls nicht offiziell.

Man könnte zwar über Google’s Cloud System an die Stimme in alter Qualität kommen, und andere, aber das wäre nicht mehr „free“ wie bei gTTS. Es würden sich zwar nur Cents am Tag ansammeln und die Kosten könnte jeder locker stemmen, aber ich denke, es wird Zeit Mimic3 auf Fedora umzusetzen.

Da sind auch rudelweise gute Stimmen dabei.

Falls das mit der Google Cloud einer braucht:

curl -X POST https://texttospeech.googleapis.com/v1beta1/text:synthesize -d ‚{„audioConfig“: {„audioEncoding“: „LINEAR16″,“effectsProfileId“: [„medium-bluetooth-speaker-class-device“],“pitch“: 0,“speakingRate“: 1.23},“input“: {„text“: „Testsatz für die 2023 eingeführte Stimme.“ }, „voice“: {„languageCode“: „de-DE“,“name“: „de-DE-Wavenet-A“}}‘ -H „Authorization: Bearer $(gcloud auth application-default print-access-token)“ -H „Content-Type: application/json; charset=utf-8“

Da muß Eurer Key hin.