PVA: was nach einem Fedora Releasewechsel zu tun ist

Upgrades vom OS kommen nicht bei allen gut an, weil dabei am Ende oft einiges nicht mehr geht. Carola hat jetzt auch so einen Fall erlebt.

PVA: was nach einem Fedora Releasewechsel zu tun ist

Wenn Ihr von Fedora 36 z.b. auf Fedora 37 updated, dann kann/wird es passieren, daß das Python SoundDevice Paket nicht mehr installiert ist, weil der ganze Ordner beim Upgrade gelöscht und wieder befüllt wird, aber halt nur mit Sachen die via OS Paket kamen 🙁

Im Fall vom PVA ist der Fix relativ einfach:

sudo dnf reinstall pva-base -y

Dadurch werden die nötigen Dependencies wieder installiert und die Show kann weiter gehen. PVA neu starten nicht vergessen 😉

PVA: Die GTTS spricht jetzt anders

Schock in der Morgenstunde: Carola klingt nicht mehr nach Carola.

PVA: Die GTTS spricht jetzt anders

Mit Entsetzen habe ich heute morgen feststellen müssen, daß Google die Spracherzeugung von GTTS geändert hat und das nicht zum Besseren, sondern zurück in die Steinzeit 🙁

Der ganze Charakter der Stimme hat sich geändert, da die zugrundliegende Technik offensichtlich geändert wurde. Die Stimme ist jetzt nicht mehr natürlich, sondern erinnert wieder ganz stark an Pico2Wav.

Da wir beim PVA die erzeugten Texte Cachen gibt es jetzt natürlich die kuriose Situation, daß neue Sprachausgaben anders klingen als die bisherigen. Leider gibt es keine Einstellung, mit der man das ändern könnte, jedenfalls nicht offiziell.

Man könnte zwar über Google’s Cloud System an die Stimme in alter Qualität kommen, und andere, aber das wäre nicht mehr „free“ wie bei gTTS. Es würden sich zwar nur Cents am Tag ansammeln und die Kosten könnte jeder locker stemmen, aber ich denke, es wird Zeit Mimic3 auf Fedora umzusetzen.

Da sind auch rudelweise gute Stimmen dabei.

Falls das mit der Google Cloud einer braucht:

curl -X POST https://texttospeech.googleapis.com/v1beta1/text:synthesize -d ‚{„audioConfig“: {„audioEncoding“: „LINEAR16″,“effectsProfileId“: [„medium-bluetooth-speaker-class-device“],“pitch“: 0,“speakingRate“: 1.23},“input“: {„text“: „Testsatz für die 2023 eingeführte Stimme.“ }, „voice“: {„languageCode“: „de-DE“,“name“: „de-DE-Wavenet-A“}}‘ -H „Authorization: Bearer $(gcloud auth application-default print-access-token)“ -H „Content-Type: application/json; charset=utf-8“

Da muß Eurer Key hin.

PVA: Cluster & Netflix & Streaming zusammen

Ich habe da mal ein Video für euch, aber nicht weiter erzählen 😉

PVA: Cluster & Netflix & Streaming zusammen

Kleine Demo, was man mit PVA so alles machen kann:

Wir haben hier jetzt das Netflixplugin, das Clusterplugin und das Streamingplugin kombiniert.

Die Geräte waren alle in einer Videokonferenz versammelt, damit man das Ergebnis sehen konnte. Die „Küche“ war ein Intel ATOM Tablet, das Wohnzimmer ein alter Laptop. Die Latzenzen bis man etwas sieht, sind jetzt nicht dem Netzwerk geschuldet, sondern dem Umstand, daß wir Livestreaming über FFMPEG machen, wozu FFMPEG erstmal ein paar Sekunden braucht. Es sind aber natürlich andere Wege denkbar: Temporäre Filezugriffe von den Geräten auf einen Share, Netzwerkpipelines usw. da geht noch was 😉

PVA: Clusterplugin für Carola

Netflix Plugin für Carola

Was ich Euch damit aber zeigen möchte ist, daß die Technik da ist. Baut Euch daraus die Wohnungs-KI, die ihr schon immer haben wolltet. KI? War da jetzt KI im Spiel? Nein, natürlich nicht, aber .. da wäre noch was …

KI, or not KI?

JETZT haben Ihr eine KI im Spiel 😀

Ihr merkt, daß ChatGPT hier im Freetalkmodus lief, weshalb alle Anfragen an Carola zu einem „Fehler“ geführt haben. Betreibt man das im Lückenfüllermodus, reagiert es nur auf den PVA Namen. Die Fehler in der Spracherkennung nerven, sind aber im Bereich des vertretbaren. ChatGPT holt da einiges richtig raus.

PVA: Carola trifft auf ChatGPT 4