Voicemail Anrufbeantworter: Nachrichten in Text transkribieren

Fragen, Anregungen oder Tipps und Tricks? Hier ist der erste Anlaufpunkt.
Nicht sicher, wo ein Thema hingehört? Hier hinein - wir kümmern uns! :)

Moderator: Forum Moderatoren

Forumsregeln
TM-Startforum - "offen für alle Themen".
Beiträge, die in einen anderen Bereich passen, werden bei Bedarf verschoben.
Antworten
TMUser2015
Beiträge: 90
Registriert: Mittwoch 28. Oktober 2015, 17:16
8
Hat sich bedankt: 7 mal
Hat Dank erhalten: 14 mal

Voicemail Anrufbeantworter: Nachrichten in Text transkribieren

Beitrag von TMUser2015 »

Ich würde gerne die Nachrichten von unserem Anrufbeantworter von einer Software transkribieren lassen. In der Hoffnung, das meine MFA somit die Anfragen schneller bearbeiten können.

Dies sollte möglichst lokal und datenschutzkonform ablaufen. Die Nachrichten werden von unserer Telefonanlage aufgezeichnet und befinden sich danach als Anhänge in Form von .wav-Dateien auf einem lokalen E-Mail-Server.
Hat hier jemand Erfahrung?

Es gibt ja Lösungen wie aaron.ai. Vielleicht gibt es aber auch eine bessere Alternative?
Benutzeravatar
FortiSecond
Beiträge: 690
Registriert: Dienstag 2. August 2022, 21:30
2
Hat sich bedankt: 289 mal
Hat Dank erhalten: 201 mal

Re: Voicemail Anrufbeantworter: Nachrichten in Text transkribieren

Beitrag von FortiSecond »

Aktueller Stand bei mir:

Variante 1: Asterisk-Anlage, derzeit mit Google-Transkription. Simpel zu machen, aber nicht datenschutzgerecht. Sendet Mails mit Nachricht als Text und Anhang (wichtig bei falsch erfassten Namen und Fachbegriffen). Funktioniert, aber ich muss es noch auf eine lokale Speech-To-Text-API umschreiben (um Google rauszuhalten). Allein, die Zeit fehlt.

Variante 2: Lokale KI, Ordner-Beobachtung, neue Audiodateien werden automatisch transkribiert und in einem zweiten Ordner abgelegt. Recht gut, aber für eine erstklassige Erkennung bei unterschiedlichsten Stimmen und Akzenten braucht es dann doch ein großes Erkennungsmodell samt entsprechender Rechenpower. Allein in der CPU mit i5 der 8. Generation und 32 GByte RAM macht es keinen Spaß. Mit RTX-Grafikkarte geht´s halbwegs gut, aber die ganz guten Sprachmodelle erfordern mehr RAM auf der Grafikkarte - hier kann man in den Arbeitsspeicher des PC auslagern, was immer noch flotter ist als CPU-only. Allerdings muss man sehen, ob es verhältnismäßig ist, so einen PC dauerhaft eingeschaltet zu lassen, wenn er nur ein paar Dateien transkribieren soll.
Alternativ kann man natürlich diesen PC nutzen für normale Arbeit und die KI bei Bedarf eben starten. Sind nur Sekunden.

Wie das geht? Ich erarbeite anhand der derzeit noch in Optimierung befindlichen Lösung ein How-To. Kann aber noch ein paar Wochen dauern.

Ziel: Ordnerabgleich von Fritzbox, Asterisk, FreePBX usw., automatischer Aufruf der Transkription bei neuen Dateien. Ablage in anderem Ordner. Optional Bereitstellung in einem lokalen IMAP-Postfach.
--
TurboMechaniker seit 1992, kann auch etwas T2, Medoff, ALBIS, inSuite
Antworten

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 0 Gäste