Ich würde gerne die Nachrichten von unserem Anrufbeantworter von einer Software transkribieren lassen. In der Hoffnung, das meine MFA somit die Anfragen schneller bearbeiten können.
Dies sollte möglichst lokal und datenschutzkonform ablaufen. Die Nachrichten werden von unserer Telefonanlage aufgezeichnet und befinden sich danach als Anhänge in Form von .wav-Dateien auf einem lokalen E-Mail-Server.
Hat hier jemand Erfahrung?
Es gibt ja Lösungen wie aaron.ai. Vielleicht gibt es aber auch eine bessere Alternative?
Voicemail Anrufbeantworter: Nachrichten in Text transkribieren
Moderator: Forum Moderatoren
Forumsregeln
TM-Startforum - "offen für alle Themen".
Beiträge, die in einen anderen Bereich passen, werden bei Bedarf verschoben.
TM-Startforum - "offen für alle Themen".
Beiträge, die in einen anderen Bereich passen, werden bei Bedarf verschoben.
-
- Beiträge: 90
- Registriert: Mittwoch 28. Oktober 2015, 17:16
- 8
- Hat sich bedankt: 7 mal
- Hat Dank erhalten: 14 mal
- FortiSecond
- Beiträge: 690
- Registriert: Dienstag 2. August 2022, 21:30
- 2
- Hat sich bedankt: 289 mal
- Hat Dank erhalten: 201 mal
Re: Voicemail Anrufbeantworter: Nachrichten in Text transkribieren
Aktueller Stand bei mir:
Variante 1: Asterisk-Anlage, derzeit mit Google-Transkription. Simpel zu machen, aber nicht datenschutzgerecht. Sendet Mails mit Nachricht als Text und Anhang (wichtig bei falsch erfassten Namen und Fachbegriffen). Funktioniert, aber ich muss es noch auf eine lokale Speech-To-Text-API umschreiben (um Google rauszuhalten). Allein, die Zeit fehlt.
Variante 2: Lokale KI, Ordner-Beobachtung, neue Audiodateien werden automatisch transkribiert und in einem zweiten Ordner abgelegt. Recht gut, aber für eine erstklassige Erkennung bei unterschiedlichsten Stimmen und Akzenten braucht es dann doch ein großes Erkennungsmodell samt entsprechender Rechenpower. Allein in der CPU mit i5 der 8. Generation und 32 GByte RAM macht es keinen Spaß. Mit RTX-Grafikkarte geht´s halbwegs gut, aber die ganz guten Sprachmodelle erfordern mehr RAM auf der Grafikkarte - hier kann man in den Arbeitsspeicher des PC auslagern, was immer noch flotter ist als CPU-only. Allerdings muss man sehen, ob es verhältnismäßig ist, so einen PC dauerhaft eingeschaltet zu lassen, wenn er nur ein paar Dateien transkribieren soll.
Alternativ kann man natürlich diesen PC nutzen für normale Arbeit und die KI bei Bedarf eben starten. Sind nur Sekunden.
Wie das geht? Ich erarbeite anhand der derzeit noch in Optimierung befindlichen Lösung ein How-To. Kann aber noch ein paar Wochen dauern.
Ziel: Ordnerabgleich von Fritzbox, Asterisk, FreePBX usw., automatischer Aufruf der Transkription bei neuen Dateien. Ablage in anderem Ordner. Optional Bereitstellung in einem lokalen IMAP-Postfach.
Variante 1: Asterisk-Anlage, derzeit mit Google-Transkription. Simpel zu machen, aber nicht datenschutzgerecht. Sendet Mails mit Nachricht als Text und Anhang (wichtig bei falsch erfassten Namen und Fachbegriffen). Funktioniert, aber ich muss es noch auf eine lokale Speech-To-Text-API umschreiben (um Google rauszuhalten). Allein, die Zeit fehlt.
Variante 2: Lokale KI, Ordner-Beobachtung, neue Audiodateien werden automatisch transkribiert und in einem zweiten Ordner abgelegt. Recht gut, aber für eine erstklassige Erkennung bei unterschiedlichsten Stimmen und Akzenten braucht es dann doch ein großes Erkennungsmodell samt entsprechender Rechenpower. Allein in der CPU mit i5 der 8. Generation und 32 GByte RAM macht es keinen Spaß. Mit RTX-Grafikkarte geht´s halbwegs gut, aber die ganz guten Sprachmodelle erfordern mehr RAM auf der Grafikkarte - hier kann man in den Arbeitsspeicher des PC auslagern, was immer noch flotter ist als CPU-only. Allerdings muss man sehen, ob es verhältnismäßig ist, so einen PC dauerhaft eingeschaltet zu lassen, wenn er nur ein paar Dateien transkribieren soll.
Alternativ kann man natürlich diesen PC nutzen für normale Arbeit und die KI bei Bedarf eben starten. Sind nur Sekunden.
Wie das geht? Ich erarbeite anhand der derzeit noch in Optimierung befindlichen Lösung ein How-To. Kann aber noch ein paar Wochen dauern.
Ziel: Ordnerabgleich von Fritzbox, Asterisk, FreePBX usw., automatischer Aufruf der Transkription bei neuen Dateien. Ablage in anderem Ordner. Optional Bereitstellung in einem lokalen IMAP-Postfach.
--
TurboMechaniker seit 1992, kann auch etwas T2, Medoff, ALBIS, inSuite
TurboMechaniker seit 1992, kann auch etwas T2, Medoff, ALBIS, inSuite
Wer ist online?
Mitglieder in diesem Forum: Bing [Bot] und 0 Gäste