AWS Transcribe ist ein von Amazon angebotener Service, der zur Transkription von Audiodateien und gesprochener Sprache in Textform genutzt wird. Auf Basis von Deep-Learning-Prozessen agiert der Dienst automatisiert und hilft bei der schnellen Umwandlung von Sprache in Textdateien. In diesem Beitrag werden Ihnen die Funktion, Vorteile und Bereiche, in denen AWS Transcribe eingesetzt werden kann, näher erklärt.
- Was ist AWS Transcribe?
- Wie funktioniert AWS Transcribe?
- Welche Vorteile bietet AWS Transcribe?
- In welchen Bereichen wird AWS Transcribe eingesetzt?
- Was kostet AWS Transcribe?
Was ist AWS Transcribe?
Mithilfe von Amazon Transcribe wird es Entwicklern ermöglicht, bestehende Anwendungen mit Speech-to-Text-Funktionen zu ergänzen. Dazu verwendet Amazon Transcribe einen Deep-Learning Prozess, um eine automatische Spracherkennung zu gewährleisten und gesprochene Sprache zügig in Textform darstellen zu können. Zudem kann AWS Transcribe beispielsweise mit Streaming-Audio arbeiten und liefert zugehörige Transkriptionen in Echtzeit.
Die Vorteile von Amazon Transcribe lassen sich in den unterschiedlichsten Bereichen einsetzen. Beispielsweise kann der Dienst dazu genutzt werden, Kundendienstanrufe zu transkribieren oder Untertitel für Content automatisiert bereitzustellen.
Wie funktioniert AWS Transcribe?
Der Dienst analysiert Audiodateien und verwendet dabei fortschrittlichste Machine Learning Lernverfahren. Der Dienst arbeitet innerhalb der Praxis auf Grundlage dreier Vorgänge. Dazu zählen:
- StartTranscriptionJob: Wird genutzt, um einen Batch-Job zur Transkription von gesprochener Sprache in Textform umzuwandeln.
- ListTranscriptionJob: Durch ListTranscriptionJob lässt sich eine Liste gestarteter Transkriptionen anzeigen. Dementsprechend erhält der Nutzer hierdurch eine ausführliche Auflistung anstehender oder abgeschlossener Aufträge.
- GetTranscriptionJob: GetTranscriptionJob gibt das Ergebnis einer Transkription wieder. Nach dem Beenden eines Auftrags erhält der Nutzer zugehörige Ergebnisse in Form eines Links zu einer JSON-Datei.
Damit die Umwandlung von Audiodateien in Textform gelingt, bietet Amazon Transcribe einen passenden Vorgang:
- StartStreamTranscription: Durch die Anwendung von StartStreamTrancription wird ein HTTP/2-Stream gestartet, wodurch Audiodateien in Amazon Transcribe gestreamt werden und entsprechende Ergebnisse einer Transkription sichtbar sind.
Zudem lassen sich des weiteren im Rahmen von AWS Transcribe verschiedene benutzerdefinierte Vokabulare nutzen, um Sprache beispielsweise effizienter zu verarbeiten. Zu den angebotenen Vokabularen gehören:
- CreateVocabulary: Erstellt ein eigenes Vokabular, welches sich zur Analyse eigener Transkriptionsaufträge nutzen lässt.
- DeleteVocabulary: Wird genutzt, um ein benutzerdefiniertes Vokabular aus dem eigenen Konto zu löschen.
- GetVocabulary: Getvocabulary dient dem herunterladen eines Vokabulars, indem Informationen über ein benutzerdefiniertes Vokabular mit zugehöriger URL bereitstehen.
- ListVocabularies: Fragt eine Liste eines eigenen Vokabulars ab.
- UpdateVocabulary: Dient der Aktualisierung eins bestehenden Vokabulars.
Welche Vorteile bietet AWS Transcribe?
Der von Amazon angebotene Dienst bietet dem Nutzer einige Vorteile. Zu diesen Vorteilen gehören unter anderem:
- Erstellung von Transkriptionen: Die Speech-to-Text-Verarbeitung von Amazon agiert weitaus präziser als eine manuelle Transkription. Dabei erfolgt die automatisierte Ausgabe in wenigen Sekunden und ist meist kostengünstiger.
- Filterfunktion: Neben dem reinen transkribieren schafft es der Dienst außerdem, bestimmte Wörter zu filtern. Dazu gehören beispielsweise anstößige Wörter, oder Wörter welche für eine Zielgruppe nicht relevant sind. AWS Transcribe kann diese Wörter markieren und selbstständig entfernen.
- Hohe Genauigkeit bei der Transkription: Damit der Dienst möglichst genaue Transkriptionen liefert, lassen sich eigens definierte Vokabellisten und Sprachmodelle erstellen, indem neue Wörter zum Grundvokabular hinzugefügt werden können. Beispielsweise gehören zu diesen Wörtern Begriffe wie Produktnamen, Fachbegriffe oder Namen von Personen.
- Datenschutz: Damit der Datenschutz vertraulicher Daten gewährleistet wird, lassen sich sensible Daten identifizieren und entfernen. Dies hat den Zweck, dass in Bereichen wie dem Kundenservice vertrauliche Daten nicht ungewollt an Dritte gelangen können und eine vertrauliche Aufbereitung wichtiger Daten gewährleistet ist.
In welchen Bereichen wird AWS Transcribe eingesetzt?
Die Transkription von Sprachdateien lässt sich in vielen unterschiedlichen Bereichen einsetzen. Hierzu zählen beispielsweise:
Anrufanalyse in Echtzeit
Damit Mitarbeiter in Kontaktzentren die Absicht und Stimmung eines Kunden identifizieren können, lässt sich AWS Transcribe und Amazon Comprehend beispielsweise so nutzen, dass Mitarbeiter zudem handlungsrelevante Informationen in Echtzeit erhalten. Dementsprechend agiert der Dienst in diesem Bereich als eine Art Dienst zur Mitarbeiterunterstützung. Dadurch verbessert sich zum einen die Mitarbeiterproduktivität und zum anderen kann der Kunde präziser beraten werden, wodurch sich seine Zufriedenheit nachhaltig verbessert.
Dokumentation in der Medizin
Zudem lässt sich AWS Transcribe in zunächst unüblichen Bereichen wie der Medizin einsetzen. Dort hilft der Dienst dabei, Gespräche zwischen einem Patienten und Arzt in Textform darzustellen. Diese in Textform gespeicherten Daten und Informationen lassen sich im weiteren Verlauf in bestehende Gesundheitsakten einfügen. Durch die automatische Transkription von Text zu Patientenakten kann diese gewonnene Zeit in eine verbesserte Patientenversorgung investiert werden, ohne dass die Dokumentation eines Krankheitsbilds leidet.
Erstellung von Untertiteln
Mithilfe des Dienstes ist es möglich, Untertitel zu bestimmten Medieninhalten automatisiert darzustellen. Dies ist vor allem dann hilfreich, wenn die manuelle Transkription aufgrund des riesigen Angebots an Inhalten kaum umsetzbar ist. An dieser Stelle hilft AWS Transcribe mit Erfolg, wichtige Inhalte dennoch mit Untertiteln zu versehen.
Medienintelligenz
Zudem hilft AWS Transcribe in Bereichen wie der Überwachung bestimmter Inhalte dabei, konkrete Richtlinien einzuhalten. Dies ist vor allem hilfreich, wenn es sich hierdurch um vertrauliche Bereiche eines Unternehmens handelt, bei denen keine anstößigen oder vertraulichen Inhalte bestehen oder an Dritte gelangen dürfen.
Digitaler Schreibassistent
Egal ob Arbeitsbesprechungen, Lehrvorträgen, Seminaren oder Gerichtsverfahren, in all diesen und vielen weiteren Bereichen lässt sich der von Amazon angebotene Dienst zur Sprachverarbeitung einsetzen, um gesprochene Sprache und dementsprechend wichtige Inhalte zu protokollieren und als Textdokument festzuhalten. Im Gericht kann AWS Transcribe beispielsweise dazu genutzt werden, um ganze Prozesse sowie Anhörungen oder Zeugenaussagen in Textform zu transkribieren und zu speichern. Diese gespeicherten Daten lassen sich im weiteren Verlauf eines Gerichtsverfahrens effizient nutzen, um Inhalte und Sachverhalte abzugleichen. Zudem ist ist vor allem hilfreich, wenn es sich um Verfahren handelt, welche sich über mehrere Jahre strecken.
Was kostet AWS Transcribe?
Im Rahmen des Dienstes zahlt der Kunde nur den Teil, den er tatsächlich nutzt. Dies bedeutet, dass AWS die Abrechnung auf Basis von Zeit für transkribierte Audiodateien pro Monat abrechnet. Bei der Neuanmeldung erhält der Nutzer jedoch eine Analyse von bis zu 60 Audiominuten pro Monat für die ersten 12 Monate kostenlos.
Abseits der kostenlosen Probeeinheiten berechnen AWS folgende Standardpreise für seine Kunden:
Stufe | Volumen (Minuten/ Monat) | Streaming/- Batch-Transkriptionen (USD/Sekunde) | Streaming/- Batch-Transkriptionen (USD/Minute) |
T1 | Die ersten 250.000 Minuten | 0,00040 USD | 0,0240 USD |
T2 | Weitere 750.000 Minuten | 0,00025 USD | 0,0150 USD |
T3 | Weitere 4 Mio. Minuten | 0,00017 USD | 0,0102 USD |
T4 | Mehr als 5 Mio. Minuten | 0,00013 USD | 0,0078 USD |
Um eine konkrete Vorstellung zu haben, würden sich die Kosten bei einem Umfang von beispielsweise 200.000 zu analysierenden Telefonaten, bei denen ein Telefonat rund 10 Minuten dauert, auf etwa 27.000 USD belaufen.
Fazit
Wie bei vielen AWS-Diensten sind die Einsatzmöglichkeiten weitreichend. Ob Audioaufzeichnungen von Reden oder Konferenzen, Telefongespräche im Callcenter oder medizinische Aufzeichnungen. Dank AWS Transcribe erfolgt eine automatisierte Transkription von Audiodateien in Text, sodass wichtige Informationen jederzeit in Textform vorliegen.