AWS
Machine Learning

AWS Transcribe

AWS Transcribe ist ein von Amazon angebotener Service, der zur Transkription von Audiodateien und gesprochener Sprache in Textform genutzt wird. Auf Basis von Deep-Learning-Prozessen agiert der Dienst automatisiert und hilft bei der schnellen Umwandlung von Sprache in Textdateien. In diesem Beitrag werden Ihnen die Funktion, Vorteile und Bereiche, in denen AWS Transcribe eingesetzt werden kann, näher erklärt. 

  1. Was ist AWS Transcribe? 
  2. Wie funktioniert AWS Transcribe? 
  3. Welche Vorteile bietet AWS Transcribe? 
  4. In welchen Bereichen wird AWS Transcribe eingesetzt? 
  5. Was kostet AWS Transcribe? 

Was ist AWS Transcribe? 

Mithilfe von Amazon Transcribe wird es Entwicklern ermöglicht, bestehende Anwendungen mit Speech-to-Text-Funktionen zu ergänzen. Dazu verwendet Amazon Transcribe einen Deep-Learning Prozess, um eine automatische Spracherkennung zu gewährleisten und gesprochene Sprache zügig in Textform darstellen zu können. Zudem kann AWS Transcribe beispielsweise mit Streaming-Audio arbeiten und liefert zugehörige Transkriptionen in Echtzeit.  

Die Vorteile von Amazon Transcribe lassen sich in den unterschiedlichsten Bereichen einsetzen. Beispielsweise kann der Dienst dazu genutzt werden, Kundendienstanrufe zu transkribieren oder Untertitel für Content automatisiert bereitzustellen.  

Wie funktioniert AWS Transcribe? 

Der Dienst analysiert Audiodateien und verwendet dabei fortschrittlichste Machine Learning Lernverfahren. Der Dienst arbeitet innerhalb der Praxis auf Grundlage dreier Vorgänge. Dazu zählen: 

  • StartTranscriptionJob: Wird genutzt, um einen Batch-Job zur Transkription von gesprochener Sprache in Textform umzuwandeln. 
     
  • ListTranscriptionJob: Durch ListTranscriptionJob lässt sich eine Liste gestarteter Transkriptionen anzeigen. Dementsprechend erhält der Nutzer hierdurch eine ausführliche Auflistung anstehender oder abgeschlossener Aufträge.  
     
  • GetTranscriptionJob: GetTranscriptionJob gibt das Ergebnis einer Transkription wieder. Nach dem Beenden eines Auftrags erhält der Nutzer zugehörige Ergebnisse in Form eines Links zu einer JSON-Datei. 

Damit die Umwandlung von Audiodateien in Textform gelingt, bietet Amazon Transcribe einen passenden Vorgang: 

  • StartStreamTranscription: Durch die Anwendung von StartStreamTrancription wird ein HTTP/2-Stream gestartet, wodurch Audiodateien in Amazon Transcribe gestreamt werden und entsprechende Ergebnisse einer Transkription sichtbar sind. 

Zudem lassen sich des weiteren im Rahmen von AWS Transcribe verschiedene benutzerdefinierte Vokabulare nutzen, um Sprache beispielsweise effizienter zu verarbeiten. Zu den angebotenen Vokabularen gehören: 

  • CreateVocabulary: Erstellt ein eigenes Vokabular, welches sich zur Analyse eigener Transkriptionsaufträge nutzen lässt. 
  • DeleteVocabulary: Wird genutzt, um ein benutzerdefiniertes Vokabular aus dem eigenen Konto zu löschen. 
  • GetVocabulary: Getvocabulary dient dem herunterladen eines Vokabulars, indem Informationen über ein benutzerdefiniertes Vokabular mit zugehöriger URL bereitstehen. 
  • ListVocabularies: Fragt eine Liste eines eigenen Vokabulars ab.  
  • UpdateVocabulary: Dient der Aktualisierung eins bestehenden Vokabulars. 

Welche Vorteile bietet AWS Transcribe? 

Der von Amazon angebotene Dienst bietet dem Nutzer einige Vorteile. Zu diesen Vorteilen gehören unter anderem: 

  • Erstellung von Transkriptionen: Die Speech-to-Text-Verarbeitung von Amazon agiert weitaus präziser als eine manuelle Transkription. Dabei erfolgt die automatisierte Ausgabe in wenigen Sekunden und ist meist kostengünstiger.  
  • Filterfunktion: Neben dem reinen transkribieren schafft es der Dienst außerdem, bestimmte Wörter zu filtern. Dazu gehören beispielsweise anstößige Wörter, oder Wörter welche für eine Zielgruppe nicht relevant sind. AWS Transcribe kann diese Wörter markieren und selbstständig entfernen.
      
  • Hohe Genauigkeit bei der Transkription: Damit der Dienst möglichst genaue Transkriptionen liefert, lassen sich eigens definierte Vokabellisten und Sprachmodelle erstellen, indem neue Wörter zum Grundvokabular hinzugefügt werden können. Beispielsweise gehören zu diesen Wörtern Begriffe wie Produktnamen, Fachbegriffe oder Namen von Personen.  
  • Datenschutz: Damit der Datenschutz vertraulicher Daten gewährleistet wird, lassen sich sensible Daten identifizieren und entfernen. Dies hat den Zweck, dass in Bereichen wie dem Kundenservice vertrauliche Daten nicht ungewollt an Dritte gelangen können und eine vertrauliche Aufbereitung wichtiger Daten gewährleistet ist.  

In welchen Bereichen wird AWS Transcribe eingesetzt? 

Die Transkription von Sprachdateien lässt sich in vielen unterschiedlichen Bereichen einsetzen. Hierzu zählen beispielsweise: 

Anrufanalyse in Echtzeit 

Damit Mitarbeiter in Kontaktzentren die Absicht und Stimmung eines Kunden identifizieren können, lässt sich AWS Transcribe und Amazon Comprehend beispielsweise so nutzen, dass Mitarbeiter zudem handlungsrelevante Informationen in Echtzeit erhalten. Dementsprechend agiert der Dienst in diesem Bereich als eine Art Dienst zur Mitarbeiterunterstützung. Dadurch verbessert sich zum einen die Mitarbeiterproduktivität und zum anderen kann der Kunde präziser beraten werden, wodurch sich seine Zufriedenheit nachhaltig verbessert.  

Dokumentation in der Medizin 

Zudem lässt sich AWS Transcribe in zunächst unüblichen Bereichen wie der Medizin einsetzen. Dort hilft der Dienst dabei, Gespräche zwischen einem Patienten und Arzt in Textform darzustellen. Diese in Textform gespeicherten Daten und Informationen lassen sich im weiteren Verlauf in bestehende Gesundheitsakten einfügen. Durch die automatische Transkription von Text zu Patientenakten kann diese gewonnene Zeit in eine verbesserte Patientenversorgung investiert werden, ohne dass die Dokumentation eines Krankheitsbilds leidet.

Erstellung von Untertiteln  

Mithilfe des Dienstes ist es möglich, Untertitel zu bestimmten Medieninhalten automatisiert darzustellen. Dies ist vor allem dann hilfreich, wenn die manuelle Transkription aufgrund des riesigen Angebots an Inhalten kaum umsetzbar ist. An dieser Stelle hilft AWS Transcribe mit Erfolg, wichtige Inhalte dennoch mit Untertiteln zu versehen.  

Medienintelligenz 

Zudem hilft AWS Transcribe in Bereichen wie der Überwachung bestimmter Inhalte dabei, konkrete Richtlinien einzuhalten. Dies ist vor allem hilfreich, wenn es sich hierdurch um vertrauliche Bereiche eines Unternehmens handelt, bei denen keine anstößigen oder vertraulichen Inhalte bestehen oder an Dritte gelangen dürfen. 

Digitaler Schreibassistent 

Egal ob Arbeitsbesprechungen, Lehrvorträgen, Seminaren oder Gerichtsverfahren, in all diesen und vielen weiteren Bereichen lässt sich der von Amazon angebotene Dienst zur Sprachverarbeitung einsetzen, um gesprochene Sprache und dementsprechend wichtige Inhalte zu protokollieren und als Textdokument festzuhalten. Im Gericht kann AWS Transcribe beispielsweise dazu genutzt werden, um ganze Prozesse sowie Anhörungen oder Zeugenaussagen in Textform zu transkribieren und zu speichern. Diese gespeicherten Daten lassen sich im weiteren Verlauf eines Gerichtsverfahrens effizient nutzen, um Inhalte und Sachverhalte abzugleichen. Zudem ist ist vor allem hilfreich, wenn es sich um Verfahren handelt, welche sich über mehrere Jahre strecken. 

Was kostet AWS Transcribe? 

Im Rahmen des Dienstes zahlt der Kunde nur den Teil, den er tatsächlich nutzt. Dies bedeutet, dass AWS die Abrechnung auf Basis von Zeit für transkribierte Audiodateien pro Monat abrechnet. Bei der Neuanmeldung erhält der Nutzer jedoch eine Analyse von bis zu 60 Audiominuten pro Monat für die ersten 12 Monate kostenlos.  

Abseits der kostenlosen Probeeinheiten berechnen AWS folgende Standardpreise für seine Kunden: 

Stufe Volumen (Minuten/ Monat) Streaming/- Batch-Transkriptionen (USD/Sekunde) Streaming/- Batch-Transkriptionen (USD/Minute)  
T1 Die ersten 250.000 Minuten 0,00040 USD 0,0240 USD 
T2 Weitere 750.000 Minuten 0,00025 USD 0,0150 USD 
T3 Weitere 4 Mio. Minuten 0,00017 USD 0,0102 USD 
T4 Mehr als 5 Mio. Minuten 0,00013 USD 0,0078 USD 
Preistabelle von AWS Transcribe

Um eine konkrete Vorstellung zu haben, würden sich die Kosten bei einem Umfang von beispielsweise 200.000 zu analysierenden Telefonaten, bei denen ein Telefonat rund 10 Minuten dauert, auf etwa 27.000 USD belaufen.

Fazit 

Wie bei vielen AWS-Diensten sind die Einsatzmöglichkeiten weitreichend. Ob Audioaufzeichnungen von Reden oder Konferenzen, Telefongespräche im Callcenter oder medizinische Aufzeichnungen. Dank AWS Transcribe erfolgt eine automatisierte Transkription von Audiodateien in Text, sodass wichtige Informationen jederzeit in Textform vorliegen.  

  

Weiterlesen

Clusteranalyse einfach erklärt

Clusteranalysen sind beliebte Methoden, um Daten nach einem Ähnlichkeitsmaß in homogene Gruppen einzuteilen. Sie finden Anwendung in Wirtschaft und Forschung. Dieser Artikel zeigt, was eine Clusteranalyse ist, welche Arten es […]

Was ist Unsupervised Learning (Unüberwachtes Lernen)?

Unsupervised Learning umfasst Methoden des maschinellen Lernens, bei denen das maschinelle Lernverfahren in nicht kategorisierten Daten nach bisher unbekannten Mustern und Zusammenhängen sucht. Dieser Prozess funktioniert mit minimaler menschlicher Intervention. […]

Künstliche Intelligenz einfach erklärt! Definition, Arten und wo KI eingesetzt wird

Künstliche Intelligenz (KI) ist ein Teilgebiet der Informatik und ermöglicht Maschinen autonom Probleme zu lösen und Entscheidungen zu treffen. Schon heute wird KI in vielen Anwendungen eingesetzt, um Prozesse zu […]

Was ist ein Algorithmus?

Woher weiß eine Software, wer die Liebe meines Lebens ist? Das versprechen zumindest die großen Dating-Portale – dabei hat das Programm keine Ahnung von Partnerschaft, geschweige denn von Liebe. Aber […]

Amazon Personalize: Funktionen, Anwendung und Vorteile

Der von Amazon Web Services (AWS) angebotene Service namens Amazon Personalize bietet Nutzern die Möglichkeit, die gleiche Machine Learning-Technologie zur Personalisierung zu verwenden, welche Amazon selbst nutzt. Dazu werden vom Nutzer keinerlei Erfahrungen […]

Was ist ein Machine Learning Engineer?

Ein Machine Learning Engineer ist ein wichtiger Bestandteil eines Data Science Teams. Er kümmert sich darum, dass Machine Learning Modelle in Produktion eingesetzt und das alle nötigen Prozesse dafür ineinander […]

Amazon Comprehend: Anwendung, Funktionen und Vorteile

Amazon Web Services (AWS) stellt einen voll verwalteten Natural Language Processing-Service namens Amazon Comprehend zur Verfügung. Amazon Comprehend bietet dem Nutzer die Möglichkeit, Informationen aus Texten zu extrahieren und Zusammenhänge zu erkennen. Durch Amazon Comprehend lassen sich zudem Bereiche wie die Extraktion von […]

Was ist Amazon SageMaker?

Amazon SageMaker ist eine Everything-as-a-service-Cloud-Maschinenlernplattform von Amazon Web Services. Amazon SageMaker wird vor allem von Datenwissenschaftler und Entwicklern genutzt, um Modelle auf Basis von Machine Learning, in der Cloud zu erstellen, trainieren und einzusetzen. Das […]

Was ist Supervised Learning (Überwachtes Lernen)?

Supervised Learning ist eine Methode des maschinellen Lernens, welche aufgrund einer Analyse von Eingangsdaten mit vorgegebener Zielvariable präzise Empfehlungen ausgibt und Prognosen macht. Dieser Prozess ist durch die notwendige Datenvorverarbeitung […]
Newsletter und Updates

Sie sehen gerade einen Platzhalterinhalt von HubSpot. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Mehr Informationen
Erstgespräch vereinbaren