Einführung in Natural Language Processing (NLP)

Natural Language Processing (NLP) ist eine Methode der künstlichen Intelligenz, die es Computern ermöglicht, die natürliche Sprache des Menschen zu verstehen. Anwendungsgebiete sind z.B. Chatbots, Textmining und digitale Assistenten wie Alexa oder Siri.

NLP ist keine leichte Aufgabe des Machine Learnings, denn Sprachen und Zusammenhänge sind oft komplex und durch Mehrdeutigkeit für die Computer nicht einfach zu verstehen.

Dieser Artikel gibt eine Einführung in die Verarbeitung natürlicher Sprache und wo diese eingesetzt werden kann.

Was ist Natural Language Processing?

Natural Language Processing (NLP) ist ein Zweig der künstlichen Intelligenz, der sich mit der Analyse, dem Verständnis und der Generierung von Wörtern und Sätzen (natürlicher Sprache) beschäftigt. Durch NLP können wir Menschen mit den Computern auf natürliche Weise kommunizieren und diese unsere Sprache verstehen.

Das Ziel von NLP ist es, die menschlichen Sprachen auf eine sinnvolle Weise zu lesen, zu entschlüsseln und zu verstehen.

Natural Language Processing mit Google Word2Vec ermittelt Zusammenhänge in der Sprache.
Natural Language Processing mit Google Word2Vec ermittelt Zusammenhänge in der Sprache. Beispiel: König zu Königin oder Mann zu Frau. Quelle: Google Word2Vec

Die meisten NLP-Techniken basieren auf maschinellem Lernen (oft kommt heute Deep Learning zum Einsatz) und extrahieren so die Bedeutung und Zusammenhänge aus menschlicher Sprache. Dabei sind die Modelle immer abhängig von der Landessprache.

Anwendungsbereiche von Natural Language Processing?

Hinter folgenden Anwendungen ist Natural Language Processing eine Kernfunktionalität:

  • Übersetzung von Sprachen bspw. Google Translate oder die Kölner Firma DeepL
  • Sprachdialogsysteme (english Interactive Voice Response), wie im Navigationssystem der neuen Mercedes A-Klasse. Häufig wird sowas auch in Call-Centern eingesetzt, wo zunächst ein Computer mit einem redet (bspw. bei der deutschen Telekom wird so ein System eingesetzt), um das Problem zu erfassen.
  • Persönliche Assistenten wie OK Google, Amazon Alexa oder Apple Siri.
  • Textmining beispielsweise von Kundenbeschwerden zur Klassifikation des Problems oder Sentiment-Analysen zur vorhersage von Aktienkursen.

Seit kurzer Zeit ist vor allem Transfer Learning für NLP von großem Interesse, denn so können bereits vortrainierte Modelle für verschiedene Sprachen eingesetzt werden. Diese Modelle haben dann bereits viele Zusammenhänge in der jeweiligen Sprache gelernt und können so schnell auf einen neuen Anwendungsfall trainiert werden. Dadurch kann man viel Zeit und Geld sparen, aber vor allem sorgt es in der Regel für bessere Modellqualitäten.

Ein bekanntes, vortrainiertes Modell ist natürlich von Google: BERT, was übrigens multilingual ist und somit auch für die deutsche Sprache einsetzbar ist.

Du willst mehr zu Transfer Learning erfahren? Dann lies meinen Artikel dazu: Was ist Transfer Learning?

Herausforderungen bei der Sprachverarbeitung

Natural Language Processing ist kein leichtes Problem der künstlichen Intelligenz, dies liegt vor allem in der Natur der menschlichen Sprache, die sehr komplex ist.

Es gibt viele Regeln und Zusammenhänge, die es den Computern schwer machen, diese zu verstehen und richtig zu interpretieren. Als Beispiel ist hier Sarkasmus genannt, ein Problem was extrem schwer für den Computer zu verstehen ist.

Natürlich gibt es auf der anderen Seite auch viele sehr einfache Aufgaben, beispielsweise Wörter oder das Erkennen von Plural, die ein Computer erlernen kann.

Zum Verstehen von natürlicher Sprache, muss der Computer sowohl Wörter als auch die Konzepte und Regeln dahinter verstehen. Für uns Menschen ist dies häufig sehr einfach, aber für Natural Language Processing ist das die große Herausforderung.

Ihr Ansprechparnter: Laurenz Wuttke

Wir entwickeln Künstliche Intelligenz, mit der Sie mehr aus Ihren Kundendaten machen – für wachsende Umsätze und eine nachhaltig hohe Kundenzufriedenheit.

Auch interessant für Sie