Was ist Machine Learning?

Machine Learning (deutsch: maschinelles Lernen) ist eine Anwendung der künstlichen Intelligenz (KI). IT-Systeme lernen automatisch aus Erfahrungen und verbessern sich, ohne explizit programmiert zu sein. Maschinelles Lernen konzentriert sich auf die Entwicklung von Programmen, die auf Daten zugreifen, um Muster zu erkennen.

Doch wofür eignet sich Machine Learning in unserer Unternehmenswelt? Was können wir damit eigentlich optimieren? Welche Daten brauchen wir dafür?

Wie funktioniert Machine Learning?

Damit Machine Learning ein Muster lernen kann, muss es von einem Menschen trainiert werden. Dieser Lernprozess beginnt mit einem vorbereiteten Datensatz (Trainingsdatensatz), der von einem Machine Learning Algorithmus nach Mustern und Zusammenhängen durchsucht wird.

Mit einem erfolgreich abgeschlossenen Lernprozess, wird das trainierte Modell dazu genutzt unbekannte Daten zu bewerten. Somit können anhand dieser Vorhersagen bessere Entscheidungen getroffen werden. Das Hauptziel ist es ohne menschliche Eingriffe automatisch zu lernen und die Aktionen entsprechend anzupassen.

Was ist Machine Learning? Machine Learning (deutsch: maschinelles Lernen) ist eine Anwendung der künstlichen Intelligenz (KI). IT-Systeme lernen automatisch aus Erfahrungen und verbessern sich, ohne explizite programmiert zu sein.
Was ist maschinelles Lernen?

Die Entwicklung eines Modells ist ein interaktiver Prozess, der oft mehrfach durchlaufen wird, bis das Ergebnis eine gewisse Qualität erreicht hat. In der Praxis finden so immer wieder Entwicklungschleifen statt, wo ein Mensch die Ergebnisse aus dem Machine Learning Algorithmus bewerten muss.

Machine Learning Definition

Maschinelles Lernen dient zur Mustererkennung in Daten und ist ein Teilbereich der künstlichen Intelligenz, der Computer zum Handeln bringt, ohne explizit programmiert zu sein.

Damit maschinelles Lernen funktioniert und die Software die Entscheidung treffen kann, muss ein Mensch die Maschine trainieren. Maschinelles Lernen wird häufig mit den Begriffen Data Mining und predictive Analytics in Verbindiung gebracht. Letztlich nutzen Data Mining und predictive Analytics die Verfahren des maschinellen Lernens.

Arten von Machine Learning Algorithmen

Überwachtes Lernen

Überwachtes Lernen (englisch: Supervised Machine Learning) nutzt bekannte Daten um daraus Muster und Zusammenhänge zu erkennen. Der Algorithmus lernt die Muster anhand eines Trainingsdatensatzes (Beispieldaten). Anhand eines erfolgreichen Lernprozesses werden verlässliche Vorhersagen für zukünftige oder unbekannte Daten getroffen. Im Marketing wird überwachtes Lernen häufig für die Klassifikation von Kundendaten eingesetzt.

Unüberwachtes maschinelles Lernen

Im Gegensatz dazu ist unüberwachtes maschinelles Lernen (Unsupervised Machine Learning) nicht dafür ausgelegt eine Vorhersage für eine bekannte Zielvariable (z.B. Klassifikation) zu berechnen. Vielmehr versuchen diese Algorithmen interessante, versteckte Muster in den Daten aufzuzeigen. Clusteringverfahren sind bspw. unüberwachte Verfahren. Oft werden datengetriebene Kundensegmentierungen mit unüberwachten Lernverfahren umgesetzt.

Wer wissen möchte, wie man eine Kundensegmentierung mit einem K-Means-Clustering-Algorithmus macht, dazu habe ich hier ein Beispiel in Python beschrieben.

Teilüberwachtes Lernen

Teilüberwachtes Lernen (Semi-supervised Machine Learning) nutzt sowohl Beispieldaten mit konkreten Zielvariablen als auch unbekannte Daten. In der Regel wird für den Lernprozess eine geringe Menge Daten mit bekannter Zielvariable genutzt und eine große Menge, wo diese Zielvariable noch nicht vorhanden ist.

Verstärkendes Lernen

Verstärkendes Lernen (Reinforcement Learning) ist eine besondere Form des maschinellen Lernens. Diese Algorithmen interagieren mit der Umgebung und werden durch eine Kostenfunktion oder Belohnungssystem bewertet. Dieses Belohnungssytem sorgt für einen kontinuierlichen Lernprozess, da der Algorithmus für gute Entscheidungen belohnt und für schlechte bestraft wird. Verstärkendes Lernen ist die Grundlage für autonomes Fahren und Robotik.

Liste bekannter Machine Learning Algorithmen

Hier ist die Liste der am häufigsten verwendeten Machine Learning Algorithmen. Diese Algorithmen können Sie auf fast jedes analytisches Problem anwenden:

Wie funktioniert der Machine Learning Prozess?

Ein Machine Learning Prozess in der Praxis sieht wie so aus:

  1. Problemdefinition, Zieldefiniton und Wissenaustausch. Ziele und Einsatzzweck von Machine Learning muss im Vorfeld klar festgelegt werden. Was ist mit maschinellem Lernen zu optimieren?
  2. Datenbeschaffung, Transformation und Feature Extraktion. In der Regel ist dieser Schritt der zeitaufwändigste, da es wichtig ist qualitativ hochwertige Daten zu nutzen. Hier kann z.B. ein ML Feature Store hohe Effizienz schaffen.
  3. Lernphase. In diesem Schritt findet das maschinelle Lernen statt. Der Machine Learning Algorithmus wird trainiert.
  4. Interpretation der Ergebnisse. Ergebniss- und Modellinterpretation sind essentiell für den Prozess. Ein wichtiger Schritt um auch Akzeptanz für ML im Fachbereich zu schaffen. Der Mensch möchte verstehen was in dem Algorithmus passiert.
  5. Produktive Nutzung. ML Modelle in Labs zu entwickeln und nicht zu nutzen, hat keinen Mehrwert. Die technischen Anforderungen für Machine Learning sind komplex, daher ist die Produktivnahme nicht immer ganz einfach.

Dieser Prozess wird so häufig durchlaufen, bis die gewünschten Ergebnisse vorhanden sind.

Ein Vorgehensmodell, was in der Literatur oft beschrieben wird, ist der CRISP-DM Prozess. Ein Prozess der für das Data Mining entwickelt wurde. Dieser Prozess ist nicht allein auf das Machine Learning fokussiert, sondern bezieht auch die Ziele aus Sicht der Business-Anwendung mit ein. Ich persönlich finde, dass der CRISP-DM sehr hilfreicher ist, um Machine Learning Projekte zu strukturieren. In diesem Beitrag habe ich den CRISP-DM Prozess beschrieben.

In welchen Anwendungsgebieten wird Machine Learning eingesetzt?

Maschinelles Lernen findet in unserer digitalen Welt fast überall einen Platz. Hier ein paar konkrete Anwendungsgebiete aus der Praxis:

Natürlich gibt es noch etliche weitere Anwendungsgebiete wie in der Industrie für die Wartung von Maschinen oder in Supply Chain Management Prozessen. Die Anwendungsmöglichkeiten für maschinelles Lernen sind ausgesprochen vielfältig.

Big Data als Treiber für Machine Learning

Maschinelles Lernen wird häufig im Zusammenhang mit Big Data genannt. In der Regel ist es so, dass je mehr Informationen gespeichert werden, desto mehr Aufwand muss betrieben werden, diese zu analysieren. Der Informationsgehalt pro GB Daten ist in der Regel sehr gering, aber genau hier hilft der Ansatz des maschinellen Lernens einen Mehrwert aus den Daten zu generieren.

Machine Learning Algotihmen funktionieren zudem deutlich besser, wenn man mehr Eingabedaten nutzt. Dadurch können die Algorithmen Muster einfacher erkennen und so genauere Vorhersagen für die Zukunft treffen.

Big Data Technolgoie ist ein großer Treiber für die Entwicklung von Deep Learning Ansätzen, ein Teilbereich von Machine Learning, mit denen heute natürliche Sprache erkennt und verstanden werden kann. Deep Learning braucht nochmal deutlich mehr Daten, als klassische Machine Learning Verfahren um gute eine Prognosegüte zu erreichen.

Ihr Ansprechparnter: Laurenz Wuttke

Wir entwickeln Künstliche Intelligenz, mit der Sie mehr aus Ihren Kundendaten machen – für wachsende Umsätze und eine nachhaltig hohe Kundenzufriedenheit.

Auch interessant für Sie