Machine Learning: Definition, Algorithmen, Methoden und Beispiele

Wie funktioniert Machine Learning? Eingabedaten, Algorithmen und Ausgabe.

Machine Learning (deutsch: maschinelles Lernen) ist eine Anwendung der künstlichen Intelligenz (KI). IT-Systeme lernen automatisch aus Erfahrungen und verbessern sich, ohne explizit programmiert zu sein. Maschinelles Lernen konzentriert sich auf die Entwicklung von Programmen, die auf Daten zugreifen, um Muster zu erkennen.

In diesem Artikel erkläre ich die Grundlagen von maschinellem Lernen und zeige welche unterschiedlichen Arten es gibt. Außerdem lernen Sie wofür Machine Learning eingesetzt wird und welche Daten Sie dafür brauchen.

Machine Learning Definition

Machine Learning (deutsch: Maschinelles Lernen) ist ein Teilbereich der künstlichen Intelligenz, die Systeme in die Lage versetzt, automatisch aus Erfahrungen (Daten) zu lernen und sich zu verbessern, ohne explizit programmiert zu sein. Schwerpunkt des maschinellen Lernen ist die Entwicklung von Computerprogrammen, die auf Daten zugreifen und aus diesen selbständig lernen.

Damit maschinelles Lernen funktioniert und die Software die Entscheidung treffen kann, muss ein Mensch den Algorithmus trainieren. Durch das Bereitstellen von Trainings- und Beispieldaten, kann der Algorithmus Muster und Zusammenhänge erkennen und somit aus den Daten lernen. Diesen Prozess nennt man auch Modelltraining.

Wenn passende Trainingsdaten zur Verfügung stehen, dann kann Maschinelles Lernen folgendes leisten:

  • Vorhersage von Werten aus Basis der analysierten Daten treffen,
  • Berechnung von Wahrscheinlichkeiten für bestimmte Ereignisse,
  • Erkennen von Gruppen und Clustern in einem Datensatz,
  • Erkennen von Zusammenhängen in Sequenzen,
  • Reduktion von Dimensionen ohne großen Informationsverlust
  • Optimierung von Geschäftsprozessen.

Maschinelles Lernen wird häufig mit den Begriffen Data Mining und predictive Analytics in Verbindiung gebracht. Letztlich nutzen Data Mining und predictive Analytics die Verfahren des maschinellen Lernens.

Wie funktioniert Machine Learning?

Damit Machine Learning ein Muster lernen kann, muss es von einem Menschen trainiert werden. Dieser Lernprozess beginnt mit einem vorbereiteten Datensatz (Trainingsdatensatz), der von einem Machine Learning Algorithmus nach Mustern und Zusammenhängen durchsucht wird.

Mit einem erfolgreich abgeschlossenen Lernprozess, wird das trainierte Modell dazu genutzt unbekannte Daten zu bewerten. Somit können anhand dieser Vorhersagen bessere Entscheidungen getroffen werden. Das Hauptziel ist es ohne menschliche Eingriffe automatisch zu lernen und die Aktionen entsprechend anzupassen.

Wie funktioniert Machine Learning? Eingabedaten, Algorithmen und Ausgabe.
Machine Learning nimmt Eingabedaten mit Beispielen und lernt daraus, um für die Zukunft Prognosen zu machen.

Die Entwicklung eines Modells ist ein interaktiver Prozess, der oft mehrfach durchlaufen wird, bis das Ergebnis eine gewisse Qualität erreicht hat. In der Praxis finden so immer wieder Entwicklungschleifen statt, wo ein Mensch die Ergebnisse aus dem Machine Learning Algorithmus bewerten muss.

Arten von Machine Learning Algorithmen

Im folgenden Abschnitt gehe ich auf die unterschiedlichen Arten von Machine Learning ein:

Arten von Machine Learning Algorithmen: unüberwachtes Lernen, überwachtes Lernen und verstärkendes Lernen.
Arten von Machine Learning Algorithmen.

Überwachtes Lernen

Überwachtes Lernen (englisch: Supervised Machine Learning) nutzt bekannte Daten, um daraus Muster und Zusammenhänge zu erkennen. Der Algorithmus lernt die Muster anhand eines Trainingsdatensatzes (Beispieldaten). Beim überwachten Lernen wird immer der Zusammenhang zu einer Zielvariable erlernt und versucht diese richtig vorherzusagen. Die Zielvariable kann eine Klasse (bspw. Kündigung Ja/Nein) oder ein numerischer Wert (bspw. Umsatz für den nächsten Monat).

Anhand eines erfolgreichen Lernprozesses werden verlässliche Vorhersagen für zukünftige oder unbekannte Daten getroffen. Im Marketing wird überwachtes Lernen häufig für die Klassifikation von Kundendaten eingesetzt.

Beispiele aus der Praxis von überwachten Lernverfahren sind:

  • Vorhersage von Stromverbrauch für einen Zeitraum X
  • Risikobewertung von Investitionen
  • Berechnung von Ausfallwahrscheinlichkeiten im Maschinenpark
  • Prognose von Kundenwert für die nächsten 12 Monate
  • und viele weitere Anwendungsfälle.

Unüberwachtes maschinelles Lernen

Unüberwachtes maschinelles Lernen (Unsupervised Machine Learning) bekommt der Algorithmus keine Beispieldaten, sondern Daten aus denen der Algorithmus eigenständig interessante, versteckte Gruppen und Muster erkennen soll.

Der grunsätzliche Unterschied zum supervised Machine Learning ist also, dass unsupervised Machine Learning nicht dafür ausgelegt eine Vorhersage für eine bekannte Zielvariable (z.B. Klassifikation oder Prognose) zu berechnen. Auch die Ergebnisse muss beim unüberwachten Lernen der Data Scientist an relativ „weichen“ Faktoren bewerten und einschätzen wie gut die Ergebnisse zur Business Anwendung passen.

Beispiele für unüberwachtes maschinelles Lernen sind Dimensions Reduktion und Clusteringverfahren. Die Verfahren werden eingesetzt für:

  • Visualisierung von großen Datenmengen,
  • Clusteranalysen,
  • Extraktion von Regeln
  • und Erstellung von ML-Features.

Wer wissen möchte, wie man eine Kundensegmentierung mit einem K-Means-Clustering-Algorithmus macht, dazu habe ich hier ein Beispiel in Python beschrieben.

Teilüberwachtes Lernen

Teilüberwachtes Lernen (Semi-supervised Machine Learning) nutzt sowohl Beispieldaten mit konkreten Zielvariablen als auch unbekannte Daten und ist somit eine Mischung aus Überwachtem und Unüberwachtem Lernen. Die Einsatzgebiete von teilüberwachtem Lernen sind im Grunde die gleichen wie bei dem überwachten Lernen.

Der Unterschied liegt darin, dass für den Lernprozess nur eine geringe Menge Daten mit bekannter Zielvariable genutzt wird und eine große Menge, wo diese Zielvariable noch nicht vorhanden ist. Dies hat den Vorteil, dass schon mit einer geringeren Menge von bekannten Daten trainiert werden kann. Denn oft ist die Beschaffung von bekannten Beispieldaten extrem aufwendig und kostenintensiv, da häufig Menschen diese Daten durch manuelle Prozesse erstellen müssen (bspw. das manuelle Labeling von Bildern).

Besonders in der Bild- oder Objekterkennung findet Semi-Supervised Learning Anwendung. Hier wird ein kleiner Datensatz von bekannten (gelabelten) Bildern erstellt, dies wird in der Regel durch Menschen gemacht. Nachfolgend wird bspw. ein künstliches neuronales Netz zur Klassifikation trainiert und dann auf den Rest der Daten angewendet. So können die Beispieldaten für die unbekannten Daten deutlich schneller richtig erstellt werden.

Verstärkendes Lernen

Verstärkendes Lernen (Reinforcement Learning) oder auch bestärkendes Lernen ist eine besondere Form des maschinellen Lernens. Diese Algorithmen interagieren mit der Umgebung und werden durch eine Kostenfunktion oder Belohnungssystem bewertet, um so selbständig eine Strategie zur Lösung des Problems zu erlernen und die Belohnung zu maximieren.

Bei verstärkendem Lernen wird dem Algorithmus nicht gezeigt, welche Aktion oder Handlung in welcher Situation die richtige ist, sondern dieser erhält durch die Kostenfunktion eine positive oder negative Rückmeldung (Feedback). Anhand der Kostenfunktion wird dann eingeschätzt, welche Aktion zu welchem Zeitpunkt, die richtige ist. Somit lernt das System „bestärkend“ durch Lob oder Bestrafung die Belohnungsfunktion zu maximieren.

Der entscheidende Unterschied zu überwachten und unüberwachten Lernen ist, dass das bestärkende Lernen vorab keine Beispieldaten benötigt. Der Algorithmus kann in einer Simulationsumgebung in vielen iterativen Schritten eine eigene Strategie entwickeln. Im folgenden Video von Google DeepMind wird dies deutlich: hier lernt die KI eigenständig zu Laufen.

Googles Deepmind bringt der KI bei zu Laufen.

Wenn die KI eigenstädnig lernen kann, dann ist kein menschliches Vorwissen mehr nötig, um komplexe Probleme zu erlernen. Reinforcement Learning ist die große Hoffnung vieler KI-Forscher für die Lösung komplexer Problemstellungen, wie bspw. autonomes Fahren, autonome Robotik und der Entwicklung einer generellen Künstlichen Intelligenz.

Machine Learning Algorithmen Übersicht

Hier ist die Liste der am häufigsten verwendeten Machine Learning Algorithmen. Diese Algorithmen können Sie auf fast jedes analytisches Problem anwenden:

Wie funktioniert der Machine Learning Prozess?

Ein Machine Learning Prozess in der Praxis sieht wie so aus:

  1. Problemdefinition, Zieldefiniton und Wissenaustausch. Ziele und Einsatzzweck von Machine Learning muss im Vorfeld klar festgelegt werden. Was ist mit maschinellem Lernen zu optimieren?
  2. Datenbeschaffung, Transformation und Feature Extraktion. In der Regel ist dieser Schritt der zeitaufwändigste, da es wichtig ist qualitativ hochwertige Daten zu nutzen. Hier kann z.B. ein ML Feature Store hohe Effizienz schaffen.
  3. Lernphase. In diesem Schritt findet das maschinelle Lernen statt. Der Machine Learning Algorithmus wird trainiert.
  4. Interpretation der Ergebnisse. Ergebniss- und Modellinterpretation sind essentiell für den Prozess. Ein wichtiger Schritt um auch Akzeptanz für ML im Fachbereich zu schaffen. Der Mensch möchte verstehen was in dem Algorithmus passiert.
  5. Produktive Nutzung. ML Modelle in Labs zu entwickeln und nicht zu nutzen, hat keinen Mehrwert. Die technischen Anforderungen für Machine Learning sind komplex, daher ist die Produktivnahme nicht immer ganz einfach.

Dieser Prozess wird so häufig durchlaufen, bis die gewünschten Ergebnisse vorhanden sind.

Ein Vorgehensmodell, was in der Literatur oft beschrieben wird, ist der CRISP-DM Prozess. Ein Prozess der für das Data Mining entwickelt wurde. Dieser Prozess ist nicht allein auf das Machine Learning fokussiert, sondern bezieht auch die Ziele aus Sicht der Business-Anwendung mit ein.

Ich persönlich finde, dass der CRISP-DM sehr hilfreicher ist, um Machine Learning Projekte zu strukturieren. In diesem Beitrag habe ich den CRISP-DM Prozess beschrieben.

Training-, Validierung- und Testdatensatz

Um ein Machine Learning Modell korrekt zu trainieren wird ein Datensatz benötigt. Unüberwachtes Lernen braucht keine Beispiele und kann direkt mit den Eingabedaten trainiert werden. Überwachtes Lernen hingegen braucht Beispieldaten, also Daten wo die Zielvariable vorgegeben ist (bspw. Kauf Ja/Nein). Diesen Datensatz nennt man auch Beispieldatensatz.

Bei überwachten Lernverfahren wird dieser Datensatz in der Regel in mindestens drei verschiedene Datensätze unterteilt: Training-, Validierung- und Testdaten.

Training, Validierung- und Testdaten für Machine Learning
Training, Validierung- und Testdaten zum Trainieren von Machine Learning Algorithmen.

Alle drei Datensätze werden aus dem „Machine Learning Flatfile“ (Beispieldatensatz) erstellt. Eine mögliche Aufteilung könnte folgende sein:

  • 70% Trainingsdatensatz
  • 20% Validierungsdatensatz
  • 10% Testdatensatz

Im Folgenden gehe ich auf die drei Datensätze für Machine Learning ein.

Trainingsdaten

Ein Trainingsdatensatz ist ein Datensatz mit Beispielen (oder auch Zielvariablen genannt), die für das Lernen der Muster und Zusammenhänge in den Daten verwendet wird. Die Anpassung der Gewichte des Algorithmus wird über den Trainingsdatensatz antrainiert d.h. der Algorithmus lernt aus diesen Daten. Trainingsdaten mit Beispielen werden für Klassifikations- und Regressionsprobleme benötigt.

Teilen des Datensatzes in Training- und Testdaten.
Teilen des Datensatzes in Training- und Testdaten.

Häufig tendieren Algorithmen dazu bei den gelernten Mustern aus den Trainingsdaten zu einer Überanpassung (im Englischen „Overfitting“) d.h. die Zusammenhänge und Beziehungen aus den Trainingsdaten werden von dem Algorithmus zu stark antrainiert, aber für die Gesamtheit funktionieren diese Regeln nicht gut.

Testdaten

Die Testdaten sind von den Trainingsdaten unabhängig, sollten jedoch die gleiche Wahrscheinlichkeitsverteilung wie der Trainingsdatensatz aufweisen.

Die Testdaten werden bei dem Training nicht genutzt d.h. der Algorithmus kenn die Daten nicht und kann diese nicht zum Lernen nutzen. Auch hier sind Beispiele bzw. Zielvariablen vorhanden, woran im Anschluss die Qualität des Modells gemessen werden kann.

Wenn das trainierte Modell gut zu den Testdaten passt, d.h. die Beispieldaten mit einer guten Qualität vorhersagt, kann das Modell auf unbekannte (noch zu bewertende) Daten angewandt werden.

Validierungsdaten

Ein Validierungsdatensatz ist ebenfalls ein Beispieldatensatz. Die Validierungsdaten werden für die Abstimmung der Hyperparameter (d.h. für künstliche Neuronale Netzwerke der Architektur) eines Modells verwendet wird.

So wird vor allem eine Überanpassung des Modells auf die Trainingsdaten vermieden.

Was ist der Unterschied zwischen Machine Learning und Deep Learning?

Praktisch gesehen ist Deep Learning eine Teilmenge von Machine Learning, daher ist tiefes Lernen technisch gesehen immer maschinelles Lernen. Allerdings sind die Fähigkeiten unterschiedlich.

Der Hauptunterschied zwischen Deep Learning und Machine Learning liegt in der Fähigkeit, durch künstliche neuronale Netzwerke (KNN), unstrukturierte Daten zu verarbeiten. Denn Deep Learning durch KNNs ist in der Lage unstrukturierte Informationen wie Texte, Bilder, Töne und Videos in numerische Werte umzuwandeln. Diese extrahierten Informationen werden dann zur Mustererkennung oder zum weiteren Lernen verwendet.

Machine Learning vs. Deep Learning: der Unterschied liegt in der Feature Extraktion und dem Einsatz von tiefen, künstlichen neuronalen Netzen.
Machine Learning vs. Deep Learning: der Unterschied liegt in der Feature Extraktion und dem Einsatz von tiefen, künstlichen neuronalen Netzen.

Klassisches Machine Learning, also bspw. anhand von Entscheidungsbaumverfahren, ist nicht in der Lage diese unstrukturierten Daten sinnvoll zu verarbeiten. Somit können zum Beispiel nicht einfach Bilder als Eingabedaten genutzt werden, um einen Algorithmus zur Objekterkennung zu trainieren. An dieser Stelle müsste dann immer aufwendiges Feature Engineering durch einen Menschen betrieben werden.

In der folgenden Tabelle zeige ich die Hauptunterschiede zwischen Deep Learning und Machine Learning:

  Machine Learning Deep Learning
Datenstruktur Strukturierte Daten Unstrukturierte und strukturierte Daten
Datensatzgröße Klein – Mittel Groß
Hardware Funktioniert mit einfacher Hardware. Braucht leistungsstarke Computer (mit GPUs). Neuronale Netze multiplizieren Matrizen, die sehr viel Rechenzeit brauchen – GPUs beschleunigen den Vorgang.
Feature Extraktion Sie müssen die Merkmale in der Regel verstehen. Sie müssen die Merkmale nicht verstehen.
Laufzeit Ein paar Minuten bis Stunden Bis zu Wochen und Monaten. Künstliche neuronale Netze müssen einen enorm viele Gewichte berechnen.
Interpretierbarkeit Einige Algorithmen sind leicht zu interpretieren (Logistische Regression, einfache Entscheidungsbäume), andere sind fast unmöglich (SVM, XGBoost). Schwer zu interpretieren und oft unmöglich.
Deep Learning und Machine Learning im Vergleich: Wo liegt der Unterschied?

Welche Anwendungsbeispiele für Machine Learning gibt es?

Maschinelles Lernen findet in unserer digitalen Welt fast überall einen Platz. Hier ein paar konkrete Anwendungsbeispiele aus der Praxis:

Maschinelles Lernen Einführung in unterschiedliche Arten und Anwendungsbeispiele von maschinellem Lernen
Maschinelles Lernen im Überblick: Anwendungsbeispiele nach Arten

Natürlich gibt es noch etliche weitere Anwendungsbeispiele wie in der Industrie für die Wartung von Maschinen oder in Supply Chain Management Prozessen. Die Anwendungsmöglichkeiten für maschinelles Lernen sind ausgesprochen vielfältig.

Big Data als Treiber für Machine Learning

Maschinelles Lernen wird häufig im Zusammenhang mit Big Data genannt. In der Regel ist es so, dass je mehr Informationen gespeichert werden, desto mehr Aufwand muss betrieben werden, um wertvolle Informationen aus diesen Daten zu extrahieren. Der Informationsgehalt pro GB Daten ist in der Regel sehr gering, aber genau hier hilft der Ansatz des maschinellen Lernens einen Mehrwert aus den Daten zu generieren.

Machine Learning Algotihmen funktionieren zudem deutlich besser, wenn man mehr Eingabedaten nutzt. Dadurch können die Algorithmen Muster einfacher erkennen und so genauere Vorhersagen für die Zukunft treffen.

Big Data Technologie ist ein großer Treiber für die Entwicklung von Deep Learning Ansätzen, ein Teilbereich von Machine Learning, mit denen heute natürliche Sprache erkennt und verstanden werden kann. Deep Learning braucht nochmal deutlich mehr Daten, als klassische Machine Learning Verfahren um gute eine Prognosegüte zu erreichen.

Ist AutoML die Zukunft von Machine Learning?

AutoML ist die Automatisierung der einzelnen ML-Prozessschritte. Anstatt die Architektur und die Modellauswahl akribisch von Data Science Teams herausfinden zulassen, automatisiert AutoML diesen Prozess und reduziert die menschliche Arbeitszeit in diesem Prozess.

Am Ende muss der Mensch höchstens noch auf die Modellergebnisse blicken. Auch die sehr aufwendige Datenvorverarbeitung im Machine Learning (laut Forbes ca. 80% der Zeit eines ML-Projekts) wird von einigen AutoML Frameworks schon übernommen.

Doch was muss der Mensch in dem Prozess noch machen? Ich sehe vor allem die fachliche Expertise und das Design der Datensätze, die zur Lösung der Problemstellung erstellt werden müssen, weiterhin als wichtige Aufgabe für den Menschen.

Klar ist, dass viele große Unternehmen extrem viel Geld in die Automatisierung von Machine Learning Prozessen stecken. So hat auch Goolge, nach Amazon Sagemaker, H2O und vielen weiteren, eine AutoML Plattform herausgebracht. Daher ist davon auszugehen, dass in Zukunft deutlich mehr Prozesse automatisiert sein werden und der Mensch nach und nach aus diesem Prozess stärker verschwinden wird.

Ihr Kontakt: Laurenz Wuttke

Unternehmen sitzen auf einem ungenutzten Berg von Kundendaten. Wir von datasolut entwickeln KI, die Ihr Marketing optimiert. Damit Sie dem richtigen Kunden zur richtigen Zeit das richtige Angebot machen können.

Laurenz Wuttke

Auch interessant für Sie

Laurenz Wuttke datasolut Gmbh
Ich freue mich, wenn Sie sich zu unserem Newsletter anmelden.

Jetzt zum Newsletter anmelden!

Den datasolut Blog abonnieren und Expertentipps zu Marketingoptimierung mit künstlicher Intelligenz erhalten.

Mit der Anmeldung stimmen Sie unserer Datenschutzerklärung zu.