Ist Auto ML die Zukunft von Data Science?

automl-plattformen

AutoML ist ein heiß diskutiertes Thema, welches eine enorme Effizienzsteigerung für den Machine Learning Prozess verspricht. Doch wie viel Potential steckt in dem automatisierten Machine Learning Ansatz? Wir zeigen Ihnen, wie AutoML Ihren ML-Prozess automatisieren kann und welche Vorteile Sie dadurch gewinnen.

Machine Learning wird normalerweise akribisch von Data Science Teams, basierend auf Erfahrungswerten oder vorherigen explorativen Analysen, betrieben. Dieser manuelle Prozess ist langwierig und schwierig, da die Analysten viel Zeit in die Datenaufbereitung, sowie in den Test von Modellparametern stecken. Ziel von AutoML ist das automatisierte Erstellen von Modellen, um den ML-Prozess zu vereinfachen.

Steigen wir direkt ein.

Was ist AutoML?

AutoML ist die Automatisierung des maschinellen Lernens. Ziel ist es, die menschliche Arbeitszeit des Data Science Prozesses zu reduzieren. Durch AutoML fallen manuelle Schritte des klassischen, iterativen Prozesses weg. Der Mensch muss somit nur noch die vorbereiteten Trainingsdaten als Eingabe definieren und ein optimiertes Modell wird erstellt.

Große Firmen, wie Google und Amazon, setzen stark auf die Entwicklung von AutoML und erhoffen sich so, deutlich größere Kundengruppen zu erschließen. Denn maschinelles Lernen ist für Unternehmen oft ein teures Entwicklungsfeld. Data Science Mitarbeiter sind extrem teuer und die analytische Infrastruktur komplex. Somit ist dies ein interessanter Anwendungsfall für Cloudanbieter.

Sie sehen gerade einen Platzhalterinhalt von Youtube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Mehr Informationen
Was ist AutoML?

AutoML – Machine Learning automatisieren

Machine Learning (maschinelles Lernen) ermöglicht die Extraktion von Wissen aus Datenbeständen: So lernt ein Computerprogramm anhand von Beispieldaten Muster und erstellt auf dieser Grundlage Prognosen für die Zukunft.

Machine Learning ist für Unternehmen sehr nützlich – beispielsweise um den Erfolg neuer Produkte abzuschätzen oder Risiken bestimmter Geschäftsprozesse zu erkennen. Obwohl beim Machine Learning ein Computer die Wissensgenerierung übernimmt, ist dieser Prozess nicht autonom.

ML-Prozess

Der Mensch hat an diesen iterativen Prozess einen hohen manuellen Anteil. Der Ablauf eines klassischen ML-Prozesses sieht in der Regel wie folgt aus:

  • Datenerhebung
  • Datensichtung
  • Vorbereitung der Daten
  • Feature Engineering
  • Auswahl des passenden Machine Learning Modells und der Features
  • Training des Modells (inkl. Hyperparameter Search)
  • Vorhersage durch das Modell

All diese Schritte laufen bislang getrennt voneinander ab. Das Ziel von AutoML ist es, all diese einzelnen Blöcke automatisch auszuführen. Als Anwender ist es Ihre Aufgabe, die entsprechenden Daten bereitzustellen und am Ende des Prozesses die Vorhersagen zu bewerten und in den Geschäftsprozessen nutzbar zu machen.

AutoML Prozess nach Olson
Source: R. Olson et. al. (2016) “Evaluation of a Tree-based Pipeline Optimization Tool for Automating Data Science.”

In der Grafik von R. Olson et. al. ist zu sehen: von den Rohdaten bis zur Modellerstellung wird der komplette Prozess automatisiert (innerhalb des Kastens).

Alle anderen Schritte laufen bei AutoML automatisch ab – ganz ohne menschliches Eingreifen.

Automatisierung von Feature Engineering

Der AutoML-Prozess geht sogar so weit, dass Teile des Feature Engineering automatisiert wird. Bislang wurde diese komplexe Aufgabe durch ausgebildete Data Engineering und Data Science Experten erledigt. Mit AutoML wird versucht, diesen Prozess zu automatisieren.

Daten liegen häufig in Tabellenform vor, aber besonders Bilder, Texte und Videos müssen vorerst verarbeitet werden, um bspw. Künstliche Neuronale Netze robuster zu machen.

Die genutzten Daten werden beim Machine Learning als Features bezeichnet. Je besser die Features, die Zusammenhänge zwischen der Zielvaribale beschreibt, desto einfacher ist es Rückschlüsse auf zukünftige Ereignisse zu schließen.

Bevor sich diese Daten auswerten lassen, ist das Feature Engineering notwendig. Es werden Variablen berechnet, um bestmöglich die Zusammenhänge zur Zielvariable zu erklären.

Aufgrund der Komplexität von Feature Engineering, war bisher stets eine menschliche Arbeitskraft notwendig. Mit AutoML lässt sich auch diese Aufgabe automatisieren.

Künstliche Intelligenz optimiert Marketing und Vertrieb

In 6 Fallstudien erfahren Sie:

  • Wie Sie 29% mehr Umsatz pro Kampagne machen.
  • Wie Sie durch KI und Automatisierung mehr Zeit gewinnen.
  • Wie Sie 300% mehr Conversions zur richtigen Zeit machen.
Jetzt herunterladen

Klassisches Machine Learning und AutoML im Vergleich

Beim Vergleich mit klassischen ML-Prozessen wird deutlich, dass AutoML einen Vorteil hat: die erhebliche Reduzierung an menschlichem Arbeitseinsatz.

Der klassische ML-Prozess benötigt nicht nur viel Arbeitszeit, sondern auch Arbeitskräfte mit speziellen Kenntnissen. Die Kosten für Fachkräfte mit einem hohen Ausbildungsniveau sind beträchtlich und es ist schwierig, ein passendes Team zusammenzustellen.

Doch der alleinige AutoML-Prozess bringt den Unternehmen keinen Mehrwert, sondern erst wenn die Ergebnisse der Modelle in den Geschäftsprozessen zur Entscheidungsunterstützung dienen. AutoML kann diesen Transfer nicht leisten, daher wird der Mensch weiterhin eine entscheidende Rolle spielen.

Auch das fachliche Wissen spielt in der Modellierung eine wichtige Rolle, dies kann AutoML ebenfalls nicht leisten.

Sie sehen gerade einen Platzhalterinhalt von Youtube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Mehr Informationen
Beispiel von AutoML auf der Google Cloud anhand einer Kaggle Data Science Challange.

Doch wofür können wir AutoML dann einsetzen? Ein entscheidender Punkt den ich für AutoML sehe, ist die Möglichkeit für kleine Unternehmen, ebenfalls sinnvoll Machine Learning einzusetzen, ohne ein teures Team an Fachkräften einzustellen. 

In der Vergangenheit waren die Kosten für ML-Projekte eine große Einstiegshürde für kleinere Unternehmen. AutoML soll dies ändern – denn es werden deutlich weniger Spezialkenntnisse benötigt. Somit wird es wesentlich einfacher, maschinelles Lernen anzuwenden.

Die wesentlichen Vorteile von AutoML auf einen Blick:

  • Schnellere Ergebnisse durch Automatisierung
  • Geringere Kosten durch geringeren Arbeitseinsatz
  • Geringere Anfälligkeit für Fehler
  • Nutzung auch für kleinere Betriebe möglich

AutoML Frameworks

Die wichtigsten AutoML Frameworks und Plattformen habe ich in der nachfolgenden Liste aufgeführt:

automl-plattformen
Historie von AutoML-Plattformen. (Quelle: KDnuggets)

Natürlich gibt es noch viele weitere Anbieter und Lösungen, aber die oben genannten sind die wichtigsten Akteure im AutoML-Feld.

AutoML: Welche Entwicklungen sind zu erwarten?

Meiner Meinung nach wird AutoML eine wichtige Rolle für die Skalierung von Data Science und Machine Learning spielen. Die Ergebnisse in Kaggle Data Science Wettbewerben zeigen, dass bereits Platzierungen unter den Top5 mit einem AutML-Framework möglich sind.

Ein Artikel in der renommierten Zeitschrift Forbes bezeichnet AutoML sogar als Zukunft der künstlichen Intelligenz. Es ist daher davon auszugehen, dass sich diese Technik schnell durchsetzen und bereits in den nächsten Jahren auch in vielen kleinen und mittleren Unternehmen anzutreffen sein wird.

Das unschlagbare Team besteht aus Mitarbeitern mehrerer Bereiche. Wie das Team aufgebaut ist, erfahren Sie hier: Aufbau eines Data Science Teams

Benötigen Sie Unterstützung?

Gerne helfen wir Ihnen bei den ersten Schritten zur eigenen Datenplattform oder begleiten Sie auf Ihrem Weg zur Data Driven Company.

Jetzt anfragen

Sind Datenwissenschaftler jetzt überflüssig?

Wohl kaum. Laut KDnuggets sind die AutoML Frameworks in der Lage gute Modelle zu bauen, aber die wichtigsten Tätigkeiten eines Data Scientist lösen sie nicht. Ein Data Scientist wird dennoch dafür gebraucht, den fachlichen Austausch zwischen Technik und Fachbereich zu vermitteln, wichtiges Fachwissen in das Feature Engineering einzubringen und die eigentliche Problemdefinition des Modellings zu spezifizieren.

Wenn Sie von AutoML profitieren möchten, wenden Sie sich hierfür an uns und wir erarbeiten mit Ihnen eine individuelle Lösung.

Profilbild von Vinzent Wuttke Leiter Business Development Datasolut GmbH
Vinzent Wuttke
Leiter Business
 Development

Ihr Ansprechpartner

Ob und wie künstliche Intelligenz Ihnen weiterhelfen kann, können Sie in einem ersten, unverbindlichen Gespräch mit uns herausfinden.

In diesem Gespräch erfahren Sie:

  • Wie Ihr Use-Case technisch am besten umgesetzt werden kann
  • Wie wir maximal sicher mit Ihren Kundendaten umgehen
  • Wie lange wir für die Umsetzung benötigen und wie ein konkreter Projektplan aussehen könnte
Termin buchen

Weiterlesen

Machine Learning Vor 1 Woche

Data Mining: Algorithmen, Definition, Methoden und Anwendungsbeispiele

Data Mining ist ein analytischer Prozess, bei dem computergestützte Methoden eingesetzt werden, um möglichst selbstständig und effizient interessante Datenmuster in großen Datensätzen zu identifizieren. Die verwendeten Algorithmen stammen aus der […]
Wie funktioniert Machine Learning? Eingabedaten, Algorithmen und Ausgabe.
Machine Learning Vor 4 Wochen

Machine Learning: Definition, Algorithmen, Methoden und Beispiele

Machine Learning (deutsch: maschinelles Lernen) ist eine Anwendung der künstlichen Intelligenz (KI). Computersysteme lernen automatisch Muster und Zusammenhänge aus Daten und verbessern sich selbst, ohne explizit programmiert zu werden. Machine […]
Machine Learning Vor 4 Wochen

MLflow: Eine Plattform für den Machine Learning Lifecycle

MLflow ist eine Machine Learning Plattform Komponente und begleitet den kompletten Machine Learning Prozess eines Data Science Projektes. Ziel ist die Dokumentation, Reproduzierbarkeit und das Deployment zu vereinfachen. Das Silicon […]
Deep Learning Objekterkennung auf einer Straße
Machine Learning Vor 2 Monaten

Machine Learning vs. Deep Learning: Wo ist der Unterschied?

Die zwei Teilbereiche der künstlichen Intelligenz: Machine Learning und Deep Learning lassen sich häufig nur schwer unterscheiden. In diesem Artikel zeigen ich die Unterschiede zwischen diesen Begriffen auf und gebe […]
Machine Learning Vor 10 Monaten

Aufbau eines Data Science Teams

Sich mit Themen wie der Künstlichen Intelligenz, Big Data oder Machine Learning zu befassen, wird von Jahr zu Jahr für viele Unternehmen immer wichtiger. Anhand der Börse ist zu erkennen, wie erfolgreich Tech-Unternehmen mittlerweile sind […]
Customer AnalyticsMachine Learning Vor 10 Monaten

Machine Learning im E-Commerce – Anwendungsfälle und Nutzen

Wie lässt sich Machine Learning im E-Commerce sinnvoll einsetzen? Wir zeigen Ihnen interessante Anwendungsfälle von Machine Learning im E-Commerce, die Ihren Umsatz steigern und Ihre Marketingkosten senken.   Wie lässt sich Machine Learning im E-Commerce einsetzen?  Mittlerweile ist […]
Machine Learning Vor 1 Jahr

Textklassifikation

Die Identifizierung und Analyse großer Textmengen stellt einen wichtigen Antreiber für eine Vielzahl unternehmensrelevanter Entscheidungen dar. Grund ist der hohe Erkenntnisgewinn, der durch Analyse dieser Textmengen entsteht. Da die Extraktion […]
Prognosemodell Beispielbild
Machine Learning Vor 1 Jahr

Was ist eine Absatzprognose? Faktoren, Verfahren und Methoden

Absatzprognosen helfen dem Unternehmen dabei, zukünftige Entwicklungen der Absatzzahlen voraussagen zu können. Dies ist besonders hilfreich, um frühzeitige Entscheidungen in Bezug auf Planungen zu treffen und so Kosten einzusparen. In diesem […]
Machine Learning Vor 1 Jahr

Nachfrageprognose: Definition, Methoden und Beispiele

Eine Nachfrageprognose sagt die zukünftige Kundennachfrage auf Basis historischer Daten vorher. Im Rahmen von Entscheidungsfindungen bieten Nachfrageprognosen eine gute Grundlage, um Planungen im Unternehmen effizient umzusetzen. Je nach Anwendungsfall und Prognoseziel stehen dem […]
Newsletter und Updates

Sie sehen gerade einen Platzhalterinhalt von HubSpot. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Mehr Informationen
Termin buchen