Aufbau eines Data Science Teams

Sich mit Themen wie der Künstlichen Intelligenz, Big Data oder Machine Learning zu befassen, wird von Jahr zu Jahr für viele Unternehmen immer wichtiger. Anhand der Börse ist zu erkennen, wie erfolgreich Tech-Unternehmen mittlerweile sind und welche Rolle Daten heutzutage haben. In den nächsten Jahren werden sich auch Branchen, die bislang wenig mit Daten zu tun hatten, immer mehr zu datengetriebenen Unternehmen entwickeln. Das bedeutet jedoch, dass langfristig das Expertenwissen und IT-Kenntnisse sowie der Aufbau eines Data Science Teams eine zentrale Rolle spielen werden.  

Unternehmen, welche sich bislang auf ihrer Marktführerschaft ausgeruht haben, werden sich in naher Zukunft immer mehr mit solchen Themen auseinandersetzen müssen, sofern sie dies bislang nicht gemacht haben. Eines der zentralen Pfeiler ist dabei die Bildung eines Data Science Teams. 

In diesem Beitrag möchte ich Ihnen zeigen, weshalb die Errichtung eines solchen Teams wichtig ist und welche Rollen vertreten sein sollten. 

Warum Sie ein Data Science Team brauchen

Künstliche Intelligenz in Unternehmen einzuführen ist ein komplexer Prozess, der nach Expertenwissen verlangt. Schließlich fließen Fähigkeiten aus den Bereichen Mathematik und Informatik zusammen und es entstehen Aufgabenfelder mit verschiedenen Ansprüchen. Ein Data Science Team hat die Aufgabe, diesen verschiedenen Anforderungen gerecht zu werden, muss dabei über gute kommunikative Fähigkeiten besitzen und die benötigten Expertisen mitbringen. Das Team ist die zentrale Steuerung und Ausführung aller AI-Anwendungsfälle und obligatorisch für den Erfolg dieser.

Sehen wir uns nun an, welche Mitglieder ein gutes Data Science Team benötigt.

Welche Mitglieder benötigt ein gutes Data Science Team? 

Die Umsetzung und Durchführung unterschiedlicher Data Science Projekte ist kein Kinderspiel und setzt eine gute Zusammenarbeit unterschiedlicher Rollen voraus. Damit diese Zusammenarbeit gelingt, ist es wichtig, alle Bereiche abzudecken, in denen Fachwissen benötigt wird. In der Praxis kommt es jedoch oftmals vor, dass mehrere Bereiche von einer Person übernommen werden aber wir gehen auf die Personen im Einzelnen ein.

Data Scientist 

Eine der wesentlichen Aufgaben eines Data Scientist liegt darin, in ständigem Austausch mit Fachabteilungen zu stehen und auch mit dem Management zusammenzuarbeiten. Dabei geht es vor allem darum, dass Bedürfnisse erkannt und anschließend abstrahiert sowie innerhalb der unternehmerischen Praxis umgesetzt und implementiert werden. 

Dadurch ist der Data Scientist weitestgehend für eine durchdachte Analysestrategie verantwortlich, bei der es primär um

  • die Auswahl einer passenden Methodik,
  • die Umsetzung der eigentlichen Analyse 
  • sowie die Interpretation und Visualisierung der Ergebnisse geht. 

Zudem muss ein Data Scientist erkennen können, welchen Nutzen man aus den vorliegenden Daten ziehen kann und welche Anwendungsmöglichkeiten überhaupt für das Unternehmen sinnvoll sind. Dazu sind vor allem Fachkenntnisse nötig, wie über den Umgang mit Daten, bei dem es hauptsächlich um die Extraktion, Bereinigung sowie Zusammenführung und Aufbereitung geht. 

Neben einer Reihe hochanspruchsvoller Fachkenntnisse sind einige Soft-Skills ebenfalls von Vorteil. Dazu gehören unter anderem, dass Präsentations- und Kommunikationsfähigkeiten ein Mindestmaß mit sich bringen, um beispielsweise Ergebnisse aussagekräftig präsentieren zu können und vor allem für Mitarbeiter anderer Bereiche verständlich darzustellen, sodass diese ebenfalls den Nutzen verschiedener Anwendungen verstehen. 

  • Technische Fähigkeiten: Kenntnisse über Datenverarbeitung; Grundlagen der Programmierung; Verständnis von Datenbanken, Datenformaten und Cloud-Architekturen
  • Persönliche Kompetenzen: Analytisches Denken; Kommunikative Fähigkeiten; Koordinationsvermögen
  • Typische Aufgaben: Datenanalyse

Data Engineer 

In der Anfangsphase eines Projekts hat der Data Engineer die Aufgabe, sämtliche Daten aus unterschiedlichen Quellen zusammenzuführen und diese im Anschluss aufzubereiten sowie für darauffolgende Schritte zur Verfügung zu stellen. Sie stellen quasi das Fundament dar für Tätigkeiten wie Big Data Analysen. Neigt sich ein Projekt dem Ende zu, so sind Data Engineers vor allem daran beteiligt, dass eine erfolgreiche Implementierung der Ergebnisse in das operative Geschäft erfolgt.

Vergleicht man einen Data Engineer mit einem Data Scientist, so hat der Data Engineer einen eher technischen Schwerpunkt in seiner Arbeit. Das bedeutet, dass er vor allem für die Erstellung von Schnittstellen zu relevanten Systemen in der Schlussphase eines Projekts zuständig ist. Dazu zählen insbesondere Tätigkeiten, die mit dem Umgang von Datenbanken, Data Warehousing Tools sowie Cloud-Systemen zu tun haben.  

  • Technische Fähigkeiten: Wissen zur Umsetzung des Datenprozesses; Kenntnisse in Programmierung
  • Persönliche Kompetenzen: starke zwischenmenschliche Kommunikation
  • Typische Aufgaben:
    • Management von Datenbanken
    • Aufbau und Pflege von Datenpipelines
    • Automatisierung von Datentransfer- und Datentransformationsprozessen
    • Aufbau und Betreuung einer Cloud-Infrastruktur

Machine Learning Engineer 

Der Machine Learning Engineer hat seine Fähigkeiten in den Bereichen Mathematik, Programmierung, Statistik und Computerwissenschaften. Sie gelten vorwiegend als Experten in den Bereichen Prozessautomatisierung und Datenverarbeitung. Ähnlich wie der Data Engineer hat er die Aufgabe, bei der konkreten Entwicklung und Implementierung von Künstlicher Intelligenz in der Praxis mitzuhelfen. 

Künstliche Intelligenz optimiert Marketing und Vertrieb

In 6 Fallstudien erfahren Sie:

  • Wie Sie 29% mehr Umsatz pro Kampagne machen.
  • Wie Sie durch KI und Automatisierung mehr Zeit gewinnen.
  • Wie Sie 300% mehr Conversions zur richtigen Zeit machen.
Jetzt herunterladen

Dazu gehören vor allem Aufgaben wie

  • die Aufbereitung großer Datenmengen,
  • Anpassung verschiedener Machine-Learning Modelle
  • sowie die Analyse von Datenstrukturen und zugehörigen Programmierkenntnissen.  

Neben all dem technischen Wissen ist es dennoch nützlich, dass ein Machine Learning Engineer ebenfalls Soft-Skills, wie eine Eigenverantwortlichkeit, Pünktlichkeit und Teamfähigkeit mitbringt. 

  • Technische Fähigkeiten: Gute Programmierkenntnisse; Kenntnisse im Bereich Informatik und Mathematik
  • Persönliche Kompetenzen: Eigenverantwortliches Arbeiten; Logisches Denken; Präzision
  • Typische Aufgaben:
    • Aufbereitung großer Datenmengen
    • Verbesserung von ML-Modellen
    • Aufbau und Analyse von Datenstrukturen

DevOps Engineer 

Ein DevOps Engineer setzt sich sozusagen aus den beiden Bereichen Development (Entwicklung) und Operations (IT-Betrieb) zusammen. Deshalb kennt sich der DevOps Engineer sowohl in der Entwicklung als auch der Administration sämtlicher Aufgaben bezüglich eines Data Science Projekts aus.

Der Grund für die Zusammenführung beider Bereiche ist, dass Unklarheiten sowie schlecht koordinierte Aufgaben und Verspätungen vermieden werden sollen. Es ergeben sich folgende Vorteile:

  • Beschleunigung der Projektentwicklung
  • Steigerung der Flexibilität
  • Effiziente Zusammenarbeit
  • Optimierung von Informationsflüssen

Zu den Kernaufgaben eines DevOps Engineer gehören Administrationstätigkeiten und technische Aufgaben wie das Monitoring, Programmieren oder die Erstellung von Skripten. 

  • Technische Fähigkeiten: Development und Administration
  • Persönliche Kompetenzen: Kommunikationsfähigkeiten; Gute Koordinationsfähigkeiten
  • Typische Aufgaben:
    • Ausführung administrativer Tätigkeiten
    • Monitoring
    • Programmierung
    • Fehlerbehebungen
    • Erstellung von Skripten und Tools zur agilen Entwicklung
    • Programmierung von Skripten zur Automatisierung von Monitoring, Code-Analysen oder Build- und Release-Prozessen entlang einer CI/CD-Pipeline

Domänenexperte 

Neben dem technischen Verständnis eines Projekts ist das Verständnis über die Herausforderungen des Unternehmens sowie übergreifendem Branchenwissen ein wichtiger Bestandteil zur Umsetzung eines Projekts. Domänenexperten sind befähigt, Einschätzungen bestimmter Gebiete und Branchen abzugeben und kennen sich in spezifischen Themen extrem gut aus. Es handelt sich dabei um Fachexperten wie Marketing-Manager, Supply-Chain-Manager oder aber Personen völlig anderer Bereiche, wie Ingenieure.  

Benötigen Sie Unterstützung?

Gerne helfen wir Ihnen bei den ersten Schritten zur eigenen Datenplattform oder begleiten Sie auf Ihrem Weg zur Data Driven Company.

Data Science Beratung

Es geht also darum, jemanden im Team zu haben, der über gute Fachkenntnisse zu einem Themengebiet verfügt. Zudem sollte dieser in ständigem Austausch mit den technischen Experten wie beispielsweise dem Data Engineer stehen. Vor alle in der Anfangsphase eines Projekts, in der es um die richtige Einordnung sowie Identifizierung des Geschäftsproblems geht, ist es schwierig, auf einen Domänenexperten zu verzichten. 

Chief Analytics Officer 

Der Chief Analytics Officer ist nicht in jedem Unternehmen vorzufinden und ist daher seltener vertreten als andere zuvor vorgestellte Positionen. Dennoch ist ein Chief Analytics Officer nicht zu vernachlässigen. Zu seinen Hauptaufgaben gehört der verantwortungsbewusste Umgang mit Daten innerhalb des Unternehmens. Um dies zu gewährleisten, sind jedoch Kenntnisse über statistische Analysen, Marketing, Finanzen sowie betriebswirtschaftlichem Fachwissen nötig. 

Zudem hat der Chief Analytics Officer die wichtige Aufgabe, Personal für weitere Data Science Projekte zu rekrutieren und somit für eine ständige Bereitschaft von geschultem Personal in diesem Bereich zu sorgen.   

Aufgaben und Expertise im Überblick 

Position Aufgaben Kenntnisse  Bedeutung 
Data Scientist Auswahl einer Analysestrategie mit passenden statistischen Modellen, Visualisierung der Ergebnisse Mathematische, statistische Modelle, Fähigkeiten der Informatik Kommunikation zwischen Fachabteilungen, Bedürfnisse erkennen und umsetzen 
Data Engineer Sammlung, Aufbereitung und Analyse von Daten  Umgang mit Datenbanken, Data Warehousing-Tools und Cloud-Systemen Technischer Experte im Team, Implementierung der Ergebnisse ins operative Geschäft 
Machine Learning Engineer Anpassung von Machine Learning Modellen, Analyse großer Datenmengen Mathematik, Computerwissenschaften, Programmierung und Statistik  Experte im Bereich Prozessautomatisierung und Datenverarbeitung 
DevOps Engineer Monitoring, Programmierung, Erstellung von Skripten Administrative und softwarebasierte Aufgaben  Zusammenführung zwischen Entwicklern und dem IT-Betrieb 
Domänenexperte Branchenwissen, Einschätzung bestimmter Fragestellungen Fachkenntnisse des jeweiligen Gebiets (Marketing Manager, Ingenieur, Maschinenbau etc.) Ständiger Austausch mit technischen Experten zur Entwicklung einer Strategie 
Chief Analytics Officer Umgang mit Daten in einem Unternehmen, Personalrekrutierung Statistische Analysen, Marketing, Finanzen und betriebswirtschaftliche Kenntnisse Bereitstellung und Rekrutierung von geschultem Personal  
Aufgaben, Kenntnisse und Bedeuetung der einzelnen Positionen.

Welche Herausforderungen bestehen bei der Zusammenstellung eines Data Science Teams? 

Die Wahl und der Aufbau eines guten Data Science Teams ist eine spannende Herausforderung. Es gestaltet sich oftmals als ein kontinuierlicher Prozess, welcher nicht von heute auf morgen umgesetzt werden kann. Doch unter Berücksichtigung der möglichen Herausforderungen rückt ein Unternehmen dem Aufbau eines Data Science Teams ein gutes Stück näher. 

Im Folgenden möchte ich Ihnen bestimmte Bereiche vorstellen, in denen in der Praxis oftmals zu Schwierigkeiten entstehen können. Es ist deshalb wichtig, diese Bereiche im Vorhinein zu überprüfen, um eine reibungslose Zusammenstellung eines Data Science Teams zu gewährleisten. 

Auswahl wichtiger Aufgaben 

In Unternehmen kommt es häufig vor, dass ein Data Scientist oder das gesamte Team ständig mit Fragestellungen und Anfragen des Unternehmens aufgehalten wird. Sind diese jedoch nicht auf das vorliegende Projekt bezogen, so kann dies das Team in seiner Arbeit stören und Zeit in Anspruch nehmen. Es macht daher Sinn, eine Art Prioritätenliste von Aufgaben zu erstellen und zur gewährleisten, dass wichtige Prozesse und projektspezifische Aufgaben Priorität haben.  

Modelle und Tools 

Bei der Umsetzung eines guten Data Science Projekts spielen die genutzten Modelle und Tools selbstverständlich eine wichtige Rolle. Die im Vorfeld erstelle Aufgaben- und Prioritätenliste bietet das Fundament, um zu schauen, welche Tools Sinn machen und welche Aufgaben diese umsetzen können. Dabei gibt es Funktionen, die fundamental sind und von einer Software umgesetzt werden sollten, wie beispielsweise die Ausführung von Skripten, Automatisierung von Abfragen sowie die Datenverarbeitung. Die Wahl der richtigen Tools fördert auf lange Sicht die Produktivität und Zufriedenheit der Data Science Teammitglieder erheblich.  

Qualität der Daten 

Neben der Wahl passender Tools und Modelle ist die Qualität der Daten ein weiterer wichtiger Aspekt, um langfristig ein produktives und qualitativ hochwertiges Projekt umzusetzen. Doch bevor die Qualität der Daten eine Rolle spielt, ist es zunächst wichtig, dass überhaupt genügend Daten zur Auswahl stehen. Daten bilden das Fundament, um Modelle auf Basis von maschinellem Lernen zu entwickeln und daraus Erkenntnisse sowie ein Nutzen generieren zu können. 

Aufbau des Teams 

Zu Beginn eines Projekts ist es oftmals so, dass die Größe des Teams beziehungsweise die entsprechenden Fachkenntnisse und Fähigkeiten überschaubar sind. Mit der Zeit wachsen die Ansprüche sowie die Komplexität eines Projekts jedoch. Dies erfordert, sich mit der Wahl von richtigem Personal sowie dem Ausbau und Aufbau eines guten Data Science Teams zu beschäftigen. Vordergründig ist dabei, dass die essenziellen Aufgaben sorgfältig abgedeckt sind. Dazu zählen, dass genügend Personal für die Entwicklung, Implementierung und Wartung der Modelle zur Verfügung stehen. Wie bereits beschrieben ist es unter anderem die Aufgabe des Chief Analytics Officer, genügend und geschultes Personal zu rekrutieren und für Data Science Projekte bereitzustellen. 

Prozessoptimierung

Die Vorhersage von genauen Terminen ist in Data Science Projekten oftmals schwierig. Dies liegt unter anderem daran, dass solche Projekte mit einer Vielzahl unterschiedlicher Aktivitäten gleichzeitig beginnen. Es kann also passieren, dass gewisse Aktivitäten längere Zeit benötigen als andere. Das führt dazu, dass ein zuvor geplanter Prozess nicht exakt eingehalten werden kann. Es ist deshalb gut, einen passenden Ansatz zu wählen. Dieser sollte einerseits gewisse Richtlinien vorgeben und andererseits eine Flexibilität in der Arbeitsweise zulassen und für das Team passend sein. 

Fazit 

Um Data-Science Projekte erfolgreich umzusetzen, benötigt es unterschiedliche Teammitglieder, die jeweils ihre eigenen Stärken haben. Während ein Data Engineer technisches Wissen mitbringt, hat der Domänenexperte seine Stärke in der Identifikation des Geschäftsproblems. Zudem beschäftigt er sich mit der Einordnung potenzieller Anwendungen. Neben den einzelnen Mitgliedern eines Data Science Teams ist es jedoch ebenfalls wichtig, dass eine agile Arbeitsweise herrscht. Zudem sollte eine enge Zusammenarbeit mit ständigem Austausch stattfinden.  

Wir begleiten Sie bei der Umsetzung Ihrer Data Science Projekte und das von Anfang an. Erfahren Sie hier mehr.

FAQ – Die wichtigsten Fragen schnell beantwortet

Welche Rollen sind in einem Data Science Team wichtig?

Wichtige Rollen sind Data Scientist, Data Engineer, Machine Learning Engineer, DevOps Engineer, Domänenexperte und Chief Analytics Officer.

Welche Herausforderungen gibt es beim Aufbau eines Teams?

Da verschiedene Fachbereiche und Fähigkeiten aufeinandertreffen ist eine gute Kommunikation und Koordination von besonderer Bedeutung. Außerdem müssen Aufgaben definiert und zugeteilt werden, Berechtigungen vergeben und Zuständigkeiten definiert werden.

Welche Fähigkeiten sind für ein Teammitglied entscheidend?

Neben guten zwischenmenschlichen Fähigkeiten in Punkten Kommunikation und Koordination sind technische Fähigkeiten essenziell. Die Expertise einzelner Teammitglieder hinsichtlich Datenverarbeitung, IT und Branchenwissen sind obligatorisch.

Profilbild von Vinzent Wuttke Geschäftsführer Datasolut GmbH
Vinzent Wuttke
Geschäftsführer

Ihr Ansprechpartner

Ob und wie künstliche Intelligenz Ihnen weiterhelfen kann, können Sie in einem ersten, unverbindlichen Gespräch mit uns herausfinden.

In diesem Gespräch erfahren Sie:

  • Wie Ihr Use-Case technisch am besten umgesetzt werden kann
  • Wie wir maximal sicher mit Ihren Kundendaten umgehen
  • Wie lange wir für die Umsetzung benötigen und wie ein konkreter Projektplan aussehen könnte
Jetzt Erstgespräch vereinbaren

Weiterlesen

Machine Learning Vor 4 Monaten

Data Mining: Algorithmen, Definition, Methoden und Anwendungsbeispiele

Data Mining ist ein analytischer Prozess, bei dem computergestützte Methoden eingesetzt werden, um möglichst selbstständig und effizient interessante Datenmuster in großen Datensätzen zu identifizieren. Die verwendeten Algorithmen stammen aus der […]
Wie funktioniert Machine Learning? Eingabedaten, Algorithmen und Ausgabe.
Machine Learning Vor 5 Monaten

Machine Learning: Definition, Algorithmen, Methoden und Beispiele

Machine Learning (deutsch: maschinelles Lernen) ist eine Anwendung der Künstlichen Intelligenz (KI). Computersysteme lernen automatisch Muster und Zusammenhänge aus Daten und verbessern sich selbst, ohne explizit programmiert zu werden. Machine […]
Machine Learning Vor 5 Monaten

MLflow: Eine Plattform für den Machine Learning Lifecycle

MLflow ist eine Machine Learning Plattform Komponente und begleitet den kompletten Machine Learning Prozess eines Data Science Projektes. Ziel ist die Dokumentation, Reproduzierbarkeit und das Deployment zu vereinfachen. Das Silicon […]
Deep Learning Objekterkennung auf einer Straße
Machine Learning Vor 6 Monaten

Machine Learning vs. Deep Learning: Wo ist der Unterschied?

Machine Learning und Deep Learning sind 2 Teilbereiche der Künstlichen Intelligenz, doch was unterscheidet sie und wann nutzen wir Machine Learning vs. Deep Learning? Das klären wir in diesem Artikel! […]
Customer AnalyticsMachine Learning Vor 1 Jahr

Machine Learning im E-Commerce – Anwendungsfälle und Nutzen

Wie lässt sich Machine Learning im E-Commerce sinnvoll einsetzen? Wir zeigen Ihnen interessante Anwendungsfälle von Machine Learning im E-Commerce, die Ihren Umsatz steigern und Ihre Marketingkosten senken.   Wie lässt sich Machine Learning im E-Commerce einsetzen?  Mittlerweile ist […]
Machine Learning Vor 1 Jahr

Textklassifikation

Die Identifizierung und Analyse großer Textmengen stellt einen wichtigen Antreiber für eine Vielzahl unternehmensrelevanter Entscheidungen dar. Grund ist der hohe Erkenntnisgewinn, der durch Analyse dieser Textmengen entsteht. Da die Extraktion […]
automl-plattformen
Machine Learning Vor 1 Jahr

Ist Auto ML die Zukunft von Data Science?

AutoML ist ein heiß diskutiertes Thema, welches eine enorme Effizienzsteigerung für den Machine Learning Prozess verspricht. Doch wie viel Potential steckt in dem automatisierten Machine Learning Ansatz? Wir zeigen Ihnen, […]
Prognosemodell Beispielbild
Machine Learning Vor 1 Jahr

Was ist eine Absatzprognose? Faktoren, Verfahren und Methoden

Absatzprognosen helfen dem Unternehmen dabei, zukünftige Entwicklungen der Absatzzahlen voraussagen zu können. Dies ist besonders hilfreich, um frühzeitige Entscheidungen in Bezug auf Planungen zu treffen und so Kosten einzusparen. In diesem […]
Machine Learning Vor 1 Jahr

Nachfrageprognose: Definition, Methoden und Beispiele

Eine Nachfrageprognose sagt die zukünftige Kundennachfrage auf Basis historischer Daten vorher. Im Rahmen von Entscheidungsfindungen bieten Nachfrageprognosen eine gute Grundlage, um Planungen im Unternehmen effizient umzusetzen. Je nach Anwendungsfall und Prognoseziel stehen dem […]
Newsletter und Updates

Sie sehen gerade einen Platzhalterinhalt von HubSpot. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Mehr Informationen
Erstgespräch vereinbaren