Aufbau eines Data Science Teams

Sich mit Themen wie der Künstlichen Intelligenz, Big Data oder Machine Learning zu befassen, wird von Jahr zu Jahr für viele Unternehmen immer wichtiger. Anhand der Börse ist zu erkennen, wie erfolgreich Tech-Unternehmen mittlerweile sind und welche Rolle Daten heutzutage haben. In den nächsten werden sich auch Branchen, die bislang wenig mit Daten zu tun hatten, immer mehr zu datengetriebenen Unternehmen entwickeln. Das bedeutet jedoch, dass langfristig das Expertenwissen und IT-Kenntnisse sowie der Aufbau eines Data Science Teams eine zentrale Rolle spielen werden.  

Unternehmen, welche sich bislang auf ihrer Marktführerschaft ausgeruht haben, werden sich in naher Zukunft immer mehr mit solchen Themen auseinandersetzen müssen, sofern sie dies bislang nicht gemacht haben. Eines der zentralen Pfeiler ist dabei die Bildung eines Data Science Teams. 

In diesem Beitrag möchte ich Ihnen zeigen, weshalb die Errichtung eines Data Science Teams wichtig ist und welche Rollen vertreten sein sollten. 

  1. Welche Mitglieder benötigt ein gutes Data Science Team? 
  2. Aufgaben und Expertise im Überblick 
  3. Welche Herausforderungen bestehen bei der Zusammenstellung eines Data Science Teams? 

Welche Mitglieder benötigt ein gutes Data Science Team? 

Die Umsetzung und Durchführung unterschiedlicher Data Science Projekte sind kein Kinderspiel und benötigen eine Zusammenarbeit unterschiedlicher Rollen. Damit diese Zusammenarbeit gelingt, ist es wichtig, alle Bereiche abzudecken, in denen Fachwissen benötigt wird. In der Praxis kommt es jedoch oftmals vor, dass mehrere Bereiche von einer Person übernommen werden. Im Folgenden möchte ich Ihnen einen Überblick geben, welche Personen einen wesentlichen Anteil an erfolgreichen Data Science Projekte haben. 

Data Scientist 

Eine der wesentlichen Aufgaben eines Data Scientist liegt darin, in ständigem Austausch mit Fachabteilungen zu stehen und auch mit dem Management zusammenzuarbeiten. Dabei geht es vor allem darum, dass Bedürfnisse erkannt und anschließend abstrahiert sowie innerhalb der unternehmerischen Praxis umgesetzt und implementiert werden. 

Dadurch ist der Data Scientist weitestgehend für eine durchdachte Analysestrategie verantwortlich, bei der es primär um die Auswahl einer passenden Methodik, die Umsetzung der eigentlichen Analyse sowie die Interpretation und Visualisierung der Ergebnisse geht. 

Zudem muss ein Data Scientist erkennen können, welchen Nutzen man aus den vorliegenden Daten ziehen kann und welche Anwendungsmöglichkeiten überhaupt für das Unternehmen sinnvoll sind. Dazu sind vor allem Fachkenntnisse nötig. Dazu gehören der Umgang mit Daten, bei dem es hauptsächlich um die Extrahierung, Bereinigung sowie Zusammenführung und Aufbereitung geht, nötig. 

Neben einer Reihe hochanspruchsvoller Fachkenntnisse sind einige Soft-Skills ebenfalls von Vorteil. Dazu gehören unter anderem, dass Präsentations- und Kommunikationsfähigkeiten ein Mindestmaß mit sich bringen, um beispielsweise Ergebnisse aussagekräftig präsentieren zu können und vor allem für Mitarbeiter anderer Bereiche verständlich darzustellen, sodass diese ebenfalls den Nutzen verschiedener Anwendungen verstehen. 

Data Engineer 

In der Anfangsphase eines Projekts hat der Data Engineer die Aufgabe, sämtliche Daten aus unterschiedlichen Quellen zusammenzuführen und diese im Anschluss aufzubereiten sowie für darauffolgende Schritte zur Verfügung zu stellen. 

Vergleicht man einen Data Engineer mit einem Data Scientist, so hat der Data Engineer einen technischen Schwerpunkt in seiner Arbeit. Das bedeutet, dass er vor allem für die Erstellung von Schnittstellen zu relevanten Systemen in der Schlussphase eines Projekts zuständig ist. Dazu zählen insbesondere Tätigkeiten, die mit dem Umgang von Datenbanken, Data Warehousing Tools sowie Cloud-Systemen zu tun haben.  

Neigt sich ein Projekt dem Ende, so sind Data Engineer vor allem daran interessiert, dass eine erfolgreiche Implementierung der Ergebnisse in das operative Geschäft erfolgt, sodass sämtliche Prozesse optimal funktionieren und dem Unternehmen in der Praxis einen Mehrwert liefern.

Machine Learning Engineer 

Der Machine Learning Engineer hat seine Fähigkeiten in den Bereichen Mathematik, Programmierung, Statistik und Computerwissenschaften. Sie gelten vorwiegend als Experten in den Bereichen Prozessautomatisierung und Datenverarbeitung. Ähnlich wie der Data Engineer hat er die Aufgabe, bei der konkreten Entwicklung und Implementierung von Künstlicher Intelligenz in der Praxis mitzuhelfen. Dazu gehören vor allem Aufgaben wie die Aufbereitung großer Datenmengen, Anpassung verschiedener Machine-Learning Modelle sowie die Analyse von Datenstrukturen und zugehörigen Programmierkenntnissen.  

Neben all dem technischen Wissen ist es dennoch nützlich, dass ein Machine Learning Engineer ebenfalls Soft-Skills, wie eine Eigenverantwortlichkeit, Pünktlichkeit und Teamfähigkeit mitbringt. 

DevOps Engineer 

Ein DevOps Engineer setzt sich sozusagen aus den beiden Bereichen Development (Entwicklung) und Operations (IT-Betrieb) zusammen. Deshalb kennt sich der DevOps Engineer sowohl in der Entwicklung als auch der Administration sämtlicher Aufgaben bezüglich eines Data Science Projekts aus. Da ein DevOps Engineer sowohl administrative als auch softwarebasierte Aufgabe auszuführen hat, gilt er als Entwickler und Administrator.  

Der Grund hinter der Zusammenführung beider Bereiche ist der, dass Unklarheiten sowie schlecht koordinierte Aufgaben und Verspätungen vermieden werden sollen. Zu den Kernaufgaben eines DevOps Engineer gehören zum einen, dass dieser sich mit unterschiedlichen Administratorentätigkeiten beschäftigt und zum anderen technische Aufgaben wie das Monitoring, Programmierung oder die Erstellung von Skripten bewältigt. 

Domänenexperte 

Neben dem technischen Verständnis eines Projekts ist das Verständnis und die Kenntnis des Geschäftsproblems sowie weiterem Branchenwissen ein wichtiger Bestandteil zur Umsetzung eines Projekts. Domänenexperten sind befähigt, Einschätzungen bestimmter Gebiete und Branchen abzugeben und kennen sich in spezifischen Themen extrem gut aus. Beispielsweise handelt es sich dabei um Marketing-Manager, Supply Chain Manager oder aber auch Personen völlig anderer Bereiche wie Ingenieure.  

Es geht also darum, jemanden im Team zu haben, der über gute Fachkenntnisse zu einem Themengebiet verfügt. Zudem sollte dieser in ständigem Austausch mit den technischen Experten wie beispielsweise dem Data Engineer stehen. Vor alle in der Anfangsphase eines Projekts, in der es um die richtige Einordnung sowie Identifizierung des Geschäftsproblems geht, ist es schwierig, auf einen Domänenexperten zu verzichten. 

Chief Analytics Officer 

Der Chief Analytics Officer ist nicht in jedem Unternehmen vorzufinden und ist daher seltener vertreten als andere zuvor vorgestellte Positionen. Dennoch ist ein Chief Analytics Officer nicht zu vernachlässigen. Zu seinen Hauptaufgaben gehört der verantwortungsbewusste Umgang mit Daten innerhalb des Unternehmens. Um dies zu gewährleisten, sind jedoch ebenfalls Kenntnisse statistischer Analysen, Marketing, Finanzen sowie betriebswirtschaftlichem Fachwissen nötig. 

Zudem hat der Chief Analytics Officer die wichtige Aufgabe, Personal für weitere Data Science Projekte zu rekrutieren und somit für eine ständige Bereitschaft von geschultem Personal in diesem Bereich zu sorgen.   

Aufgaben und Expertise im Überblick 

Position Aufgaben Kenntnisse  Bedeutung 
Data Scientist Auswahl einer Analysestrategie mit passenden statistischen Modellen, Visualisierung der Ergebnisse Mathematische, statistische Modelle, Fähigkeiten der Informatik Kommunikation zwischen Fachabteilungen, Bedürfnisse erkennen und umsetzen 
Data Engineer Sammlung, Aufbereitung und Analyse von Daten  Umgang mit Datenbanken, Data Warehousing-Tools und Cloud-Systemen Technischer Experte im Team, Implementierung der Ergebnisse ins operative Geschäft 
Machine Learning Engineer Anpassung von Machine Learning Modellen, Analyse großer Datenmengen Mathematik, Computerwissenschaften, Programmierung und Statistik  Experte im Bereich Prozessautomatisierung und Datenverarbeitung 
DevOps Engineer Monitoring, Programmierung, Erstellung von Skripten Administrative und softwarebasierte Aufgaben  Zusammenführung zwischen Entwicklern und dem IT-Betrieb 
Domänenexperte Branchenwissen, Einschätzung bestimmter Fragestellungen Fachkenntnisse des jeweiligen Gebiets (Marketing Manager, Ingenieur, Maschinenbau etc.) Ständiger Austausch mit technischen Experten zur Entwicklung einer Strategie 
Chief Analytics Officer Umgang mit Daten in einem Unternehmen, Personalrekrutierung Statistische Analysen, Marketing, Finanzen und betriebswirtschaftliche Kenntnisse Bereitstellung und Rekrutierung von geschultem Personal  
Aufgaben, Kenntnisse und Bedeuetung der einzelnen Positionen.

Welche Herausforderungen bestehen bei der Zusammenstellung eines Data Science Teams? 

Die Wahl und der Aufbau eines guten Data Science Teams ist eine spannende Herausforderung. Es gestaltet sich oftmals als ein kontinuierlicher Prozess, welcher nicht von heute auf morgen umgesetzt werden kann. Doch unter Berücksichtigung der möglichen Herausforderungen rückt ein Unternehmen dem Aufbau eines Data Science Teams ein gutes Stück näher. 

Im Folgenden möchte ich Ihnen bestimmte Bereiche vorstellen, in denen in der Praxis oftmals zu Schwierigkeiten entstehen können. Es ist deshalb wichtig, diese Bereiche im Vorhinein zu überprüfen, um eine reibungslose Zusammenstellung eines Data Science Teams zu gewährleisten. 

Auswahl wichtiger Aufgaben 

In Unternehmen kommt es häufig vor, dass ein Data Scientist oder das gesamte Team ständig mit Fragestellungen und Anfragen des Unternehmens aufgehalten wird. Sind diese jedoch nicht auf das vorliegende Projekt bezogen, so kann dies das Team in seiner Arbeit stören und Zeit in Anspruch nehmen. Es macht daher Sinn, eine Art Prioritätenliste von Aufgaben zu erstellen und zur gewährleisten, dass wichtige Prozesse und projektspezifische Aufgaben Priorität haben.  

Modelle und Tools 

Bei der Umsetzung eines guten Data Science Projekts spielen die genutzten Modelle und Tools selbstverständlich eine wichtige Rolle. Die im Vorfeld erstelle Aufgaben- und Prioritätenliste bietet das Fundament, um zu schauen, welche Tools Sinn machen und welche Aufgaben diese umsetzen können. Dabei gibt es Funktionen, die fundamental sind und von einer Software umgesetzt werden sollten, wie beispielsweise die Ausführung von Skripten, Automatisierung von Abfragen sowie die Datenverarbeitung. Die Wahl der richtigen Tools fördert auf lange Sicht die Produktivität und Zufriedenheit der Data Science Teammitglieder erheblich.  

Qualität der Daten 

Neben der Wahl passender Tools und Modelle ist die Qualität der Daten ein weiterer wichtiger Aspekt, um langfristig ein produktives und qualitativ hochwertiges Projekt umzusetzen. Doch bevor die Qualität der Daten eine Rolle spielt, ist es zunächst wichtig, dass überhaupt genügend Daten zur Auswahl stehen. Daten bilden das Fundament, um Modelle auf Basis von maschinellem Lernen zu entwickeln und daraus Erkenntnisse sowie ein Nutzen generieren zu können. 

Aufbau des Teams 

Zu Beginn eines Projekts ist es oftmals so, dass die Größe des Teams beziehungsweise die entsprechenden Fachkenntnisse und Fähigkeiten überschaubar sind. Mit der Zeit wachsen die Ansprüche sowie die Komplexität eines Projekts jedoch. Dies erfordert, sich mit der Wahl von richtigem Personal sowie dem Ausbau und Aufbau eines guten Data Science Teams zu beschäftigen. Vordergründig ist dabei, dass die essenziellen Aufgaben sorgfältig abgedeckt sind. Dazu zählen, dass genügend Personal für die Entwicklung, Implementierung und Wartung der Modelle zur Verfügung stehen. Wie bereits beschrieben ist es unter anderem die Aufgabe des Chief Analytics Officer, genügend und geschultes Personal zu rekrutieren und für Data Science Projekte bereitzustellen. 

Prozessoptimierung

Die Vorhersage von genauen Terminen ist in Data Science Projekten oftmals schwierig. Dies liegt unter anderem daran, dass solche Projekte mit einer Vielzahl unterschiedlicher Aktivitäten gleichzeitig beginnen. Es kann also passieren, dass gewisse Aktivitäten längere Zeit benötigen als andere. Das führt dazu, dass ein zuvor geplanter Prozess nicht exakt eingehalten werden kann. Es ist deshalb gut, einen passenden Ansatz zu wählen. Dieser sollte einerseits gewisse Richtlinien vorgeben und andererseits eine Flexibilität in der Arbeitsweise zulassen und für das Team passend sein. 

Fazit 

Um Data-Science Projekte erfolgreich umzusetzen, benötigt es unterschiedliche Teammitglieder, die jeweils ihre eigenen Stärken haben. Während ein Data Engineer technisches Wissen mitbringt, hat der Domänenexperte seine Stärke in der Identifikation des Geschäftsproblems. Zudem beschäftigt er sich mit der Einordnung potenzieller Anwendungen. Neben den einzelnen Mitgliedern eines Data Science Teams ist es jedoch ebenfalls wichtig, dass eine agile Arbeitsweise herrscht. Zudem sollte eine enge Zusammenarbeit mit ständigem Austausch stattfinden.  

Wir haben auf unserem Blog bereits einen interessanten Artikel zu der Umsetzung von Data Science Projekten. Schauen Sie auch gerne mal dort rein. 

Wenn Sie weitere Fragen zu diesem Thema haben können Sie mich gerne kontaktieren.  

Ihr Kontakt: Laurenz Wuttke

Unternehmen sitzen auf einem ungenutzten Berg von Kundendaten. Wir von datasolut entwickeln KI, die Ihr Marketing optimiert. Damit Sie dem richtigen Kunden zur richtigen Zeit das richtige Angebot machen können.

Laurenz Wuttke

Auch interessant für Sie

Praxisbeispiele

Künstliche Intelligenz optimiert Marketing und Vertrieb

Tragen Sie sich hier in unseren Newsletter ein und erhalten Sie gratis die KI-Anwendungsfälle:

Mit der Anmeldung stimmen Sie unserer Datenschutzerklärung zu.