Aufbau eines Data Science Teams

Sich mit Themen wie der Künstlichen Intelligenz, Big Data oder Machine Learning zu befassen, wird von Jahr zu Jahr für viele Unternehmen immer wichtiger. Anhand der Börse ist zu erkennen, wie erfolgreich Tech-Unternehmen mittlerweile sind und welche Rolle Daten heutzutage haben.

In den nächsten Jahren werden sich auch Branchen, die bislang wenig mit Daten zu tun hatten, immer mehr zu datengetriebenen Unternehmen entwickeln. Das bedeutet jedoch, dass langfristig das Expertenwissen und IT-Kenntnisse sowie der Aufbau eines Data Science Teams eine zentrale Rolle spielen werden.

Unternehmen, welche sich bislang auf ihrer Marktführerschaft ausgeruht haben, werden sich in naher Zukunft immer mehr mit solchen Themen auseinandersetzen müssen, sofern sie dies bislang nicht gemacht haben. Eines der zentralen Pfeiler ist dabei die Bildung eines Data Science Teams.

In diesem Beitrag möchte ich Ihnen zeigen, weshalb die Errichtung eines solchen Teams wichtig ist und welche Rollen vertreten sein sollten.

Warum Sie ein Data Science Team brauchen

Künstliche Intelligenz in Unternehmen einzuführen ist ein komplexer Prozess, der nach Expertenwissen verlangt. Schließlich fließen Fähigkeiten aus den Bereichen Mathematik und Informatik zusammen und es entstehen Aufgabenfelder mit verschiedenen Ansprüchen. Ein Data Science Team hat die Aufgabe, diesen verschiedenen Anforderungen gerecht zu werden, muss dabei über gute kommunikative Fähigkeiten besitzen und die benötigten Expertisen mitbringen. Das Team ist die zentrale Steuerung und Ausführung aller AI-Anwendungsfälle und obligatorisch für den Erfolg dieser.

Sehen wir uns nun an, welche Mitglieder ein gutes Data Science Team benötigt.

Welche Mitglieder benötigt ein gutes Data Science Team?

Die Umsetzung und Durchführung unterschiedlicher Data Science Projekte ist kein Kinderspiel und setzt eine gute Zusammenarbeit unterschiedlicher Rollen voraus. Damit diese Zusammenarbeit gelingt, ist es wichtig, alle Bereiche abzudecken, in denen Fachwissen benötigt wird. In der Praxis kommt es jedoch oftmals vor, dass mehrere Bereiche von einer Person übernommen werden aber wir gehen auf die Personen im Einzelnen ein.

Data Scientist

Eine der wesentlichen Aufgaben eines Data Scientist liegt darin, in ständigem Austausch mit Fachabteilungen zu stehen und auch mit dem Management zusammenzuarbeiten. Dabei geht es vor allem darum, dass Bedürfnisse erkannt und anschließend abstrahiert sowie innerhalb der unternehmerischen Praxis umgesetzt und implementiert werden.

Dadurch ist der Data Scientist weitestgehend für eine durchdachte Analysestrategie verantwortlich, bei der es primär um

die Auswahl einer passenden Methodik,
die Umsetzung der eigentlichen Analyse
sowie die Interpretation und Visualisierung der Ergebnisse geht.

Zudem muss ein Data Scientist erkennen können, welchen Nutzen man aus den vorliegenden Daten ziehen kann und welche Anwendungsmöglichkeiten überhaupt für das Unternehmen sinnvoll sind. Dazu sind vor allem Fachkenntnisse nötig, wie über den Umgang mit Daten, bei dem es hauptsächlich um die Extraktion, Bereinigung sowie Zusammenführung und Aufbereitung geht.

Neben einer Reihe hochanspruchsvoller Fachkenntnisse sind einige Soft-Skills ebenfalls von Vorteil. Dazu gehören unter anderem, dass Präsentations- und Kommunikationsfähigkeiten ein Mindestmaß mit sich bringen, um beispielsweise Ergebnisse aussagekräftig präsentieren zu können und vor allem für Mitarbeiter anderer Bereiche verständlich darzustellen, sodass diese ebenfalls den Nutzen verschiedener Anwendungen verstehen.

Technische Fähigkeiten: Kenntnisse über Datenverarbeitung; Grundlagen der Programmierung; Verständnis von Datenbanken, Datenformaten und Cloud-Architekturen
Persönliche Kompetenzen: Analytisches Denken; Kommunikative Fähigkeiten; Koordinationsvermögen
Typische Aufgaben: Datenanalyse

Data Engineer

In der Anfangsphase eines Projekts hat der Data Engineer die Aufgabe, sämtliche Daten aus unterschiedlichen Quellen zusammenzuführen und diese im Anschluss aufzubereiten sowie für darauffolgende Schritte zur Verfügung zu stellen. Sie stellen quasi das Fundament dar für Tätigkeiten wie Big Data Analysen. Neigt sich ein Projekt dem Ende zu, so sind Data Engineers vor allem daran beteiligt, dass eine erfolgreiche Implementierung der Ergebnisse in das operative Geschäft erfolgt.

Vergleicht man einen Data Engineer mit einem Data Scientist, so hat der Data Engineer einen eher technischen Schwerpunkt in seiner Arbeit. Das bedeutet, dass er vor allem für die Erstellung von Schnittstellen zu relevanten Systemen in der Schlussphase eines Projekts zuständig ist. Dazu zählen insbesondere Tätigkeiten, die mit dem Umgang von Datenbanken, Data Warehousing Tools sowie Cloud-Systemen zu tun haben.

Technische Fähigkeiten: Wissen zur Umsetzung des Datenprozesses; Kenntnisse in Programmierung
Persönliche Kompetenzen: starke zwischenmenschliche Kommunikation
Typische Aufgaben:
- Management von Datenbanken
- Aufbau und Pflege von Datenpipelines
- Automatisierung von Datentransfer- und Datentransformationsprozessen
- Aufbau und Betreuung einer Cloud-Infrastruktur

Machine Learning Engineer

Der Machine Learning Engineer hat seine Fähigkeiten in den Bereichen Mathematik, Programmierung, Statistik und Computerwissenschaften. Sie gelten vorwiegend als Experten in den Bereichen Prozessautomatisierung und Datenverarbeitung. Ähnlich wie der Data Engineer hat er die Aufgabe, bei der konkreten Entwicklung und Implementierung von Künstlicher Intelligenz in der Praxis mitzuhelfen.

Künstliche Intelligenz optimiert Marketing und Vertrieb

In 6 Fallstudien erfahren Sie:

Wie Sie 29% mehr Umsatz pro Kampagne machen.
Wie Sie durch KI und Automatisierung mehr Zeit gewinnen.
Wie Sie 300% mehr Conversions zur richtigen Zeit machen.

Jetzt herunterladen

Dazu gehören vor allem Aufgaben wie

die Aufbereitung großer Datenmengen,
Anpassung verschiedener Machine-Learning Modelle
sowie die Analyse von Datenstrukturen und zugehörigen Programmierkenntnissen.

Neben all dem technischen Wissen ist es dennoch nützlich, dass ein Machine Learning Engineer ebenfalls Soft-Skills, wie eine Eigenverantwortlichkeit, Pünktlichkeit und Teamfähigkeit mitbringt.

Technische Fähigkeiten: Gute Programmierkenntnisse; Kenntnisse im Bereich Informatik und Mathematik
Persönliche Kompetenzen: Eigenverantwortliches Arbeiten; Logisches Denken; Präzision
Typische Aufgaben:
- Aufbereitung großer Datenmengen
- Verbesserung von ML-Modellen
- Aufbau und Analyse von Datenstrukturen

DevOps Engineer

Ein DevOps Engineer setzt sich sozusagen aus den beiden Bereichen Development (Entwicklung) und Operations (IT-Betrieb) zusammen. Deshalb kennt sich der DevOps Engineer sowohl in der Entwicklung als auch der Administration sämtlicher Aufgaben bezüglich eines Data Science Projekts aus.

Der Grund für die Zusammenführung beider Bereiche ist, dass Unklarheiten sowie schlecht koordinierte Aufgaben und Verspätungen vermieden werden sollen. Es ergeben sich folgende Vorteile:

Beschleunigung der Projektentwicklung
Steigerung der Flexibilität
Effiziente Zusammenarbeit
Optimierung von Informationsflüssen

Zu den Kernaufgaben eines DevOps Engineer gehören Administrationstätigkeiten und technische Aufgaben wie das Monitoring, Programmieren oder die Erstellung von Skripten.

Technische Fähigkeiten: Development und Administration
Persönliche Kompetenzen: Kommunikationsfähigkeiten; Gute Koordinationsfähigkeiten
Typische Aufgaben:
- Ausführung administrativer Tätigkeiten
- Monitoring
- Programmierung
- Fehlerbehebungen
- Erstellung von Skripten und Tools zur agilen Entwicklung
- Programmierung von Skripten zur Automatisierung von Monitoring, Code-Analysen oder Build- und Release-Prozessen entlang einer CI/CD-Pipeline

Domänenexperte

Neben dem technischen Verständnis eines Projekts ist das Verständnis über die Herausforderungen des Unternehmens sowie übergreifendem Branchenwissen ein wichtiger Bestandteil zur Umsetzung eines Projekts. Domänenexperten sind befähigt, Einschätzungen bestimmter Gebiete und Branchen abzugeben und kennen sich in spezifischen Themen extrem gut aus. Es handelt sich dabei um Fachexperten wie Marketing-Manager, Supply-Chain-Manager oder aber Personen völlig anderer Bereiche, wie Ingenieure.

Benötigen Sie Unterstützung?

Gerne helfen wir Ihnen bei den ersten Schritten zur eigenen Datenplattform oder begleiten Sie auf Ihrem Weg zur Data Driven Company.

Data Science Beratung

Es geht also darum, jemanden im Team zu haben, der über gute Fachkenntnisse zu einem Themengebiet verfügt. Zudem sollte dieser in ständigem Austausch mit den technischen Experten wie beispielsweise dem Data Engineer stehen. Vor alle in der Anfangsphase eines Projekts, in der es um die richtige Einordnung sowie Identifizierung des Geschäftsproblems geht, ist es schwierig, auf einen Domänenexperten zu verzichten.

Chief Analytics Officer

Der Chief Analytics Officer ist nicht in jedem Unternehmen vorzufinden und ist daher seltener vertreten als andere zuvor vorgestellte Positionen. Dennoch ist ein Chief Analytics Officer nicht zu vernachlässigen. Zu seinen Hauptaufgaben gehört der verantwortungsbewusste Umgang mit Daten innerhalb des Unternehmens. Um dies zu gewährleisten, sind jedoch Kenntnisse über statistische Analysen, Marketing, Finanzen sowie betriebswirtschaftlichem Fachwissen nötig.

Zudem hat der Chief Analytics Officer die wichtige Aufgabe, Personal für weitere Data Science Projekte zu rekrutieren und somit für eine ständige Bereitschaft von geschultem Personal in diesem Bereich zu sorgen.

Aufgaben und Expertise im Überblick

Position	Aufgaben	Kenntnisse	Bedeutung
Data Scientist	Auswahl einer Analysestrategie mit passenden statistischen Modellen, Visualisierung der Ergebnisse	Mathematische, statistische Modelle, Fähigkeiten der Informatik	Kommunikation zwischen Fachabteilungen, Bedürfnisse erkennen und umsetzen
Data Engineer	Sammlung, Aufbereitung und Analyse von Daten	Umgang mit Datenbanken, Data Warehousing-Tools und Cloud-Systemen	Technischer Experte im Team, Implementierung der Ergebnisse ins operative Geschäft
Machine Learning Engineer	Anpassung von Machine Learning Modellen, Analyse großer Datenmengen	Mathematik, Computerwissenschaften, Programmierung und Statistik	Experte im Bereich Prozessautomatisierung und Datenverarbeitung
DevOps Engineer	Monitoring, Programmierung, Erstellung von Skripten	Administrative und softwarebasierte Aufgaben	Zusammenführung zwischen Entwicklern und dem IT-Betrieb
Domänenexperte	Branchenwissen, Einschätzung bestimmter Fragestellungen	Fachkenntnisse des jeweiligen Gebiets (Marketing Manager, Ingenieur, Maschinenbau etc.)	Ständiger Austausch mit technischen Experten zur Entwicklung einer Strategie
Chief Analytics Officer	Umgang mit Daten in einem Unternehmen, Personalrekrutierung	Statistische Analysen, Marketing, Finanzen und betriebswirtschaftliche Kenntnisse	Bereitstellung und Rekrutierung von geschultem Personal

Aufgaben, Kenntnisse und Bedeuetung der einzelnen Positionen.

Welche Herausforderungen bestehen bei der Zusammenstellung eines Data Science Teams?

Die Wahl und der Aufbau eines guten Data Science Teams ist eine spannende Herausforderung. Es gestaltet sich oftmals als ein kontinuierlicher Prozess, welcher nicht von heute auf morgen umgesetzt werden kann. Doch unter Berücksichtigung der möglichen Herausforderungen rückt ein Unternehmen dem Aufbau eines Data Science Teams ein gutes Stück näher.

Im Folgenden möchte ich Ihnen bestimmte Bereiche vorstellen, in denen in der Praxis oftmals zu Schwierigkeiten entstehen können. Es ist deshalb wichtig, diese Bereiche im Vorhinein zu überprüfen, um eine reibungslose Zusammenstellung eines Data Science Teams zu gewährleisten.

Auswahl wichtiger Aufgaben

In Unternehmen kommt es häufig vor, dass ein Data Scientist oder das gesamte Team ständig mit Fragestellungen und Anfragen des Unternehmens aufgehalten wird. Sind diese jedoch nicht auf das vorliegende Projekt bezogen, so kann dies das Team in seiner Arbeit stören und Zeit in Anspruch nehmen. Es macht daher Sinn, eine Art Prioritätenliste von Aufgaben zu erstellen und zur gewährleisten, dass wichtige Prozesse und projektspezifische Aufgaben Priorität haben.

Modelle und Tools

Bei der Umsetzung eines guten Data Science Projekts spielen die genutzten Modelle und Tools selbstverständlich eine wichtige Rolle. Die im Vorfeld erstelle Aufgaben- und Prioritätenliste bietet das Fundament, um zu schauen, welche Tools Sinn machen und welche Aufgaben diese umsetzen können. Dabei gibt es Funktionen, die fundamental sind und von einer Software umgesetzt werden sollten, wie beispielsweise die Ausführung von Skripten, Automatisierung von Abfragen sowie die Datenverarbeitung. Die Wahl der richtigen Tools fördert auf lange Sicht die Produktivität und Zufriedenheit der Data Science Teammitglieder erheblich.

Qualität der Daten

Neben der Wahl passender Tools und Modelle ist die Qualität der Daten ein weiterer wichtiger Aspekt, um langfristig ein produktives und qualitativ hochwertiges Projekt umzusetzen. Doch bevor die Qualität der Daten eine Rolle spielt, ist es zunächst wichtig, dass überhaupt genügend Daten zur Auswahl stehen. Daten bilden das Fundament, um Modelle auf Basis von maschinellem Lernen zu entwickeln und daraus Erkenntnisse sowie ein Nutzen generieren zu können.

Aufbau des Teams

Zu Beginn eines Projekts ist es oftmals so, dass die Größe des Teams beziehungsweise die entsprechenden Fachkenntnisse und Fähigkeiten überschaubar sind. Mit der Zeit wachsen die Ansprüche sowie die Komplexität eines Projekts jedoch. Dies erfordert, sich mit der Wahl von richtigem Personal sowie dem Ausbau und Aufbau eines guten Data Science Teams zu beschäftigen. Vordergründig ist dabei, dass die essenziellen Aufgaben sorgfältig abgedeckt sind. Dazu zählen, dass genügend Personal für die Entwicklung, Implementierung und Wartung der Modelle zur Verfügung stehen. Wie bereits beschrieben ist es unter anderem die Aufgabe des Chief Analytics Officer, genügend und geschultes Personal zu rekrutieren und für Data Science Projekte bereitzustellen.

Prozessoptimierung

Die Vorhersage von genauen Terminen ist in Data Science Projekten oftmals schwierig. Dies liegt unter anderem daran, dass solche Projekte mit einer Vielzahl unterschiedlicher Aktivitäten gleichzeitig beginnen. Es kann also passieren, dass gewisse Aktivitäten längere Zeit benötigen als andere. Das führt dazu, dass ein zuvor geplanter Prozess nicht exakt eingehalten werden kann. Es ist deshalb gut, einen passenden Ansatz zu wählen. Dieser sollte einerseits gewisse Richtlinien vorgeben und andererseits eine Flexibilität in der Arbeitsweise zulassen und für das Team passend sein.

Fazit

Um Data-Science Projekte erfolgreich umzusetzen, benötigt es unterschiedliche Teammitglieder, die jeweils ihre eigenen Stärken haben. Während ein Data Engineer technisches Wissen mitbringt, hat der Domänenexperte seine Stärke in der Identifikation des Geschäftsproblems. Zudem beschäftigt er sich mit der Einordnung potenzieller Anwendungen. Neben den einzelnen Mitgliedern eines Data Science Teams ist es jedoch ebenfalls wichtig, dass eine agile Arbeitsweise herrscht. Zudem sollte eine enge Zusammenarbeit mit ständigem Austausch stattfinden.

Wir begleiten Sie bei der Umsetzung Ihrer Data Science Projekte und das von Anfang an. Erfahren Sie hier mehr.

FAQ – Die wichtigsten Fragen schnell beantwortet

Welche Rollen sind in einem Data Science Team wichtig?

Wichtige Rollen sind Data Scientist, Data Engineer, Machine Learning Engineer, DevOps Engineer, Domänenexperte und Chief Analytics Officer.

Welche Herausforderungen gibt es beim Aufbau eines Teams?

Da verschiedene Fachbereiche und Fähigkeiten aufeinandertreffen ist eine gute Kommunikation und Koordination von besonderer Bedeutung. Außerdem müssen Aufgaben definiert und zugeteilt werden, Berechtigungen vergeben und Zuständigkeiten definiert werden.

Welche Fähigkeiten sind für ein Teammitglied entscheidend?

Neben guten zwischenmenschlichen Fähigkeiten in Punkten Kommunikation und Koordination sind technische Fähigkeiten essenziell. Die Expertise einzelner Teammitglieder hinsichtlich Datenverarbeitung, IT und Branchenwissen sind obligatorisch.

Vinzent Wuttke

Geschäftsführer

Lassen Sie uns sprechen und Ihr Potenzial entdecken.

Ob und wie künstliche Intelligenz Ihnen weiterhelfen kann, können Sie in einem ersten, unverbindlichen Gespräch mit uns herausfinden.

In diesem Gespräch erfahren Sie:

Wie Ihr Use-Case technisch am besten umgesetzt werden kann
Wie wir maximal sicher mit Ihren Kundendaten umgehen
Wie lange wir für die Umsetzung benötigen und wie ein konkreter Projektplan aussehen könnte

Jetzt Erstgespräch vereinbaren

Aufbau eines Data Science Teams

Warum Sie ein Data Science Team brauchen

Welche Mitglieder benötigt ein gutes Data Science Team?

Data Scientist

Data Engineer

Machine Learning Engineer

Künstliche Intelligenz optimiert Marketing und Vertrieb

DevOps Engineer

Domänenexperte

Chief Analytics Officer

Aufgaben und Expertise im Überblick

Welche Herausforderungen bestehen bei der Zusammenstellung eines Data Science Teams?

Auswahl wichtiger Aufgaben

Modelle und Tools

Qualität der Daten

Aufbau des Teams

Prozessoptimierung

Fazit

FAQ – Die wichtigsten Fragen schnell beantwortet

Lassen Sie uns sprechen und Ihr Potenzial entdecken.

Weiterlesen

Data Mining: Algorithmen, Definition, Methoden und Anwendungsbeispiele

Machine Learning: Definition, Algorithmen, Methoden und Beispiele

MLflow: Eine Plattform für den Machine Learning Lifecycle

Machine Learning vs. Deep Learning: Wo ist der Unterschied?

Machine Learning im E-Commerce – Anwendungsfälle und Nutzen

Textklassifikation

Ist Auto ML die Zukunft von Data Science?

Was ist eine Absatzprognose? Faktoren, Verfahren und Methoden

Nachfrageprognose: Definition, Methoden und Beispiele