Sich mit Themen wie der Künstlichen Intelligenz, Big Data oder Machine Learning zu befassen, wird von Jahr zu Jahr für viele Unternehmen immer wichtiger. Anhand der Börse ist zu erkennen, wie erfolgreich Tech-Unternehmen mittlerweile sind und welche Rolle Daten heutzutage haben. In den nächsten Jahren werden sich auch Branchen, die bislang wenig mit Daten zu tun hatten, immer mehr zu datengetriebenen Unternehmen entwickeln. Das bedeutet jedoch, dass langfristig das Expertenwissen und IT-Kenntnisse sowie der Aufbau eines Data Science Teams eine zentrale Rolle spielen werden.
Unternehmen, welche sich bislang auf ihrer Marktführerschaft ausgeruht haben, werden sich in naher Zukunft immer mehr mit solchen Themen auseinandersetzen müssen, sofern sie dies bislang nicht gemacht haben. Eines der zentralen Pfeiler ist dabei die Bildung eines Data Science Teams.
In diesem Beitrag möchte ich Ihnen zeigen, weshalb die Errichtung eines solchen Teams wichtig ist und welche Rollen vertreten sein sollten.
Warum Sie ein Data Science Team brauchen
Künstliche Intelligenz in Unternehmen einzuführen ist ein komplexer Prozess, der nach Expertenwissen verlangt. Schließlich fließen Fähigkeiten aus den Bereichen Mathematik und Informatik zusammen und es entstehen Aufgabenfelder mit verschiedenen Ansprüchen. Ein Data Science Team hat die Aufgabe, diesen verschiedenen Anforderungen gerecht zu werden, muss dabei über gute kommunikative Fähigkeiten besitzen und die benötigten Expertisen mitbringen. Das Team ist die zentrale Steuerung und Ausführung aller AI-Anwendungsfälle und obligatorisch für den Erfolg dieser.
Sehen wir uns nun an, welche Mitglieder ein gutes Data Science Team benötigt.
Welche Mitglieder benötigt ein gutes Data Science Team?
Die Umsetzung und Durchführung unterschiedlicher Data Science Projekte ist kein Kinderspiel und setzt eine gute Zusammenarbeit unterschiedlicher Rollen voraus. Damit diese Zusammenarbeit gelingt, ist es wichtig, alle Bereiche abzudecken, in denen Fachwissen benötigt wird. In der Praxis kommt es jedoch oftmals vor, dass mehrere Bereiche von einer Person übernommen werden aber wir gehen auf die Personen im Einzelnen ein.
Data Scientist
Eine der wesentlichen Aufgaben eines Data Scientist liegt darin, in ständigem Austausch mit Fachabteilungen zu stehen und auch mit dem Management zusammenzuarbeiten. Dabei geht es vor allem darum, dass Bedürfnisse erkannt und anschließend abstrahiert sowie innerhalb der unternehmerischen Praxis umgesetzt und implementiert werden.
Dadurch ist der Data Scientist weitestgehend für eine durchdachte Analysestrategie verantwortlich, bei der es primär um
- die Auswahl einer passenden Methodik,
- die Umsetzung der eigentlichen Analyse
- sowie die Interpretation und Visualisierung der Ergebnisse geht.
Zudem muss ein Data Scientist erkennen können, welchen Nutzen man aus den vorliegenden Daten ziehen kann und welche Anwendungsmöglichkeiten überhaupt für das Unternehmen sinnvoll sind. Dazu sind vor allem Fachkenntnisse nötig, wie über den Umgang mit Daten, bei dem es hauptsächlich um die Extraktion, Bereinigung sowie Zusammenführung und Aufbereitung geht.
Neben einer Reihe hochanspruchsvoller Fachkenntnisse sind einige Soft-Skills ebenfalls von Vorteil. Dazu gehören unter anderem, dass Präsentations- und Kommunikationsfähigkeiten ein Mindestmaß mit sich bringen, um beispielsweise Ergebnisse aussagekräftig präsentieren zu können und vor allem für Mitarbeiter anderer Bereiche verständlich darzustellen, sodass diese ebenfalls den Nutzen verschiedener Anwendungen verstehen.
- Technische Fähigkeiten: Kenntnisse über Datenverarbeitung; Grundlagen der Programmierung; Verständnis von Datenbanken, Datenformaten und Cloud-Architekturen
- Persönliche Kompetenzen: Analytisches Denken; Kommunikative Fähigkeiten; Koordinationsvermögen
- Typische Aufgaben: Datenanalyse
Data Engineer
In der Anfangsphase eines Projekts hat der Data Engineer die Aufgabe, sämtliche Daten aus unterschiedlichen Quellen zusammenzuführen und diese im Anschluss aufzubereiten sowie für darauffolgende Schritte zur Verfügung zu stellen. Sie stellen quasi das Fundament dar für Tätigkeiten wie Big Data Analysen. Neigt sich ein Projekt dem Ende zu, so sind Data Engineers vor allem daran beteiligt, dass eine erfolgreiche Implementierung der Ergebnisse in das operative Geschäft erfolgt.
Vergleicht man einen Data Engineer mit einem Data Scientist, so hat der Data Engineer einen eher technischen Schwerpunkt in seiner Arbeit. Das bedeutet, dass er vor allem für die Erstellung von Schnittstellen zu relevanten Systemen in der Schlussphase eines Projekts zuständig ist. Dazu zählen insbesondere Tätigkeiten, die mit dem Umgang von Datenbanken, Data Warehousing Tools sowie Cloud-Systemen zu tun haben.
- Technische Fähigkeiten: Wissen zur Umsetzung des Datenprozesses; Kenntnisse in Programmierung
- Persönliche Kompetenzen: starke zwischenmenschliche Kommunikation
- Typische Aufgaben:
- Management von Datenbanken
- Aufbau und Pflege von Datenpipelines
- Automatisierung von Datentransfer- und Datentransformationsprozessen
- Aufbau und Betreuung einer Cloud-Infrastruktur
Machine Learning Engineer
Der Machine Learning Engineer hat seine Fähigkeiten in den Bereichen Mathematik, Programmierung, Statistik und Computerwissenschaften. Sie gelten vorwiegend als Experten in den Bereichen Prozessautomatisierung und Datenverarbeitung. Ähnlich wie der Data Engineer hat er die Aufgabe, bei der konkreten Entwicklung und Implementierung von Künstlicher Intelligenz in der Praxis mitzuhelfen.
Dazu gehören vor allem Aufgaben wie
- die Aufbereitung großer Datenmengen,
- Anpassung verschiedener Machine-Learning Modelle
- sowie die Analyse von Datenstrukturen und zugehörigen Programmierkenntnissen.
Neben all dem technischen Wissen ist es dennoch nützlich, dass ein Machine Learning Engineer ebenfalls Soft-Skills, wie eine Eigenverantwortlichkeit, Pünktlichkeit und Teamfähigkeit mitbringt.
- Technische Fähigkeiten: Gute Programmierkenntnisse; Kenntnisse im Bereich Informatik und Mathematik
- Persönliche Kompetenzen: Eigenverantwortliches Arbeiten; Logisches Denken; Präzision
- Typische Aufgaben:
- Aufbereitung großer Datenmengen
- Verbesserung von ML-Modellen
- Aufbau und Analyse von Datenstrukturen
DevOps Engineer
Ein DevOps Engineer setzt sich sozusagen aus den beiden Bereichen Development (Entwicklung) und Operations (IT-Betrieb) zusammen. Deshalb kennt sich der DevOps Engineer sowohl in der Entwicklung als auch der Administration sämtlicher Aufgaben bezüglich eines Data Science Projekts aus.
Der Grund für die Zusammenführung beider Bereiche ist, dass Unklarheiten sowie schlecht koordinierte Aufgaben und Verspätungen vermieden werden sollen. Es ergeben sich folgende Vorteile:
- Beschleunigung der Projektentwicklung
- Steigerung der Flexibilität
- Effiziente Zusammenarbeit
- Optimierung von Informationsflüssen
Zu den Kernaufgaben eines DevOps Engineer gehören Administrationstätigkeiten und technische Aufgaben wie das Monitoring, Programmieren oder die Erstellung von Skripten.
- Technische Fähigkeiten: Development und Administration
- Persönliche Kompetenzen: Kommunikationsfähigkeiten; Gute Koordinationsfähigkeiten
- Typische Aufgaben:
- Ausführung administrativer Tätigkeiten
- Monitoring
- Programmierung
- Fehlerbehebungen
- Erstellung von Skripten und Tools zur agilen Entwicklung
- Programmierung von Skripten zur Automatisierung von Monitoring, Code-Analysen oder Build- und Release-Prozessen entlang einer CI/CD-Pipeline
Domänenexperte
Neben dem technischen Verständnis eines Projekts ist das Verständnis über die Herausforderungen des Unternehmens sowie übergreifendem Branchenwissen ein wichtiger Bestandteil zur Umsetzung eines Projekts. Domänenexperten sind befähigt, Einschätzungen bestimmter Gebiete und Branchen abzugeben und kennen sich in spezifischen Themen extrem gut aus. Es handelt sich dabei um Fachexperten wie Marketing-Manager, Supply-Chain-Manager oder aber Personen völlig anderer Bereiche, wie Ingenieure.
Benötigen Sie Unterstützung?
Gerne helfen wir Ihnen bei den ersten Schritten zur eigenen Datenplattform oder begleiten Sie auf Ihrem Weg zur Data Driven Company.
Es geht also darum, jemanden im Team zu haben, der über gute Fachkenntnisse zu einem Themengebiet verfügt. Zudem sollte dieser in ständigem Austausch mit den technischen Experten wie beispielsweise dem Data Engineer stehen. Vor alle in der Anfangsphase eines Projekts, in der es um die richtige Einordnung sowie Identifizierung des Geschäftsproblems geht, ist es schwierig, auf einen Domänenexperten zu verzichten.
Chief Analytics Officer
Der Chief Analytics Officer ist nicht in jedem Unternehmen vorzufinden und ist daher seltener vertreten als andere zuvor vorgestellte Positionen. Dennoch ist ein Chief Analytics Officer nicht zu vernachlässigen. Zu seinen Hauptaufgaben gehört der verantwortungsbewusste Umgang mit Daten innerhalb des Unternehmens. Um dies zu gewährleisten, sind jedoch Kenntnisse über statistische Analysen, Marketing, Finanzen sowie betriebswirtschaftlichem Fachwissen nötig.
Zudem hat der Chief Analytics Officer die wichtige Aufgabe, Personal für weitere Data Science Projekte zu rekrutieren und somit für eine ständige Bereitschaft von geschultem Personal in diesem Bereich zu sorgen.
Aufgaben und Expertise im Überblick
Position | Aufgaben | Kenntnisse | Bedeutung |
Data Scientist | Auswahl einer Analysestrategie mit passenden statistischen Modellen, Visualisierung der Ergebnisse | Mathematische, statistische Modelle, Fähigkeiten der Informatik | Kommunikation zwischen Fachabteilungen, Bedürfnisse erkennen und umsetzen |
Data Engineer | Sammlung, Aufbereitung und Analyse von Daten | Umgang mit Datenbanken, Data Warehousing-Tools und Cloud-Systemen | Technischer Experte im Team, Implementierung der Ergebnisse ins operative Geschäft |
Machine Learning Engineer | Anpassung von Machine Learning Modellen, Analyse großer Datenmengen | Mathematik, Computerwissenschaften, Programmierung und Statistik | Experte im Bereich Prozessautomatisierung und Datenverarbeitung |
DevOps Engineer | Monitoring, Programmierung, Erstellung von Skripten | Administrative und softwarebasierte Aufgaben | Zusammenführung zwischen Entwicklern und dem IT-Betrieb |
Domänenexperte | Branchenwissen, Einschätzung bestimmter Fragestellungen | Fachkenntnisse des jeweiligen Gebiets (Marketing Manager, Ingenieur, Maschinenbau etc.) | Ständiger Austausch mit technischen Experten zur Entwicklung einer Strategie |
Chief Analytics Officer | Umgang mit Daten in einem Unternehmen, Personalrekrutierung | Statistische Analysen, Marketing, Finanzen und betriebswirtschaftliche Kenntnisse | Bereitstellung und Rekrutierung von geschultem Personal |
Welche Herausforderungen bestehen bei der Zusammenstellung eines Data Science Teams?
Die Wahl und der Aufbau eines guten Data Science Teams ist eine spannende Herausforderung. Es gestaltet sich oftmals als ein kontinuierlicher Prozess, welcher nicht von heute auf morgen umgesetzt werden kann. Doch unter Berücksichtigung der möglichen Herausforderungen rückt ein Unternehmen dem Aufbau eines Data Science Teams ein gutes Stück näher.
Im Folgenden möchte ich Ihnen bestimmte Bereiche vorstellen, in denen in der Praxis oftmals zu Schwierigkeiten entstehen können. Es ist deshalb wichtig, diese Bereiche im Vorhinein zu überprüfen, um eine reibungslose Zusammenstellung eines Data Science Teams zu gewährleisten.
Auswahl wichtiger Aufgaben
In Unternehmen kommt es häufig vor, dass ein Data Scientist oder das gesamte Team ständig mit Fragestellungen und Anfragen des Unternehmens aufgehalten wird. Sind diese jedoch nicht auf das vorliegende Projekt bezogen, so kann dies das Team in seiner Arbeit stören und Zeit in Anspruch nehmen. Es macht daher Sinn, eine Art Prioritätenliste von Aufgaben zu erstellen und zur gewährleisten, dass wichtige Prozesse und projektspezifische Aufgaben Priorität haben.
Modelle und Tools
Bei der Umsetzung eines guten Data Science Projekts spielen die genutzten Modelle und Tools selbstverständlich eine wichtige Rolle. Die im Vorfeld erstelle Aufgaben- und Prioritätenliste bietet das Fundament, um zu schauen, welche Tools Sinn machen und welche Aufgaben diese umsetzen können. Dabei gibt es Funktionen, die fundamental sind und von einer Software umgesetzt werden sollten, wie beispielsweise die Ausführung von Skripten, Automatisierung von Abfragen sowie die Datenverarbeitung. Die Wahl der richtigen Tools fördert auf lange Sicht die Produktivität und Zufriedenheit der Data Science Teammitglieder erheblich.
Qualität der Daten
Neben der Wahl passender Tools und Modelle ist die Qualität der Daten ein weiterer wichtiger Aspekt, um langfristig ein produktives und qualitativ hochwertiges Projekt umzusetzen. Doch bevor die Qualität der Daten eine Rolle spielt, ist es zunächst wichtig, dass überhaupt genügend Daten zur Auswahl stehen. Daten bilden das Fundament, um Modelle auf Basis von maschinellem Lernen zu entwickeln und daraus Erkenntnisse sowie ein Nutzen generieren zu können.
Aufbau des Teams
Zu Beginn eines Projekts ist es oftmals so, dass die Größe des Teams beziehungsweise die entsprechenden Fachkenntnisse und Fähigkeiten überschaubar sind. Mit der Zeit wachsen die Ansprüche sowie die Komplexität eines Projekts jedoch. Dies erfordert, sich mit der Wahl von richtigem Personal sowie dem Ausbau und Aufbau eines guten Data Science Teams zu beschäftigen. Vordergründig ist dabei, dass die essenziellen Aufgaben sorgfältig abgedeckt sind. Dazu zählen, dass genügend Personal für die Entwicklung, Implementierung und Wartung der Modelle zur Verfügung stehen. Wie bereits beschrieben ist es unter anderem die Aufgabe des Chief Analytics Officer, genügend und geschultes Personal zu rekrutieren und für Data Science Projekte bereitzustellen.
Prozessoptimierung
Die Vorhersage von genauen Terminen ist in Data Science Projekten oftmals schwierig. Dies liegt unter anderem daran, dass solche Projekte mit einer Vielzahl unterschiedlicher Aktivitäten gleichzeitig beginnen. Es kann also passieren, dass gewisse Aktivitäten längere Zeit benötigen als andere. Das führt dazu, dass ein zuvor geplanter Prozess nicht exakt eingehalten werden kann. Es ist deshalb gut, einen passenden Ansatz zu wählen. Dieser sollte einerseits gewisse Richtlinien vorgeben und andererseits eine Flexibilität in der Arbeitsweise zulassen und für das Team passend sein.
Fazit
Um Data-Science Projekte erfolgreich umzusetzen, benötigt es unterschiedliche Teammitglieder, die jeweils ihre eigenen Stärken haben. Während ein Data Engineer technisches Wissen mitbringt, hat der Domänenexperte seine Stärke in der Identifikation des Geschäftsproblems. Zudem beschäftigt er sich mit der Einordnung potenzieller Anwendungen. Neben den einzelnen Mitgliedern eines Data Science Teams ist es jedoch ebenfalls wichtig, dass eine agile Arbeitsweise herrscht. Zudem sollte eine enge Zusammenarbeit mit ständigem Austausch stattfinden.
Wir begleiten Sie bei der Umsetzung Ihrer Data Science Projekte und das von Anfang an. Erfahren Sie hier mehr.
FAQ – Die wichtigsten Fragen schnell beantwortet
Wichtige Rollen sind Data Scientist, Data Engineer, Machine Learning Engineer, DevOps Engineer, Domänenexperte und Chief Analytics Officer.
Da verschiedene Fachbereiche und Fähigkeiten aufeinandertreffen ist eine gute Kommunikation und Koordination von besonderer Bedeutung. Außerdem müssen Aufgaben definiert und zugeteilt werden, Berechtigungen vergeben und Zuständigkeiten definiert werden.
Neben guten zwischenmenschlichen Fähigkeiten in Punkten Kommunikation und Koordination sind technische Fähigkeiten essenziell. Die Expertise einzelner Teammitglieder hinsichtlich Datenverarbeitung, IT und Branchenwissen sind obligatorisch.
Ihr Ansprechpartner
Ob und wie künstliche Intelligenz Ihnen weiterhelfen kann, können Sie in einem ersten, unverbindlichen Gespräch mit uns herausfinden.
In diesem Gespräch erfahren Sie:
- Wie Ihr Use-Case technisch am besten umgesetzt werden kann
- Wie wir maximal sicher mit Ihren Kundendaten umgehen
- Wie lange wir für die Umsetzung benötigen und wie ein konkreter Projektplan aussehen könnte