Was ist Data Science? Definition, Tätigkeiten eines Data Scientist und Beispiele

Data Science (Datenwissenschaft) ist eine interdisziplinäre Wissenschaft, die sich mit der Gewinnung von Wissen aus Daten befasst. Die Datenwissenschaft generiert Informationen aus großen Datenmengen, um daraus Handlungsempfehlungen für das Unternehmensmanagement abzuleiten. Ziel dieser Handlungsempfehlungen ist die Verbesserung der Qualität unternehmerischer Entscheidungen und der Effizienz von Arbeitsabläufen.

  1. Data Science Definition – Was ist Data Science?
  2. Was sind die Tätigkeiten eines Data Scientist?
  3. Welche Studiengänge für Data Science gibt es?
  4. Was verdient ein Data Scientist?

Data Science Definition – Was ist Data Science?

Data Science ist die Schnittmenge zwischen den Wissenschaftsbereichen Mathematik, Informatik sowie dem branchenspezifischen Fachwissen. Der Bereich Data Science befasst sich mit der Analyse von (großen) Datenmengen, der Erkennung von Anomalien in den Daten sowie mit der Vorhersage von zukünftigen Ereignissen. Im Arbeitsbereich Datenwissenschaft arbeitende Personen werden als Datenwissenschaftler oder Data Scientist bezeichnet

Data Science ist die Schnittmenge zwischen den Wissenschaftsbereichen Mathematik, Informatik sowie dem branchenspezifischen Fachwissen.
Data Science ist die Schnittmenge zwischen den Wissenschaftsbereichen Mathematik, Informatik sowie dem branchenspezifischen Fachwissen.

Erstmals wurde der Begriff „Data Science“ im Jahr 1960 durch den dänischen Informatik-Pionier Peter Naur als Synonym für „Informatik“ verwendet. 2001 begründete der US-amerikanische Computerwissenschaftler William S. Cleveland die Datenwissenschaft als eigenständige Fachdisziplin. Cleveland benannte als Fachgebiete von Data-Science: Daten-Modelle und Daten-Methodik, Rechenoperationen mit Daten, die Bewertung von Werkzeugen, Pädagogik, Theorie und multidisziplinäre Untersuchungen. 

Heute wird die Data Science Definition deutlich weiter gefasst als noch vor fünfzig Jahren: die Datenwissenschaft befindet sich im Schnittpunkt zwischen den Wissenschaftsbereichen Mathematik (insbesondere Stochastik) und Informatik sowie dem branchenspezifischen Fachwissen

In diesem Video erkläre ich, was Data Science ist und welche Fähigkeiten ein Datenwissenschaftler braucht.

In welchen Bereichen wird Data Science angewandt?

Data Science wird in vielen verschiedenen Bereichen in Unternehmen und Forschung angewandt. Für folgende Bereiche wird Data Science eingesetzt: 

  • Explorative Datenanalyse: Analyse sowie Auswertung vorliegender Daten zur Stützung von Hypothesen. 
  • Vorhersage von Wahrscheinlichkeiten: Kauf- oder Kündigungswahrscheinlichkeiten lassen sich dank Data Science und zugehörigen Verfahren berechnen und vorhersagen 
  • Vorhersage von numerischen Werten: Durch historische Berechnungen ist es möglich, zukünftige Vorhersagen, wie beispielsweise zukünftigen Stromverbrauch oder Umsätze zu treffen. 
  • Erkennung von Anomalien: Data Science bietet die Möglichkeiten Unregelmäßigkeiten und Anomalien in den Daten zu identifzieren.  
  • Analyse von Text und Sprache: Natural Language Processing (NLP) ist eine Möglichkeit, vorhandene Texte sowie gesprochener Sprache auszuwerten  
  • Analyse von Bildern und Videos: Bildererkennung, Klassifikation, usw. 
  • Erkennen von Zusammenhängen und Gruppen: Innerhalb riesiger Datenmengen (Big Data) ist es eine der Aufgaben von Data Science, Zusammenhänge sowie Gruppen innerhalb jeweiliger Datenmengen zu erkennen. 

Branchen-Beispiele für den Einsatz von Datenwissenschaften  

Große Datenmengen werden heute mit den Instrumenten und Methoden der Data-Science für Unternehmen aller Branchen ausgewertet.  

  • Marketing: Vor allem zur Personalisierung im Marketing findet Data Science hinsichtlich der Auswertung von Daten große Anwendung. Dabei werden Vorlieben sowie das Verhalten analysiert, sodass sich Handlungsempfehlungen für das Marketing ableiten lassen. 
  • (IT)-Security: Data Science wird zunehmend zur Überwachung von IT-Systemen eingesetzt. Kritische IT-Systeme werden dabei mithilfe von Security Information and Event Management (SIEM) geschützt. 
  • Mobilität: Im Bereich der Mobilität wird autonomes Fahren dank Data Science und maschinellem Lernen weiter vorangetrieben. Dazu werden vorwiegend Sensordaten ausgewertet, um genaue Informationen des Fahrzeugs sowie der Umgebung zu generieren. 
  • Retail- und Handelsunternehmen profitieren von Data-Science durch Analysen des Kaufverhaltens von Kunden. Die Untersuchung möglicher Ursachen für Retouren hilft bei der Verringerung von Warenrücksendungen.  
  • In der Gesundheitsbranche (Medizin und Pharmazie) ermöglicht Data Science die Erstellung von Ähnlichkeitsanalysen als Grundlage für eine individualisierte Behandlung von Patienten und die Optimierung der Medikation. 
  • Logistikunternehmen verbessern mithilfe von Data Science ihre Arbeitsprozesse und die Qualität ihrer Transport-Dienstleistungen. 
  • Industriebetriebe steuern und optimieren Fertigungsabläufe unter Einsatz von Data Science. 
  • Versicherungen und Banken schöpfen mithilfe von Data-Science das Potenzial der ihnen zur Verfügung stehenden externen und internen Daten aus, um ihre Produkte zu verbessern und die Vertriebserfolge zu steigern. 
Tipps für erfolgreiche Data Science Projekte!

Wo wird Data Science in der Praxis angewandt? 

Im Alltag begegnet uns künstliche Intelligenz schon in unterschiedlichsten Bereichen. Dazu gehören:

  • Virtuelle Assistenten: Die Benutzung von mobilen Endgeräten wird dank sprachgesteuerten Assistenten wie Alexa (Amazon), Siri (Apple) und Google Assistant Tag für Tag einfacher. Diese Systeme arbeiten größtenteils auf Basis von Natural Language Processing-Systemen, welche menschliche Sprache verstehen und verarbeiten. 
  • Chatbots: Routineaufgaben innerhalb von Kundenserviceabteilungen lassen sich dank Chatbots zum Großteil reduzieren. Diese gewonnene Zeit lässt sich von jeweiligen Mitarbeitern für weitere Aufgaben wie beispielsweise eine individuelle Kundenbetreuung nutzen.  
  • Empfehlungssysteme: Je nach persönlichem Geschmack, gewähren Empfehlungssysteme dem Kunden eine unterschiedliche Auswahl, die den Vorlieben des Kunden entsprechen.  
  • Customer Relationship Management: Künstliche Intelligenz eignet sich im CRM hervorragend, um vorliegendes Marketingbudget effizient an prognostizierten Kundenwerten und Produktaffinitäten zu verteilen 
  • Gesichtserkennung: Im Bereich der Bilderkennung ist es dank künstlicher Intelligenz möglich, innerhalb von sozialen Netzwerken, Gesichter zu erkennen und diese auf Bildern zu markieren. 
  • Betrugserkennung: Im Rahmen der Kriminalitätsbekämpfung wird künstliche Intelligenz derweilen von Finanzdienstleistern, Bank und weiteren Unternehmensbrachen zur Betrugserkennung genutzt.  
  • E-Commerce: Erhebliche Kundenbindungsmaßnahmen sowie Umsatzsteigerungen sind dank künstlicher Intelligenz im E-Commerce möglich. Dazu errechnet die künstliche Intelligenz mögliche Produktempfehlungen (Beispiel: Amazon) und schlägt diese potentiellen Kunden vor. 
  • Autonomes Fahren: Das Einhalten des Sicherheitsabstands, Einparken oder Einhalten der Fahrspur ist dank intelligenter Systeme schon derzeit möglich. Doch dies ist erst der Anfang. Vorreiter und Weltkonzern Tesla hat es sich zur Aufgabe gemacht, vollautonome Fahrzeuge auf den Markt zu bringen. 
  • Supermarkt: Im Bereich des Lebensmitteleinzelhandels ist Amazon Go eines der bekanntesten Beispiele. Dank Amazon Go soll die Effizienz sowie das Kundenerlebnis während eines Einkaufs drastisch gesteigert werden.  

Was sind die Tätigkeiten eines Data Scientist?

Die nationale Forschungsgemeinschaft der US-Regierung wies 2005 auf die entscheidende Bedeutung der Data Scientists für das Management digitaler Daten hin. Zu den Datenwissenschaftlern zählen insbesondere Informatiker, Programmierer, Datenbank-Experten, Domain-Spezialisten, Archivare und Bibliothekare und sogar Fachleute der Softwareentwicklung.

Welche Fachkenntnisse braucht ein Data Scientist?

Ein Data Scientist muss über ein breites Spektrum von Fachkenntnissen verfügen, um seine analytischen, beratenden und koordinierenden Aufgaben an der Schnittstelle zwischen Datenbanken, Mitarbeitern und Management eines Unternehmens erfüllen zu können:

  • Mathematische und stochastische Modelle und Methoden bilden die Grundlage für die Analyse und Interpretation von Daten. Von großer Bedeutung sind insbesondere eine gute analytische Fähigkeit, die es ermöglicht Informationen aus Daten zu extrahieren.
  • Im Zeitalter großer Datenmengen („Big Data“) ist Datenwissenschaft ohne fundierte Kenntnisse über Datenverarbeitung und ihre Instrumente kaum vorstellbar. Die Computer-Wissenschaft (Informatik) unterstützt die Big-Data-Analyse durch Algorithmen, die für eine effiziente Bearbeitung der jeweiligen Datentypen geeignet sind. Analyse-Tools selektieren aus strukturierten oder unstrukturierten Datenmengen die benötigten wertvollen Informationen.
  • Spezifische Branchen-Kenntnisse sind unerlässlich, um Daten und Geschäftsprozesse eines bestimmten Unternehmens einordnen und analysieren sowie sinnvolle Handlungsempfehlungen entwickeln zu können. Betriebswirtschaftliches Wissen ist von grundlegender Bedeutung, wenn Datenanalysen zwecks Geschäftsoptimierung durchgeführt werden sollen.

Welche persönlichen Qualifikationen braucht ein Data Scientist?

Die Ausübung von Data Scientist Tätigkeiten setzt zudem einige besonders ausgeprägte persönliche Qualifikationen voraus:

  • sprachliche und kommunikative Fähigkeiten, um einerseits Branchenexperten zu verstehen und andererseits Mitarbeitern aller Unternehmensbereiche, die aus der Datenanalyse abgeleiteten Handlungsempfehlungen überzeugend vermitteln zu können
  • Kreativität bei der flexiblen Anpassung analytischer Methoden an neue Herausforderungen und Kontexte
  • Aufgeschlossenheit bei der Erforschung und Nutzung neuer Analyse-Instrumente und Data-Science-Verfahren sowie
  • Koordinationsvermögen sowohl hinsichtlich der Delegation von Aufgaben zur Datenbeschaffung als auch bei der Steuerung und Kontrolle von Data-Science-Projekten.
Im Data Science sind vor allem kommunkative Fähigkeiten wichtig.
Im Data Science sind vor allem kommunikative Fähigkeiten wichtig.

Am Arbeitsmarkt übersteigt derzeit die Nachfrage nach Data Scientists die Anzahl der verfügbaren ausgebildeten Datenwissenschaftler. Zwar liegen weltweit zunehmend umfangreiche Datenbestände vor, doch können diese aufgrund der nicht ausreichenden Verfügbarkeit von Datenwissenschaftlern nicht vollständig analysiert werden.

Welche Studiengänge für Data Science gibt es?

Entsprechend der im Digitalzeitalter erheblichen Bedeutung von Daten bieten in Deutschland etliche Fachhochschulen und Universitäten Data-Science-Studiengänge an. Als Studienabschlüsse kommen Bachelor of Science (B. Sc.) oder Bachelor of Engineering (B. Eng.) sowie Master of Science (M. Sc.) oder Master of Engineering (M. Eng.) in Betracht.

Da sich das Berufsbild des Data Scientists entsprechend den fortlaufend verändernden Anforderungen der Wirtschaft entwickelt hat, zeichnen sich die Data-Science-Studiengänge durch ihren hohen Praxisbezug aus.

  • Für ein Bachelor-Studium in Datenwissenschaften ist gewöhnlich eine Regelstudiendauer von sechs Semestern vorgesehen. Zu den Studienmodulen gehören meist theoretische Informatik, Statistik, Stochastik, Informationssicherheit, Algorithmen und Datenstrukturen sowie Softwareentwicklung und Programmierung.
  • Ein sich gegebenenfalls anschließendes Master-Studium kann üblicherweise in einer Regelstudienzeit von vier Semestern absolviert werden. Ein Master-Studienabschluss qualifiziert für eine mögliche Promotion in den Fachbereichen Informatik, Mathematik oder Naturwissenschaften.

Was verdient ein Data Scientist?

Die Gehälter für einen Datenwissenschaftler sind, dank der hohen Nachfrage, in den letzten Jahren stark angestiegen. So liegt das Einstiegsgehalt eines Data Scientist über 50.000€ pro Jahr. Je nach Job (Beratung, Start-Up oder Konzern) liegt die jährliche Steigerung des Gehalts in den ersten Jahren um die 5-10%.

Laut Glassdoor.de liegt das Gehalt eines Data Scientist im Mittel bei ca. 61.154€, für einen Senior sind es ca. 78.000€. Für einen Team Lead wird deutlich mehr gezahlt, bis zu 100.000€.

Für Amerika liegen genauere Zahlen vor. Hier ist davon auszugehen, dass die Werte für Deutschland etwas darunter liegen, aber sicher einen starken Trend nach oben haben.

Table 1: Data Science Gehälter in den USA (Quelle: datajobs.com)
NameGehalt
Data Analyst – Einstiegslevel$ 50,000 – $70,000;
Data Analyst – Erfahren$65,000 – $110,000
Data Scientist$85,000 – $170,000
Analytics Manager – 1-3 Direct Reports$90,000 – $140,000
Analytics Manager – 4-9 Direct Reports$130,000 – $175,000
Analytics Manager – 10+ Direct Reports;$160,000 – $240,000
Gehalt Data Scientist nach Erfahrung.

Wenn man sieht, dass ein Data Scientist in Amerika ein Gehalt von bis zu 170.000$ hat, ist es nicht verwunderlich, dass in Europa viel investiert wird. So nutzen viele Tech-Firmen aus Amerika, Deutschland bzw. Europa als attraktiven Entwicklungsstandort. Databricks hat im Oktober 2019 bekanntgegeben, dass Sie mehr als 100Mio. € in Amsterdam in ein Enticklungszentrum investieren.

Gratis White Paper

Künstliche Intelligenz optimiert Marketing und Vertrieb

In den KI-Fallstudien erfahren Sie:

Tragen Sie sich hier in unseren Newsletter ein und erhalten Sie gratis die KI-Fallstudien:

Mit der Anmeldung stimmen Sie unserer Datenschutzerklärung zu.

Fazit Data Science

Data Science ist ein interdisziplinärer Ansatz und die Schnittmenge aus Mathematik, Informatik und branchenspezifischen Fachwissen. Aus diesem Grund sind die Anforderungen an einen Data Scientist hoch. Neben mathematischen und stochastischen Fähigkeiten, braucht ein Data Scientist auch Fähigkeiten in der Softwareentwicklung sowie spezifisches Branchenwissen. Diese Anforderungen macht er herausfordernd, die richtigen Mitarbeiter zu finden.

Die Potentiale von Data Science sind enorm, denn Data Science lässt sich fast in jedem Unternehmensbereich und Branche nutzen, um Optimierungen von Prozessen durchzuführen. Voraussetzung dafür sind die richtigen Daten und Ressourcen.

Wenn Sie Fragen zu dem Thema Data Science haben, dann melden Sie sich bei uns.

Ihr Kontakt: Laurenz Wuttke

Unternehmen sitzen auf einem ungenutzten Berg von Kundendaten. Wir von datasolut entwickeln KI, die Ihr Marketing optimiert. Damit Sie dem richtigen Kunden zur richtigen Zeit das richtige Angebot machen können.

Laurenz Wuttke

Auch interessant für Sie

White Paper

Künstliche Intelligenz optimiert Marketing und Vertrieb

Tragen Sie sich hier in unseren Newsletter ein und erhalten Sie gratis die KI-Fallstudien:

Mit der Anmeldung stimmen Sie unserer Datenschutzerklärung zu.