Definition: Was sind Daten?
Daten sind die digitale Entsprechung eines realen Phänomens. Vor der Verbreitung digitaler Technologien verstand man unter Daten Informationen und Werten, die zahlenmäßig erfasst und gemessen werden konnten.
In der Informatik werden Daten als kodierte Informationen verwendet – sie werden im Binärcode als Zahlen „0“ oder „1“ erfasst. Um diese Daten wieder zu entschlüsseln (decodieren), werden Standards verwendet. Dies sind zum Beispiel Dateiformate wie PDF oder JPEG. Die Daten liegen in drei Formen vor und können wie folgt unterschieden werden
- Strukturierte Daten
- Semi-strukturierte Daten
- Unstrukturierte Daten
Welche unterschiedliche Arten gibt es?
Es gibt unterschiedliche Arten von Daten. Dies betrifft vor allem die Struktur, in der sich die Daten befinden. Im folgenden gehe ich auf die drei unterschiedlichen Arten von Daten ein:
1. Was sind Strukturierte Daten?
Diese Informationen liegen in einem vorgegebenen Format vor – tabellarisch. In einer relationalen Datenbank stehen sie in eindeutigen Beziehungen zueinander. Dies macht es einfach, spezifische Daten zu finden und zu verarbeiten. Strukturierte Daten liegen häufig in Tabellenform vor. Sie bieten bei einer systematischen Datenverarbeitung, dem maschinellen Lernen, viele Vorteile.
Beispiele für Strukturierte Datenformate sind:
- CSV,
- Tabellen,
- Excel
2. Was sind Semi-strukturierte Daten?
Bei semi-strukturierten Daten ist die Struktur nicht offensichtlich, sondern versteckt. Derartige Strukturen werden als implizit, partiell oder irregulär bezeichnet. Es ergeben sich semi-strukturierte Datensätze beim Zusammenfügen von unterschiedlichen Objekten in einem Software-Programm. Ein bestimmter Grad an Strukturiertheit ist vorhanden, die Dateninhalte sind jedoch größtenteils unbekannt.
Beispiele für Semistrukturierte Datenformate sind:
- XML oder
- JSON.
3. Was sind unstrukturierte Daten?
Bei dieser Art von Daten ist keinerlei Struktur vorhanden, sodass die Speicherung in einer SQL-Datenbank unmöglich ist. Um Informationen zu gewinnen und somit den Wert der Daten zu extrahieren, ist vorher eine Aufbereitung oder Strukturierung nötig. Der Inhalt ist vor dieser Datenanalyse völlig unbekannt.
Beispiele für Unstrukturierte Daten sind:
- Text,
- Audio,
- Bilder
- oder Video.
Die meisten Daten in einem Unternehmen sind unstrukturiert: Textdaten von E-Mails, Beiträge in Foren oder Social Media sowie Kundenbewertungen. Auch Video- und Bilddaten gehören in diese Kategorie. Da die Informationen, die in unstrukturierten Daten stecken, für Unternehmen extrem interessant sind, benötigen sie eine entsprechende Technologie für die Analyse.
Wie sollten Unternehmen Daten sammeln und aufbewahren?
Daten sind wertvoll. Firmen, die dies erkannt haben, erreichen gegenüber der Konkurrenz Wettbewerbsvorteile. Das funktioniert allerdings nur, wenn vorher relevante Daten gesammelt und dann mit moderner Analyse Informationen generiert werden. Die Digitalisierung wird dazu führen, dass Daten neue Einnahmequellen eröffnen und Firmen völlig neue Geschäftsmodelle entwickeln.
Beim Sammeln und Verarbeiten ist der Datenschutz zu beachten. Denn mit der digitalen Transformation wächst das Bewusstsein für eine Benutzerkontrolle und den Schutz persönlicher Informationen. Aus diesem Grund verwenden viele Firmen Datensilos. Dies sind separate Systeme, die jeweils definierten Nutzerkreisen zur Verfügung gestellt sind. Außerdem speichern diese Systeme Daten, die nicht an externe Nutzer freigegeben werden sollen. Datensilos sind jedoch für Firmen, die viel mit Analysen unstrukturierter Daten arbeiten, wenig sinnvoll.
Zwei Vorgehensweisen haben sich für die Aufbewahrung von Daten bewährt: das Data Warehouse und der Data Lake. Der Data Lake speichert alle Informationen in Rohform. Dieses Verfahren ist perfekt für das Speichern unstrukturierter Daten. Ein Katalog bringt Ordnung in die Massendaten. Dafür werden die Informationen systematisch und einheitlich dokumentiert. Der Datenkatalog ist ein zentrales Register, das das gesamte Spektrum an Daten erfasst und Informationen zu den Quellen sammelt. Der Datenkatalog enthält folgende Informationen für Ihre Mitarbeiter:
- physische Lokation der Daten
- Zugriffsrechte
- Verwertungshistorie
- Datenqualität
- Dateninhalt
Big Data als Paradigmenwechsel
Das alleinige Sammeln von Massendaten bietet den Firmen keinen Mehrwert. Erst durch die Nutzung von Advanced Data Analytics und Machine Learning werden aus Daten wertvolle Informationen. Die Aussagekraft des Begriffs Big Data ist begrenzt. Selbstverständlich fallen durch die Digitalisierung massenweise Daten an, doch diese sind zumeist unstrukturiert und somit in Reinform völlig wertlos.
Damit Ihr Unternehmen diese Daten zu Informationen transformieren kann, benötigen Sie eine Big Data Technologie, Hardware und Deep Learning, die die Muster in den Datensätzen erkennt. Es ist nicht möglich, mit Excel-basierten Tools Milliarden unstrukturierter Datensätze zu analysieren.
Dafür benötigen Sie komplexe Analyse-Tools und Hardware-Plattformen. Letztlich wird die Fähigkeit, unstrukturierte Massendaten richtig zu verarbeiten und daraus maximale Informationen zu extrahieren, über den Erfolg und Misserfolg von Unternehmen entscheiden.
Welchen Wert haben Daten für Unternehmen?
Experten prognostizieren, dass Unternehmen in Zukunft im Hinblick auf ihr Datenportfolio bewertet werden. Daten gehören zu den immateriellen Vermögenswerten. Noch ist die Aktivierung von Daten nicht möglich, perspektivisch wird sich das jedoch mit Sicherheit ändern. Zurzeit herrscht das Phänomen vor, dass der Buchwert von Firmen sich teilweise erheblich vom Marktwert unterscheidet.
Das ist vor allem für Technologieunternehmen ein Problem, wenn diese beim Gang an die Börse nicht adäquat bewertet sind.
Das Daten einen enormen Wert haben, zeigt auch, dass Amazon einen Dienst veröffentlicht hat, wo jedes Unternehmen seine Daten verkaufen kann. Bei Amazon Data Exchange kann man z.B. tagesaktuelle Besucherdaten von allen US-amerikanischen McDonald’s-Filialen kaufen: Preis 90.000 US-Dollar jährlich.
Wie wertvoll sind Kundendaten?
Der Wert von Kundendaten wird sehr unterschiedlich bestimmt. Bei großen Unternehmen, die an der Börse gehandelt werden, kann man den Wert der Frima als Maßzahl nehmen. Für kleinere Firmen ist dies etwas schwerer zu bestimmten.
Aber ist der Wert in Euro überhaupt so wichtig? Aus meiner Sicht ist es wichtig, dass Sie was mit Ihren Daten machen, um Ihre Prozesse zu optimieren, Kunden gezielter anzusprechen und so Ihr Geschäft verbessern.
Denn der Wert von Ihren Daten resultiert daraus, dass Sie Ihre Informationen zur Verbesserung der Entscheidungsqualität nutzen. Bessere Entscheidungen führen zu Wettbewerbsvorteilen, der Gewinnung von Neukunden und der Erzielung größerer Umsätze und Gewinne. Dennoch lässt sich der Wert noch nicht quantifizieren, obwohl sie ein wichtiges Asset Ihrer Firma sind.
Informationen wie Sie Ihre Daten im Marketing und Vertrieb gezielt einsetzen können, finden Sie hier: Anwendungsbeispiele für Künstliche Intelligenz im Marketing.
Wie schaffen Daten einen Mehrwert?
Damit Sie aus den Daten einen Mehrwert generieren, müssen einige Voraussetzungen erfüllt sein:
- Die Daten müssen verfügbar sein und in einer ausreichenden Datenqualität vorliegen.
- Entsprechende analytische Infrastruktur für die Analyse der Daten
- Innerhalb der Firma sollten die Verantwortlichkeiten geklärt sein (Data Roles: Data Engineer & Data Scientist).
- Genügend gut ausgebildete Mitarbeiter oder Berater
- Ideen und Möglichkeiten KI-Anwendungsfälle umzusetzen
- Selbstverständlich sind rechtliche Aspekte wie die DSGVO zu beachten.
Doch selbst, wenn all diese Voraussetzungen stimmen, hängt der mögliche Wert der Daten letztlich davon ab, ob in Ihrer Firma ein Daten-Know-how vorhanden ist.
Benötigen Sie Unterstützung?
Daten sorgen für Mehrwert, wenn sie richtig verwendet und verarbeitet werden. Wir unterstützen Sie von Beginn an bei Ihrer Datenverarbeitung.