Was ist Microsoft Fabric? Eine Einschätzung aus der Praxis

Microsoft Fabric wurde erstmals im Mai 2023 auf der Microsoft Build Konferenz vorgestellt und ist eine umfassende Daten- und Analyseplattform. Die Plattform ermöglicht das einheitliche Speichern, Verwalten und Arbeiten an und mit Daten, gewährleistet dabei hohe Governance-Standards und vereinfacht die Datenverwaltung durch das Delta Format. In diesem Artikel geben wir Ihnen eine Einführung in Microsoft Fabric mit dem Fokus auf die Funktion, Vorteile und Anwendungsmöglichkeiten. 

In den Worten von Microsoft: „All your Data. All your Teams. All in one place. This is Microsoft Fabric.“

Lassen Sie uns starten! 

Was ist Microsoft Fabric? 

Microsoft Fabric ist eine leistungsstarke Software-as-a-Service (SaaS)-Plattform, die eine Vielzahl von Azure-Datendiensten integriert und eine einheitliche Umgebung für die Integration, Verarbeitung, Analyse und Visualisierung von Daten bietet. Fabric ist Microsofts Antwort auf den langanhaltenden Wunsch nach einem einheitlichen Ort für die Datenverarbeitung, mit einem einheitlichen Kostenmodell und einem gemeinschaftlichen Workspace. Wir bekommen mit Fabric kein neues Werkzeug zur Datenverarbeitung, sondern einen lang ersehnten Werkzeugkasten für eine Vielzahl von Personen.

Ein kurzer Ausflug in die Vergangenheit: So einen Ansatz gab es bereits vor 2-3 Jahren mit der Veröffentlichung von Synapse Analytics. Innerhalb der einzelnen Analytic-Pools, wie Data Engineering und Data Science sollte Synapse Analytics eine gemeinsame Oberfläche darstellen, mit einem zentralen Berechtigungssystem, und einem gemeinsamen Monitoring.

Bei dem Close Up zeichneten sich jedoch immer noch viele unterschiedliche Ansätze ab, zum Beispiel im Punkt Speichermechanismen oder Low-Code/ Pro-Code, sodass Kosten anders verrechnet werden mussten, Daten-Duplikation zum Problem wurden und die Datenverarbeitung eben nicht gemeinsam von statten lief. 

Mit Fabric soll sich das alles ändern: 

Die unterschiedlichen Datenservices (Azure Synapse Analytics, Azure Data Factory und Microsoft Power BI) fließen in den übergeordneten Werkzeugkasten Fabric ein. Dadurch können Data-Analysten, Data Engineers und Data Scientists einfach zusammenarbeiten und mit einem Klick zwischen Aufgaben wechseln. 

Ein Beispiel: Wir können ein Dashboard in Power BI erstellen und mit nur einem Klick zu unserer Pipeline in Data Factory wechseln. Danach wechseln wir zu Synapse, um uns um Data Engineering Aufgaben zu kümmern und so weiter.

Sehen wir uns nun die verschiedenen Komponenten von Fabric an.  

Die einzelnen Kompontenten von Microsoft Fabric 

Fabric vereint als System-as-a-Service Lösung verschiedene Dienste, die in der Azure Cloud zu einer einheitlichen Plattform für Analysen zusammengestellt wurden. Dabei handelt es sich um die Hauptkomponenten:

  1. Azure Data Factory (für die Datenintegration) 
  2. Azure Synapse Analytics (zur Datenverarbeitung und -bereitstellung) 
  3. Power BI (zur Vereinheitlichung des Tools für das gesamte Unternehmen) 
Dienste mit Azure Synapse Analytics, Azure Data Factory und Power BI.
Microsoft Fabric Bestandteile

Der wichtigste Bestandteil der Plattform ist der OneLake. OneLake ist die zentrale Adresse für all unsere Daten. Darüber liegen die Experiences, die so genannten Workloads, mit denen Sie Daten transportieren, verarbeiten, aufbereiten, usw.

Was ist der OneLake?

OneLake ist ein zentraler Datenspeicher, entwickelt von Microsoft als Teil der Fabric-Umgebung. Ziel der Entwicklung war, einen einheitlichen Ort der Datenverwaltung zu schaffen, um das Verschieben und Kopieren von Daten überflüssig zu machen. Die Daten werden im Delta Parquet-Format einheitlich im OneLake gespeichert. OneLake ermöglicht aber auch das Speichern von beliebigen unstrukturierten Daten in anderen Formaten. Dadurch können Sie schneller Erkenntnisse aus Ihren Daten gewinnen und Fehler bei der Datenverarbeitung vermeiden.

Der OneLake wird automatisch bei der Installation des SaaS-Systems angelegt. Mit Shortcuts können Sie zudem Daten aus verschiedene externen Quellen virtuell bereitstellen. Dazu gehören andere OneLake Instanzen, ADLS Gen2, Amazon S3 und Dataverse. Zudem ist Fabric direkt mit Microsoft Purview verbunden – ein Zusammenschluss aus Datengovernance-, Risiko- und Complance-Lösungen. 

Die 7 Werkzeuge in Fabric

Fabric vereint neben dem OneLake 7 bereits bestehende Werkzeuge auf einer Plattform. Diese stellen wir Ihnen in der folgenden Tabelle vor. 

Komponente Funktion 
Power BI Verbindungen zwischen Datenquellen herstellen und wichtige Zusammenhänge visualisieren 
Data Factory Erfassen, Vorbereiten und Transformieren von Daten durch ETL-Prozesse
Data Activator No-Code-Tool, das Aktionen wie E-Mail-Benachrichtigungen und Power Automate-Workflows basierend auf erkannten Mustern oder Bedingungen in sich ändernden Daten startet und alarmiert
Synapse Data Warehousing Spark-Plattform für die Erstellung, Verwaltung und Optimierung von Infrastrukturen zur Sammlung, Speicherung, Verarbeitung und Analyse großer Datenmengen 
Synapse Data Science Erstellung, Bereitstellung und Implementierung von Machine-Learning-Modellen. Integriert Azure Machine Learning für Experimentnachverfolgung und Modellregistrierung 
Synapse Data Engineering SQL-Leistung und Skalierung, trennt Compute und Speicher für unabhängige Skalierung und speichert Daten nativ im offenen Delta Lake-Format. Es transformiert Daten durch Apache Spark.
Synapse Real-Time Analytics End-to-End-Lösung für ereignisgesteuerte Szenarien, die Streamingdaten und Protokolle verarbeitet. Ermöglicht Echtzeitanalyse und -visualisierung von Daten durch Datenerfassung, Transformation, Speicherung, Analyse und KI. Echtzeit-Hub bietet No-Code-Connectors, die in verwalteten und geschützten Datenkatalog integriert sind 
Vorstellung der verschiedenen Komponenten von Fabric.

Diese Komponenten arbeiten nahtlos zusammen und ermöglichen das interaktive Arbeiten verschiedener Datenteams an einem einzigen Ort. Sehen wir uns nun an, welche Vorteile sich daraus ergeben.  

Die Architektur von Microsoft Fabric

Die folgende Skizze zeigt die Architektur von Fabric. Aufbauend auf Microsoft Purview als Governance und Policy Instanze befindet sich der OneLake. Dieser fasst wiederum den Power BI Dataset Storage und den Azure Data Lake Storage. Sie können die 7 Tools über den Workspace ansteuern und Daten durch den OneLake abrufen und verwenden.

Dargestellt ist die Architekturskizze von Microsoft Fabric mit den sieben Diensten, OneLake, Data Lake Storage, Power BI und Purview.

Datenspeicherung

Wie können wir Daten in MS Fabric speichern? In MS Fabric stehen drei Hauptkomponenten zur Datenspeicherung und -analyse zur Verfügung: Lakehouse, Warehouse und Eventhouse. Jede dieser Komponenten ist für spezifische Anwendungsfälle konzipiert:

Lakehouse: ermöglicht die Speicherung, Verwaltung und Analyse sowohl strukturierter als auch unstrukturierter Daten an einem zentralen Ort. Daten werden im offenen Delta-Format gespeichert, was ACID-Transaktionen unterstützt und die Interoperabilität zwischen verschiedenen Workloads fördert.

Warehouse: speichert strukturierte Daten und bietet umfassende T-SQL-Unterstützung, einschließlich DDL- und DML-Operationen, sowie Transaktionsunterstützung. 

Eventhouse: ist speziell für die Verarbeitung und Analyse von Echtzeitdatenströmen konzipiert. Es ermöglicht die effiziente Erfassung, Verarbeitung und Analyse von Ereignisdaten in nahezu Echtzeit.

Möglichkeiten zur Datenspeicherung in Microsoft Fabric: Lakehouse, Warehouse und Eventhouse

Eine Frage, die wir gerne noch beantworten möchten, bevor wir zum nächsten Punkt übergehen, ist der Unterschied zwischen Lakehouse und Warehouse. Denn beide Speicherumgebungen können mit Fabric ausgewählt werden. Das Lakehouse finden wir unter dem Punkt Data Engineering und das Warehouse ist eine der sieben Komponenten.

Also: Was ist der Unterschied zwischen einem Data Lakehouse und einem Data Warehouse? 

Es gibt nicht den einen Unterschied zwischen beiden Speichermethoden, sondern mehrere Kleine, die in ihrer Summe für Ihre Use Cases abgewägt werden sollten. Zum einen können wir in Data Warehouses lediglich strukturierte Daten speichern und es basiert auf SQL. Das Lakehouse ist da um einiges offener, sodass Sie sowohl strukturierte als auch unstrukturierte Daten speichern und mit PySpark, Spark SQL aber auch Scala und R arbeiten können. Dafür können wir keine multi-table Transaktionen im Lakahouse durchführen. Die restlichen Unterschiede wollen wir Ihnen in der folgenden Tabelle gegenüberstellen. 

Data LakehouseData Warehouse
Skill SetPySpark und Spark SQL (Scala und R)SQL
DatenDateien, Ordner, Tabellen, DatabasesDatabases, Schemata, Tabellen
LesenSpark, T-SQLT-SQL
SchreibenSparkT-SQL
Multi-Table FunktionNeinJa
EntwicklungsinterfaceSpark NotebooksSQL-Skripte
SicherheitRow-Level, Tabellen-LevelObjekt-Level (Tabelle, View, Funktion, Speichervorgang), column-Level, Row-Level, DDL/DML, dynamisches data-masking
Datenzugang durch Shortcuts?JaIndirekt durch das Lakehouse
Mögliche Quelle für Shortcuts?Ja, für Ordner und TabellenJa, für Tabellen
Unterschied zwischen Lakehouse und Warehouse.

Sehen wir uns nun an, welche Vorteile sich aus dieser Architektur ergeben.  

Was sind die Vorteile von Fabric? 

Microsoft Fabric bietet Data Teams eine Plattform, auf welcher interaktives und produktives Arbeiten auf einem hohen Sicherheitsstandard möglich ist.

Die (unserer Meinung nach) größten Vorteile im Überblick:

  • Einfache No-Code Bedienung
  • Sofort einsatzbereite all-in-one Datenplattform
  • Zentraler Speicherort mit dem OneLake
  • Nahtlose Integration mit PowerBI
  • Planbare Kosten für Compute

Der Zusammenschluss verschiedener Workspaces in Kombination mit dem OneLake als zentralen Ort für die Datenverwaltung, vereinfacht das teamübergreifende Arbeiten mit und an Daten.  

Ein großer Vorteil ist der OneLake

OneLake eliminiert Datensilos und vereinfacht die Datenfreigabe innerhalb Organisationen. Die Plattform ist mit den neusten Sicherheits- und Compliance-Maßnahmen ausgestattet, einschließlich Identitäts- und Zugriffsmanagement, Datenverschlüsselung und Compliance-Management, so dass sensible Daten bedenkenlos behandelt werden.  

Ein weiteres Upgrate für Fabric User: Wir erhalten Datenzugang von jeder Cloud-Datenplattform, egal ob Azure, AWS, Google Cloud Plattform oder andere Cloud-Services. Das ist durch den OneLake möglich, mit der Hilfe von so genannten Shortcuts. Durch Shortcuts haben wir Zugriff auf unsere Daten unabhängig vom Storage-Ort. Wir brauchen es nicht von anderen Diensten migrieren, sondern ziehen Daten direkt durch Queries. 

Fabric integriert sich zudem nahtlos mit anderen Microsoft-Produkten wie Azure, Office 365 und Power BI, wodurch Arbeitsabläufe optimiert und die Produktivität gesteigert werden. Sie benötigen keine SQL Warehouses, denn Sie können Daten direkt von Power BI abfragen. Die Datenverwaltung folgt zudem serverlos und der integrierte Co-Pilot erleichtert das Coden durch verwenden und verarbeiten natürlicher Sprache.

Außerdem werden alle Workloads über Capacities betrieben. Wir mieten uns quasi eine Kapazität. Diese besteht aus den eigentlichen Kapazitätskosten plus den Kosten für den OneLake. Jeder der Workspaces wird einer Kapazität zugeordnet und darauf aufbauen befinden sich unsere Workloads.

5 Vorteile im Überblick

  1. All-in-One – Schnell einsatzbereite Datenplattform:

Microsoft Fabric ist eine komplette cloud-basierte Datenplattform in Form einer SaaS Lösung (Low-Code falls gewünscht). Diese deckt alle Bereiche der Datenanalyse, Integration und Data Engineering bis hin zu KI, Business Intelligence und Streaming Möglichkeiten an.

Ihr Vorteil:  Sie benötigen nur eine Lizenz um Zugang zu allen Funktionalitäten zu erhalten. Dies reduziert Aufwände für die Einarbeitung der Mitarbeiter, sowie der Konfiguration und Entwicklung.

  1. OneLake – Zentrale Datenspeicherung in der Cloud:

OneLake beseitigt Datensilos, indem es alle Informationen an einem zentralen Ort speichert und im offenen Parquet/Delta-Format ablegt, sodass wir diese mit verschiedenen Tools nutzen können. Daten können durch virtuelle Shortcuts über Cloud- und Domänengrenzen hinweg bereitgestellt werden.

Ihr Vorteil: Eine einheitliche Handhabung von Daten wird ermöglicht, was die Zusammenarbeit zwischen den Nutzern verbessert.

  1. Daten Demokratie – Datenzugang für alle Mitarbeiter:

Dank der vertrauten Microsoft 365-Oberfläche und dem zentralen Speicherort OneLake können immer mehr Mitarbeiter eigene Datenlösungen erstellen und teilen. Eine breite Palette von Analysewerkzeugen steht für Data Engineers, Data Analysts und Data Scientists zur Verfügung.

Ihr Vorteil: Ein größerer Anwenderkreis und ein verstärkter Wissensaustausch beschleunigen die Innovationsprozesse im Unternehmen und helfen dabei, datengetrieben Entscheidungen zu treffen.

  1. Direct Lake – Unbegrenzter Datenzugriff ohne Import:

Der Direct-Lake-Modus ermöglicht es, in Power BI direkt auf Daten im OneLake zuzugreifen, ohne sie importieren zu müssen. Die Datenansicht ist immer aktuell und die Integration klappt mühelos. Hier spielt Fabric seine Stärken aus.

Ihr Vorteil: Redundanzen werden vermieden, Speicherbegrenzungen beim Import umgangen und gleichzeitig gewährleistet, dass Analysen stets auf den neuesten Daten basieren. Die wohl beste Integration und großer Vorteil von Fabric, falls Sie bereits Power BI nutzen.

  1. Einfache Data Governance:

OneLake als Single-Source of Truth ermöglicht eine zentrale Verwaltung von Data Governance und Security Best Practices über Purview (aber aktuell noch nicht so weit wie Databricks Unity Catalog). IT-Teams können alle Standards und Nutzergruppen zentral verwalten und überwachen.

Ihr Vorteil: Die Sicherheit und Verantwortlichkeit im Umgang mit Daten werden verbessert, während die IT-Abteilung entlastet wird.

Neben diesen Vorteilen punktet die Plattform wegen der einfachen Benutzeroberfläche mit intuitiver Bedienung.

Startseite von Microsoft Fabric mit Navigation zu Power BI, Data Factory und Synapse-Tools im Menü.
Microsoft Fabric Dashboard mit Menü.

Neben vielen Vorteilen wollen wir uns nun ein paar Schwächen von Fabric ansehen.

Nachteile von Microsoft Fabric

Microsoft bietet mit der Fabric-Plattform viele Vorteile, aber wie fast jedes gute System in Kinderschuhen bleibt auch dieses nicht von Schwächen.

Die größten Herausforderungen (unserer Meinung nach) im Überblick:

  • Viele Features noch in Preview/Entwicklung
  • Weniger granulare Konfigurationsmöglichkeiten
  • Berechtigungsmodell noch nicht ausgereift
  • Kupplung von Speicher und Compute
  • Verschiedene Kapazitäten zur Trennung von Der- und Production-Workloads nötig
  • Abhängigkeit von Microsoft

1. Berechtigungen und Governance:

Berechtigungen werden derzeit in jeder Datenverarbeitungsschicht separat verwaltet. Die geplante Vereinheitlichung mit OneSecurity wird voraussichtlich erst im ersten Quartal 2025 verfügbar sein, und die Integration mit Microsoft Purview ist aktuell noch begrenzt. Dies bedeutet, dass die Data-Governance auf Unternehmensebene nicht vollständig zentralisiert ist und zusätzliche Komplexität in der Verwaltung der Zugriffsrechte entstehen kann. Hier ist Databricks mit seinem Unity Catalog weiter und führt den Lakehouse Markt klar an.

2. Compute und Storage Abhängigkeit: 

OneLake erfordert eine aktive Fabric-Kapazität für den Datenzugriff. Dies bedeutet, dass Compute und Storage gekoppelt sind, was zu Einschränkungen bei der Flexibilität führen kann. Unternehmen müssen sicherstellen, dass sie stets über ausreichende Compute-Ressourcen verfügen, um auf ihre gespeicherten Daten zugreifen zu können.

3. Migration von Synapse: 

Obwohl Synapse noch nicht veraltet ist, sind Kunden besorgt über die langfristige Unterstützung und die Migrationsmöglichkeiten zu Microsoft Fabric. Derzeit gibt es nur begrenzte Optionen für die Migration von Synapse zu Fabric, was Unternehmen zögern lässt, Synapse weiterhin zu verwenden oder auf Fabric umzusteigen.

4. Unsere Einschätzung zu Fabric:

Eine gute Plattform für einfache Datenintegration und (kleine) Unternehmen die bereits auf Microsoft PowerBi sind. Allerdings sind viele wichtige Features noch nicht soweit entwickelt (z.B. OneSecurity) und es fehlt an Marktreife.

Durch die direkte Anbindung zu PowerBI und den Co-Pilot müssen nicht erst SQL Codes geschrieben werden, um Daten zu verarbeiten und es werden keine Vorkenntnisse im Programmieren verlangt, da Befehle in natürlicher Sprache geschrieben werden können. Allerdings laufen viele Prozesse – der Einfachheit halber – im Hintergrund ab, was weniger Anpassungsmöglichkeiten für erfahrene Datenteams ermöglicht.

Was ist neu bei Microsoft Fabric?

Auf der diesjährigen Microsoft Build Konferenz (21. – 23. Mai 2024) wurden unter dem Motto „How will AI shape your future?“ neue Features von Fabric angekündigt.

Unter anderem ist nun das Lesen und Schreiben mit Iceberg in Fabric möglich, damit die Datenverarbeitung und -speicherung noch effizienter wird. Dadurch können wir auch mit Snowflake auf die Iceberg-Tabellen in OneLake zugreifen, was die Interoperabilität zwischen den Plattformen erhöht.

Eine weitere Neuerung: Die Echtzeit-Intelligenz.

Real-time-Intelligence vereint drei verschiedene Echtzeit-Tools in einer einzelnen Oberfläche:

  • Fabric Data Streams: UI-basierte Datenaufnahme
  • KQL Queryset: Abfragen und Transformieren von Streaming-Daten
  • Data Activator: Alarmierung und Benachrichtigungen

Außerdem wurde die Integration vom Unity Catalog in OneLake angekündigt, um bestehende Herausforderungen mit der Data-Governance zu lösen. Daten sollen dadurch nahtlos zwischen dem Unity Catalog und dem OneLake synchronisiert werden.

Empfohlene Integrationsmuster beinhalten:

  • Veröffentlichung in Power BI
  • Öffnen in Power BI Desktop
  • Nutzung von DFG2 für kleinere Workloads: Geeignet für weniger umfangreiche Datenverarbeitungen

Die Neuerungen zielen darauf ab, die Datenverarbeitungs- und Analysefähigkeiten von Microsoft Fabric zu erweitern und gleichzeitig die Interoperabilität und Benutzerfreundlichkeit zu verbessern.

Sehen wir uns nun an, wie Sie Microsoft Fabric verwenden können.  

Anwendungsfälle für Microsoft Fabric 

Aufgrund der Vielzahl von Werkzeugen und Funktionen, die in OneLake genutzt werden können, sind die Anwendungsfälle rund um den Einsatz von Microsoft Fabric im Bereich des Datenmanagements vielfältig. Im Kern ist das SaaS-System eine Plattform mit integriertem Data Lakehouse, in welcher Datenteams problemlos gemeinsam an Datenprodukten arbeiten können.  

Stellen Sie sich die Verwendung der Plattform wie folgt vor: 

Ein fiktives B2C-Handelsunternehmen hat 100.000 Kunden, die beim Einkaufen täglich mehrere GB an Daten erzeugen. Es wird angestrebt, diese Daten zu nutzen, um die

  • Prozesse zu optimieren 
  • Kundenzufriedenheit zu steigern 
  • Und Kampagnen kundenorientiert auszurichten. 

Das Handelsunternehmen hat insgesamt 4 Teams, die sich um die Datenverarbeitung, -analyse, -verwaltung, und –speicherung kümmern:  

  1. Customer Success Team 
  2. IT-Analysten 
  3. Data Engineering Team 
  4. Data Science Team 

Ziel der Teams ist es nun, aus der Produktbewertung, die Kunde A über den Kanal “Website” erhalten hat, Erkenntnisse zu gewinnen.

Sehen wir uns die Datenverarbeitung OHNE die Verwendung von Microsoft Fabric an:  

Schritt 1: Die produzierten Daten von Kunde A werden zunächst vom Customer Success Team als Feedback im ursprünglichen Textformat in Azure SQL gespeichert.  

Schritt 2: Die Daten werden automatisch durch die bereits erstellten Pipelines des Data Engineering Teams kopiert und in den Data Lake gespeichert. Dort transformiert das Team die Textdatei in ein – für Machine-Learning lesbares – Tabellenformat und stellt es für das Data Science Team zur Verfügung.  

Schritt 3: Die Daten von Kunde A werden dann vom Data Science Team aus dem Data Lake abgezogen und bearbeitet, damit Erkenntnisse z.B. über das vorliegende Sentiment gewonnen werden können.  

Schritt 4: Zum Schluss erstellt das IT-Team einen Power BI-Bericht, in dem die interpretierten Ergebnisse aus dem Feedback von Kunde A enthalten sind.

Dabei werden die Daten in mehreren Quellen gespeichert, verschoben, kopiert und neu formatiert. Die Bearbeitung der Daten ist zeitaufwändig und fehleranfällig. Darüber hinaus müssen Berechtigungen zwischen den verschiedenen Teams vergeben werden, was zu endlosen Feedbackschleifen führt. Stellen wir uns nun dieses Szenario mit Tausenden von Daten vor, die täglich bei 100.000 Kunden anfallen. Man bräuchte fast eine weitere Vollzeitkraft, die nur für das Datenmanagement zwischen den Teams zuständig wäre.

MIT Microsoft Fabric sieht dieselbe Situation wie folgt aus:  

Data Scientists, Customer Analysts und Data Engineers verfügen über verschiedene Tools und Sprachen (z.B. Spark, T-SQL, Notebooks) aber sie arbeiten alle mit einem einheitlichen Datenformat (Parquet) an einem einzelnen Ort (OneLake) auf der Plattform Microsoft Fabric. 

Das Customer Success Team kann mit einer Vielzahl an einfach zu bedienenden No-/Low-Code-Konnektoren Daten direkt in OneLake einlesen. Die IT-Spezialisten können das Default Semantik Modell des Lakehouse/Warehouse nutzen um direkt darauf aufbauen Berichte in PowerBI zu erstellen oder eigene customisierte Semantikmodelle erstellen. Ein weiteres Kopieren/Importieren der Daten entfällt mit dem Direct Lake Modus.

Berechtigungen für die verschiedenen Nutzergruppen können granular  in OneLake vergeben werden. So können für die IT-Spezialisten beispielsweise nur Leserechte für die benötigten Daten vergeben werden, während das Data Engineering Team vollen Lese- und Schreibzugriff auf die Daten erhält, um diese einzulesen und zu transformieren.

Schritt-für-Schritt: Mit Microsoft Fabric starten 

Um mit Microsoft Fabric zu starten, empfehlen wir Ihnen folgende Schritte: 

1. Registrierung und Kontoerstellung 
  • Besuchen Sie die Microsoft Fabric Webseite und registrieren Sie sich für ein Konto. 
  • Hinweis: Falls Sie bereits ein Konto bei einem anderen Microsoft-Dienst haben, können Sie dieses möglicherweise auch für Microsoft Fabric verwenden. Insbesondere kann in der Azure Cloud direkt eine Fabric Kapazität erstellt und gestartet werden.
2. Einrichtung Ihrer Umgebung (Workspace und Kapazität)

Nach der Registrierung melden Sie sich bei Microsoft Fabric an und richten Ihre Umgebung ein. Hierfür

  1. erstellen Sie Ihren Workspace,
  2. benennen diesen und
  3. kaufen eine Kapazität bzw. schalten diese frei (ohne können Sie außer Power BI keine Microsoft Tools verwenden)

Wie Sie die Kapazität wählen? Die Fabric Capacity wird benötigt, um Fabric Funktionen verwenden zu können (außer PowerBI, das funktioniert unabhängig von Fabric Kapazitäten)

  • Gehen Sie auf portal.azure.com/#create/Microsoft.Fabric
  • Wählen Sie Ihre Subscription Art (z.B. Pay-as-you-go)
  • Entscheiden Sie sich für einen Kapazitäts-Namen (der darf nur 1mal in der ausgewählten Region existieren)
  • Nun wählen Sie, wie groß Ihre Kapazität sein soll:
    Hier zahlen Sie in so genannten SKUs: Stock Keeping Units (F2, F4, F8, F16,…)
  • Zum Schluss öffnen Sie Ihren Workspace unter: -> New Workspace -> Advanced -> Capacity auswählen -> Fabric Workspace einrichten

Hinweis: Stellen Sie sicher, dass Sie die erforderlichen Berechtigungen und Lizenzen haben, um alle Funktionen von Microsoft Fabric zu nutzen. Je nach Kapazität werden zusätzliche Lizenzen benötigt (z.B. für die Nutzung von Power BI.) 

Außerdem kann es sein, dass Sie bereits Fabric Kapazitäten besitzen. Schauen Sie hierfür unter Workspaces nach, suchen Sie den Fabric Workspace und scrollen Sie runter zum Reiter Advanced. Hier finden Sie entweder bestehende Fabric Kapazität oder die Möglichkeit, Fabric 60 Tage umsonst zu verwenden. Mit dem reinen Workspace können Sie zwar die Fabric-Funktionen speichern, allerdings können Sie diese nur mit der Fabric Kapazität verwenden.

3. Erste Datenintegration 

Beginnen Sie mit der Integration Ihrer Datenquellen. Erstellen Sie zunächst ein Lakehouse oder Warehouse je nach Anwendungsfall. Nutzen Sie dazu die Datenintegrationstools, die in Microsoft Fabric integriert sind

  • Werkzeuge: Verwenden Sie Data Factory, um Datenpipelines zu erstellen und Daten aus verschiedenen Quellen zu integrieren. In der Pipeline steht die Copy Data Activity zur Verfügung um einfach große Mengen an Daten nach OneLake zu kopieren. Außerdem können Dataflows verwendet werden, mit denen die Daten bereits beim Einlesen in einer visuellen Benutzeroberfläche transformiert werden können. Für komplexere Transformationen bieten sich Notebooks an. Einige Datenquellen können direkt über sogenannte Shortcuts im Lakehouse verknüpft werden. Dabei wird lediglich eine Verbindung zur Datenquelle hergestellt aber keine Daten nach OneLake importiert.  Dazu gehören z.B. and OneLake Instanzen, ADLS Gen2 oder AWS S3.
  • Hilfreiche Ressource: Data Integration in Microsoft Fabric
4. Datenverarbeitung und -transformation 

Verarbeiten und transformieren Sie Ihre Daten, um sie für die Analyse vorzubereiten. Nutzen Sie eine Medaillenarchitektur um Daten zu bereinigen und aggregieren.

  • Werkzeuge: Nutzen Sie Data Engineering Tools wie Synapse Analytics, um ETL-Prozesse zu implementieren. Bei der Verarbeitung helfen Datapipelines mit ihrer Vielzahl an verfügbaren Aktivitäten, Dataflows und Notebooks. Daten im Lakehouse können primär über Notebooks mit Spark verarbeitet werden während für das Warehouse T-SQL genutzt wird. Das Datawarehouse unterstützt zudem Stored Procedures.
  • Hilfreiche Ressource: Data Processing in Microsoft Fabric
5. Datenanalyse und Machine Learning 

Analysieren Sie Ihre Daten und implementieren Sie Machine Learning-Modelle. Die Daten können innerhalb von Notebooks zur Exploration visuell dargestellt werden. Es stehen Werkzeuge für den gesamten Machine Learning Workflow bereit. Erstellen und trainieren Sie Modelle und tracken Sie Metriken in Experimenten.

  • Werkzeuge: Verwenden Sie die Data Science Funktionen von Microsoft Fabric, um Machine Learning-Modelle zu erstellen und zu verwalten. Dazu gehört die Nutzung von MLflow zum Tracken von Modellen und Experimenten.
6. Echtzeitanalysen und -aktionen 

Implementieren Sie Echtzeitanalysen, um Datenströme in Echtzeit zu überwachen und zu analysieren. 

  • Werkzeuge: Nutzen Sie die Echtzeitanalysefunktionen von Microsoft Fabric, um schnelle Entscheidungen basierend auf aktuellen Daten zu treffen. 
7. Erstellung von Berichten und Dashboards 

Erstellen Sie interaktive Berichte und Dashboards, um Ihre Daten zu visualisieren und Erkenntnisse zu teilen. 

  • Werkzeuge: Verwenden Sie PowerBI, um ansprechende und interaktive Visualisierungen zu erstellen. PowerBI ist zentraler Bestandteil von Microsoft Fabric und kann direkt auf die Daten in OneLake zugreifen. Erstellen Sie Semantikmodelle basierend auf Ihren Daten im Lakehouse und Warehouse und nutzen Sie diese als Grundlage für Berichte in PowerBI.
8. Nutzung von No-Code-Connectors 

Verwenden Sie No-Code-Connectors, um Datenquellen schnell und einfach zu integrieren. 

  • Werkzeuge: Nutzen Sie den Echtzeit-Hub in Echtzeitintelligenz, um auf eine Vielzahl von No-Code-Connectors zuzugreifen. Nutzen sie außerdem Dataflows Gen2 und die Import Data Aktivität in der Data Pipeline um Daten einfach zu integrieren. Dataflows Gen2 ermöglichen außerdem eine gleichzeitige Transformation der Daten bereits beim Einlesen.
9. CI/CD in Microsoft Fabric

Verwenden Sie die Git-Integration und Deployment Pipelines für eine nahtlose Entwicklungszusammenarbeit und Integration. 

  • Werkzeuge: Die Git Integration ermöglicht die einfache Zusammenarbeit und Versionskontrolle von einer Vielzahl von Fabric Elementen. Mit Bereitstellungspipelines kann die automatisierte Bereitstellung in verschiedenen Umgebungen wie z.B. Test und Produktion erfolgen.
  • Hilfreiche Ressource: Lebenszyklusverwaltung in Microsoft Fabric
10. Schulung und Weiterbildung 

Nutzen Sie die umfangreichen Schulungsressourcen und Tutorials, die von Microsoft bereitgestellt werden, um Ihre Fähigkeiten zu erweitern und das Beste aus Microsoft Fabric herauszuholen. Microsoft Learn bietet eine Vielzahl von Ressourcen und Trainingsmaterial.

11. Pilotprojekte und Skalierung 

Starten Sie mit kleineren Pilotprojekten, um die Plattform und ihre Funktionen kennenzulernen. Skalieren Sie dann nach Bedarf, um größere und komplexere Projekte zu realisieren. Wichtig ist es im ersten Schritt ein Pilotprojekt zu entwickeln, welches schnell die Vorteile der neuen Platform aufzeigt um diese im Unternehmen zu kommunizieren.

Fabric ist sehr benutzerfreundlich, allerdings ist unserer Meinung nach das Kostenmodell etwas kompliziert, daher werfen wir gemeinsam einen Blick darauf.

Das Kosten- und Lizenzmodell von Microsoft Fabric

Es gibt verschiedene Lizenzen und Berechtigungen, die vor Verwendung von Fabric klar sein sollten, um unnötige Ausgaben zu vermeiden.

  1. Kostenlose Lizenz: Hiermit können Sie Ihren Workspace verwenden/erstellen und Fabric Objekte einsehen die nicht mit Power BI zusammenhängen. Geteilte Power BI Objekte können Sie hiermit nicht einsehen
  2. Pro Lizenz: Die Lizenz ermöglicht Ihnen das Einsehen von Power BI Objekten
  3. Premium Einzelbenutzerlizenz (PPU): Hiermit lassen sich Power BI Objekte einsehen.
  4. Premium Kapazitätslizenz (P): Durch die Kapazität können Sie Power BI Objekte einsehen auch wenn Sie eine kostenlose Lizenz haben.
  5. Fabric Kapazität (F): Mit der Kapazität F64 (oder drüber) haben Sie dieselben Rechte wie mit der Premium-pro-User-Kapazität. Bei der Kapazität F32 oder drunter können Sie Power BI Objekte nicht einsehen, wenn Sie ein kostenfreies Lizenzmodell haben.

Hier nochmal ein schneller Überblick:

LizenzmodellAcronymAnwendungInfo
FreiKeine geteilten Power BI Objekte ansehen
ProPower BI
Premium pro UserPPUPower BI
Premium pro KapazitätPFabricMit Verwendung der kostenlosen Fabric Lizenz möglich, Power BI Objekte anzusehen
IntegriertA/EMPower BI
Fabric KapazitätFFabricBei F32 oder weniger brauchen Sie kostenpflichtige Power BI Lizenz, um Objekte anzusehen. Bei F64 oder mehr, können Sie kostenfreie Fabric Lizenz verwenden für die Einsicht in BI Objekte.
Vorstellung der verschiedenen Lizenzen.

Zusätzlich zu den Lizenzen und Kapazitäten sind Kosten für den OneLake zu berücksichtigen. Diese berechnen sich auf 2.6 Cents pro GB, pro Monat.

Unser Tipp zum Kosten sparen: Sie können Ihre Kapazität jederzeit pausieren und erst dann wieder starten, wenn Sie mit Fabric arbeiten. Wenn Sie sich unsicher sind, welches Kostenmodell zu Ihnen passt, folgt hier eine Checkliste mit der Gegenüberstellung der Lizenzen Pro, PPU und kostenlos.

Checkliste mit den Lizenzen Pro, Kostenlos und PPU von Fabric mit den möglichen Funktionen

Fazit 

Microsoft Fabric ist eine SaaS-Plattform, die verschiedene Azure-Datendienste integriert, um eine einheitliche Umgebung für Datenintegration, -verarbeitung, -analyse und -visualisierung zu bieten. Zu den Hauptkomponenten gehören Datenintegration und -transformation, Data Engineering, Data Science, Echtzeitanalysen sowie Reporting und Visualisierung.  

Das Rad wird durch Fabric nicht neu erfunden, und viele Microsoft Produkte sind für sich allein gesehen schon gut. Was Fabric aber tut, ist alle guten Produkte in einer Plattform vereinen und somit insbesondere die User Experience verbessern. 

Die Plattform fördert die Zusammenarbeit, ermöglicht Self-Service-Datenmanagement und unterstützt schnelle Wertschöpfung aus Daten. Unternehmen können sie nutzen, um fundierte Entscheidungen zu treffen, Echtzeitanalysen durchzuführen und Machine Learning-Modelle zu implementieren.  

Benötigen Sie weitere Tipps oder sind Sie an der Umsetzung intelligenter Lösungen für Ihr Business interessiert? Dann kontaktieren Sie uns

FAQ 

Was ist Microsoft Fabric? 

Microsoft Fabric ist eine umfassende Software-as-a-Service (SaaS) Plattform, die verschiedene Azure-Datendienste wie Data Factory, Synapse Analytics und Power BI integriert. Die Plattform bietet eine einheitliche Umgebung für Datenintegration, -verarbeitung, -analyse und -visualisierung. Sie unterstützt Unternehmen dabei, ihre Datenstrategie zu optimieren, fördert die Zusammenarbeit und ermöglicht Self-Service-Datenmanagement, Echtzeitanalysen und die Nutzung von maschinellem Lernen. 

Wie starte ich mit Microsoft Fabric? 

1. Registrieren Sie sich auf der Microsoft Fabric Webseite
2. Melden Sie sich an und richten Sie Ihre Umgebung ein. 
3. Integrieren Sie Ihre Datenquellen und erstellen Sie Datenpipelines. 
4. Verarbeiten und transformieren Sie Ihre Daten. 
5. Nutzen Sie Data Science Tools und Echtzeitanalysen. 
6. Erstellen Sie interaktive Berichte mit Power BI. 
7. Nutzen Sie Schulungsressourcen und Tutorials. 
Kontaktieren Sie uns bei weiteren Fragen.

Welche Vorteile bietet Microsoft Fabric? 

– Erleichtert die Zusammenarbeit und ermöglicht Self-Service-Datenmanagement
– Integriert verschiedene Datentools und Anwendungen
– Automatisierte Prozesse ermöglichen schnelle Entscheidungen
– Unterstützt ETL-Prozesse, Echtzeitanalysen, maschinelles Lernen und Datenvisualisierung 

Kann ich Microsoft Fabric kostenlos ausprobieren? 

Ja, Microsoft bietet eine kostenlose Testversion von an. Besuchen Sie die Microsoft Fabric Webseite und registrieren Sie sich für die Testversion. 

Welche Ressourcen stehen für Microsoft Fabric zur Verfügung? 

Dokumentation und Tutorials: Umfangreiche Lernressourcen auf Microsoft Learn
Community und Support: Unterstützung durch Foren und Community-Gruppen. 
Schulungsressourcen: Lernmodule und end-to-end Tutorials. 

Weiterlesen

Data PlatformDatabricksMicrosoft Vor 1 Monat

Fabric vs. Databricks: Der Praxis-Guide

Databricks vs. Microsoft Fabric, wer gewinnt die Auszeichnung als beste Datenplattform? So einfach zu beantworten ist das leider nicht. Die beiden Datenplattformen Databricks und MS Fabric unterscheiden sich in verschiedenen […]
Business IntelligenceMicrosoft Vor 3 Monaten

Was ist Power BI? Leitfaden für Einsteiger in PowerBI

Power Bi wurde im Juli 2015 von Microsoft veröffentlicht. Das BI-Tool soll Nutzern ermöglichen, die Datenanalyse zu vereinfachen und die Ergebnisse visuell darzustellen. In unserem Blog erfahren Sie alles, was […]
Die Architektur von Microsoft Azure Synapse
Data PlatformMicrosoft Vor 3 Monaten

Was ist Azure Synapse? Vorteile, Funktion, Anwendung

Microsoft Azure Synapse Analytics ist eine Datenplattform, die Data Warehousing und Big Data-Analysen in einer integrierten Umgebung vereint. Azure Synapse ermöglicht es Unternehmen, Daten aus verschiedenen Quellen zu integrieren, zu […]
Data PlatformDatabricks Vor 4 Monaten

Was ist Databricks? Nutzen, Vorteile, Umgebung

Databricks ist ein Cloud-basiertes Tool, das den gesamten Prozess der Datenverarbeitung vereinfacht: von Data Engineering über Data Science bis hin zu maschinellem Lernen. Unternehmen nutzen Databricks, um große Datenmengen zu […]
Newsletter und Updates

Sie sehen gerade einen Platzhalterinhalt von HubSpot. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Mehr Informationen
Erstgespräch vereinbaren