Erstgespräch vereinbaren
Laurenz Wuttke /

SAP und Databricks kooperieren: KI für alle Geschäftsanwendungen

10 Minuten Lesezeit
Databricks
Zusammenfassung
  • Vorstellung von SAP Databricks als Teil der SAP Business Data Cloud und Rollout auf AWS, GCP und Azure.
  • Native Integration von SAP-Daten ins Databricks Lakehouse per Delta Sharing ohne klassische ETL-Prozesse.
  • Vorteile wie Echtzeit-Zugriff, einheitliche Governance mit Unity Catalog und Nutzung von SAP-Data-Products.
  • Lizenz- und Kostenmodell über Capacity Units im BDC-Subskriptionsmodell.
  • Chancen und Grenzen im Vergleich zu nativer Databricks-Nutzung, insbesondere für SAP-zentrierte Unternehmen.

Am 13. Februar 2025 gaben SAP und Databricks ein Produkt bekannt, welches aus der Kooperation entstand: SAP Databricks.

SAP Databricks wird ab sofort von SAP als Teil der SAP Business Data Cloud auf AWS verkauft. Ab der zweiten Jahreshälfte erfolgt der Verkauf auch noch über Azure und GCP. Ziel der Produkts ist es, SAP Daten einfach für Machine Learning und KI-Anwendungen zugänglich zu machen. Dieser Vorteil richtet sich vor allem an Kunden, die stark im SAP-Kosmos verankert sind.

Alles was Sie jetzt über SAP Databricks wissen müssen, erfahren Sie hier.

Lassen Sie uns starten!

Vorstellung von SAP Databricks

Um das Konzept hinter der Zusammenarbeit zu verstehen, schauen wir uns zunächst die Herausforderungen an, mit denen SAP-Kunden zu tun hatten. SAP hat die klare Marktführerschaft in den Bereichen CRM und ERP, war jedoch bis jetzt eher schwach aufgestellt, wenn es um Datenplattform und -analyse ging. Viele Unternehmen hatten Schwierigkeiten ihre SAP-Daten in moderne Datenplattformen zu integrieren, da der Integrationsweg komplex und mit Datenkopien und daraus resultierendem Semantik-Verlust verbunden waren. Es benötigte viel Know-How und Fingerspitzengefühl die SAP-Daten erfolgreich in KI-Modelle zu integrieren. Das wird sich jetzt ändern:

Bisher war der Zugriff auf SAP-Daten oft durch komplexe Extraktionsprozesse (ETL) und isolierte Speicherlösungen erschwert. Mit der Delta-Sharing Zero-Copy-Funktion besteht die Möglichkeit, SAP-Daten in Gold- und Silber-Level in SAP Databricks nahtlos zu integrieren und dort für ML- und AI-Projekte zu benutzen.

SAP hat die klare Marktführerschaft in den Bereichen CRM und ERP, war jedoch bis jetzt eher schwach aufgestellt, wenn es um Datenplattform und -analyse ging. Ein cleverer Schachzug sich mit dem Spitzenreiter für Datenplattformen, Databricks, zusammenzuschließen. Als jahrelanger Databricks Partner erkennen wir das Potenzial hinter der Zusammenarbeit mit SAP. 

Das am 13.02.2025 vorgestellte Produkt soll als gemeinsames Projekt von Databricks und SAP diese Herausforderungen lösen, indem es eine native Verbindung zwischen SAP-Daten und der Databricks Data Intelligence Platform (Lakehouse) schafft.

Dabei handelt es sich um eine speziell angepasste Version von Databricks, die innerhalb der SAP Business Data Cloud (BDC) als Kernprodukt vermarktet wird. Sie bietet Data Science, AI/ML und SQL Serverless-Funktionalitäten und wird von SAP direkt an seine Kunden verkauft.

SAP Databricks wird in einem gestaffelten Rollout auf verschiedenen Cloud-Plattformen verfügbar sein:

  • AWS (April 2025) – bereits Verfügbar
  • GCP (Mai 2025)
  • Azure (Q3 2025)

Das bedeutet, dass Kunden auf verschiedenen Cloud-Plattformen flexibel entscheiden können, wie sie ihre Daten nutzen möchten.

Wie funktioniert SAP Databricks?

Das Grundkonzept hinter dem Zusammenschluss von SAP und Databricks ist die Integration des Databricks Lakehouse in die SAP Business Data Cloud (SAP BDC).

Bisher mussten Unternehmen oft Workarounds mit aufwändigen ETL-Prozessen nutzen, um SAP-Daten in ihre Analyseumgebungen zu überführen. Dieses Problem umgehen SAP und Databricks geschickt:

Über nur einen Klick in der Business Data Cloud von SAP können Sie SAP Databricks innerhalb der Cloud starten. Alle verfügbaren Daten sind dann sicher über den Unity Catalog mit Ihren anderen Daten eingebunden und können direkt über Databricks-Tools in SAP Databricks verarbeitet werden.

Die Architektur der SAP Business Data Cloud in dem Produkt SAP Databricks.

Sie haben außerdem die Möglichkeit, SAP Daten über Delta-Sharing direkt in den Unity Catalog zu laden und an Ihre bestehende Databricks Umgebung anzubinden über den so genannten „Connector“.

Schauen wir uns die Vorteile an.

Vorteile von SAP Databricks

Die Verbindung von SAP und Databricks ermöglicht es Unternehmen SAP- mit Non-SAP-Daten in der SAP Business Data Cloud zu verbinden und das 

Ein entscheidender Vorteil von SAP Databricks ist die Möglichkeit, Daten direkt dort zu nutzen, wo sie entstehen – und sie mit den KI- und Analysefunktionen von Databricks zu verknüpfen. So können Unternehmen schneller fundierte Entscheidungen treffen und ihre Datenstrategie optimieren.

Die SAP-Daten waren zuvor schwer zugänglich und oft in isolierten Systemen, so dass der Austausch zwischen SAP- und Non-SAP-Daten mühsam und teuer war. Jetzt wird die Integration auf einer einheitlichen Plattform nahtlos stattfinden. Zudem ist der Datenzugriff vereinfacht ohne komplexe ETL-Prozesse oder Datenreplikation, und wir sind nicht mehr verpflichtet HANA als einzige Speicheroption zu wählen.

Ein weiteres großes Plus ist, dass die Daten in ihrem Geschäftskontext erhalten bleiben. Das bedeutet, dass Unternehmen direkt auf strukturierte, relevante Informationen zugreifen können, ohne dass wichtige Metadaten oder Zusammenhänge verloren gehen. Durch den Databricks Unity Catalog ist eine einheitliche Governance und Sicherheitsebene gegeben. Sie haben BDC-Abonnoniert? Dann können Sie direkt auf SAP Databricks zugreifen – ohne separate Lizenzen oder langwierige Implementierungsprozesse.

Um Daten sicher und in Echtzeit zu teilen, bietet die BDC Delta Sharing.

Warum Lakehouses die Daten-Architektur der Zukunft sind

In unserem Whitepaper erfahren Sie:

  • Wie sich ein Data Lakehouse von anderen Architekturen unterscheidet.
  • Wie Sie durch ein Lakehouse KI-Anwendungen schneller umsetzen.
  • Wie Sie ihr internes Team befähigen selbstständig KI Projekte zu implementieren.
Jetzt herunterladen

Die Partnerschaft ermöglicht uns vor allem: Das Nutzen der umfassenden Geschäftsdaten von SAP in Verbindung mit den marktführenden Datenverarbeitungs- und KI-Funktionen von Databricks. Das Durchführen von Analysen und das Entwickeln von KI-Tools für unsere Kunden wird uns in Zukunft noch schneller von der Hand gehen.

Machen Sie Databricks zu Ihrem Wettbewerbsvorteil

Mit unserer Databricks-Beratung entwickeln Sie eine skalierbare Architektur, realisieren produktive Use Cases und befähigen Ihr Team nachhaltig.

SAP Databricks Lizenzmodell

SAP Databricks wird nicht separat verkauft, sondern ist Bestandteil der SAP Business Data Cloud (BDC). Dieses Paket wird im Subskriptionsmodell angeboten, wobei sogenannte Capacity Units (CUs) als Verrechnungseinheit dienen. Vertragsnehmer ist SAP.

Wichtig zu wissen:

  • Die CUs können flexibel für alle Komponenten der BDC genutzt werden
  • Für bestimmte vorkonfigurierte Datenprodukte – sogenannte Insight Apps – ist eine zusätzliche Lizenzierung erforderlich.
  • Die Nutzung von SAP Databricks wird durch ein „Click-through“-Verfahren aktiviert, bei dem der Kunde ergänzende Nutzungsbedingungen von Databricks akzeptiert.
  • Sind die Capacity Units am Ende des Monats nicht aufgebraucht, verfallen sie
  • Wenn die CUs für die Arbeitsleistung nicht ausreichen, muss eine höhere CU-Klasse gewählt werden

SAP Databricks Kostenmodell ist leider nicht so flexibel wie das von Databricks sondern orientiert sich eher an dem von Microsoft Fabric. Dafür sind die Kosten eher planbar, sobald festgelegt ist, welche CU-Kapazität benötigt wird.

Klingt komplex? Ist es manchmal auch. Aber genau dafür sind wir da: Wir begleiten Sie nicht nur technisch, sondern auch strategisch durch Lizenzfragen und Produktentscheidungen – transparent, neutral und auf Augenhöhe.

Vorteile für unsere Kunden

Als offizieller Beratungspartner von Databricks mit über 10 Jahren Erfahrung in dem Aufbau von Datenplattformen sehen wir in der Kooperation von Databricks und SAP diese Vorteile für unsere Kunden:

  • Ganzheitliche Datenanalyse: Durch die Integration der Business Data Cloud können Unternehmen ihre Datenlandschaft vereinheitlichen und umfassende Einblicke gewinnen, die bisher aufgrund von Datensilos nicht möglich waren.
  • Beschleunigte KI-Entwicklung: Die nahtlose Verbindung von SAP-Daten mit den KI-Funktionen von Databricks ermöglicht eine schnellere Entwicklung und Implementierung von KI-Lösungen.
  • Kosteneffizienz: Durch den Wegfall aufwändiger Datenextraktionen und die Nutzung einer einheitlichen Plattform können Betriebskosten gesenkt und die Effizienz gesteigert werden.

Dennoch müssen wir realistisch bleiben: SAP Databricks ist kein Allheilmittel. Ein paar Herausforderungen bleiben dennoch bestehen und es ist abzuwarten, ob SAP Databricks eine Lösung für die Zukunft anbieten wird. Sehen wir uns die Herausforderungen an.

Herausforderungen bei SAP Databricks

Trotz der vielen Vorteile gibt es einige Herausforderungen:

Keine On-Premise-UnterstützungViele Unternehmen betreiben heterogene IT-Landschaften mit unterschiedlichen SAP-Versionen (SAP ECC, SAP S/4HANA) sowie Altsystemen und Drittlösungen. Diese sind in der SAP Business Data Cloud bisher nicht berücksichtigt.
AnbieterabhängigkeitDie enge Verzahnung mit SAP-Tools könnte zu einer Abhängigkeit führen, die die Flexibilität einschränkt.
Preisliche EntwicklungEs bleibt abzuwarten, wie sich die SAP Business Data Cloud und ihre Kostenstruktur entwickeln werden.
Offenheit der LösungSAP hat in der Vergangenheit oft geschlossene Ökosysteme geschaffen, die den Datenzugriff durch proprietäre Schnittstellen und Lizenzen einschränken. Die Frage ist, ob SAP Databricks hier eine neue, offenere Richtung einschlägt.

SAP Databricks bleibt eben nur eine eingeschränkte Version von Databricks und ist besonders in den Bereichen Data Engineering nicht mit dem nativen Databricks zu vergleichen. Wir empfehlen SAP Databricks daher unseren SAP Kunden, da ihre technische Aufstellung bereits SAP-zentriert ist. Kunden, die heterogene Datenquellen verarbeiten wollen und personalisierte Pipelines als Ziel definieren, empfehlen wir das Native Databricks.

Sie wissen nicht ob SAP Databricks das richtige für Sie ist? In unserem Blog „SAP Databricks vs Databricks Entscheidungshilfe“ besprechen wir alle wichtigen Vergleichskriterien und geben Ihnen unsere Tipps aus der Praxis. So können Sie entscheiden, welches System zu Ihnen passt.

Wie genau SAP die Lösungen der bestehenden Herausforderungen in Zukunft angehen, und ob sie das überhaupt tun, bleibt abzuwarten. Trotzdem gibt es für jedes Problem eine Lösung, es braucht nur den richtigen Tech-Partner: Datenplattform mit Datasolut

Fazit

SAP Databricks ist ein spannendes Produkt und besonders attraktiv für Unternehmen mit SAP Schwerpunkt. Es erleichtert die Durchführung von ML und AI-Projekten mit SAP Daten, in dem es in der Cloud die ETL-Prozesse durch Datenprodukte und Delta Sharing mit Zero-Copy managet.

Es deckt zwar nicht alle Funktionalitäten des nativen Databricks ab, bietet aber eine solide Basis für die ersten SAP-Datenprojekte. Wir erwarten eine zügige Entwicklung und werden Sie regelmäßig auf dem neusten Stand halten.

Unser Ziel ist es, unsere Kunden zur Data Driven Company zu machen. Das beinhaltet

  • den Aufbau einer zuverlässigen Datenplattform
  • das Durchführen verschiedener Data-Analytics-Use Cases (BI/KI)
  • die Ermächtigung, eigenständig Use Cases umzusetzen

je nachdem, wo Sie sich aktuell auf Ihrer Datenreise befinden.

Starten Sie noch heute Ihre Reise zur Data Driven Company mit Datasolut! Jetzt Termin vereinbaren. 

FAQ – Die wichtigen Fragen schnell beantwortet

Was ist SAP Business Data Cloud?

BDC ist eine SaaS-Plattform, die Daten- und Analyselösungen integriert und mit den wichtigsten SAP-Geschäftsprozessen verbunden ist. Daneben umfasst BDC weitere SAP-Analysetools wie SAP Datasphere, SAP Analytics Cloud und SAP Business Warehouse.

Wie unterscheidet sich Databricks SAP von früheren SAP-Integrationen?

Bisher war die SAP Datasphere-Integration die primäre Verbindung zu Databricks.
Jetzt ist BDC mit Databricks SAP die bevorzugte Integration.
SAP Datasphere bleibt eine Option, wird jedoch nicht mehr aktiv gefördert.

Wie wird Databricks SAP verkauft?

Kunden kaufen BDC von SAP.
Nach dem Kauf können sie SAP Databricks im Click-Through Prozess einfach aktivieren.

Welche Kunden profitieren von dem Zusammenschluss?

Neue Databricks-Kunden, insbesondere SAP RISE-Kunden ohne bisherige Databricks-Nutzung, da sie die Möglichkeit haben auf die kuratierten Data Products von SAP zuzugreifen, die wichtige ERP / Non-ERP Daten in Silber/Gold Level Qualität zur Verfügung stellen.
Bestehende Databricks-Kunden, die ihre SAP-Daten mit vorhandenen Daten in der nativen Databricks Plattform integrieren wollen. Dies ist nun einfach über Delta Sharing möglich, wenn man die BDC Lizenz von SAP gekauft hat.

Was beinhaltet die Partnerschaft zwischen SAP und Databricks?

SAP hat das Produktbündel SAP Business Data Cloud (BDC) eingeführt, eine vollständig verwaltete SaaS-Lösung für Daten und Analysen. Databricks ist integraler Bestandteil von BDC durch:
Databricks SAP und BDC-Databricks Connector.

Profilbild von Vinzent Wuttke Geschäftsführer Datasolut GmbH
Vinzent Wuttke
Geschäftsführer

Lassen Sie uns sprechen und Ihr Potenzial entdecken.

Ob und wie künstliche Intelligenz Ihnen weiterhelfen kann, können Sie in einem ersten, unverbindlichen Gespräch mit uns herausfinden.

In diesem Gespräch erfahren Sie:

  • Wie Ihr Use-Case technisch am besten umgesetzt werden kann
  • Wie wir maximal sicher mit Ihren Kundendaten umgehen
  • Wie lange wir für die Umsetzung benötigen und wie ein konkreter Projektplan aussehen könnte
Jetzt Erstgespräch vereinbaren

Weiterlesen

Databricks Vor 4 Wochen

Alle Databricks Features im Überblick: Was die Plattform heute wirklich kann

Wer Databricks schon länger im Blick hat, kennt das Gefühl: Kaum hat man sich mit einem Feature vertraut gemacht, kündigt Databricks das nächste an. Unity Catalog, Lakeflow, Agent Bricks, Genie […]
Beitragsbild Datenschutz
AllgemeinDatabricks Vor 2 Monaten

Datenschutz meistern: 9 Best Practices, die jedes Unternehmen kennen muss

In Zeiten datengetriebener Entscheidungen sind personenbezogene Informationen (PII – Personally Identifiable Information) ein zentraler Bestandteil vieler Unternehmensprozesse. Gleichzeitig stellen sie ein erhebliches Risiko dar: Datenschutzverstöße führen nicht nur zu hohen […]
Beitragsbild Databricks Data Privacy: So schützen Sie Ihre Daten mit Databricks
Databricks Vor 2 Monaten

Data Privacy auf Databricks

Was Sie zum Schutz personenbezogener Daten wissen müssen Daten sind das Fundament moderner Analytics- und KI-Initiativen – gleichzeitig steigen die Anforderungen an Datenschutz, Compliance und Transparenz kontinuierlich. Unternehmen stehen vor der Herausforderung, personenbezogene Daten (PII) […]
Beitragsbild Agent Bricks von Databricks
Databricks Vor 3 Monaten

Agent Bricks Databricks: KI-Agenten bauen und optimieren

Vielleicht kennen Sie das Problem: Sie haben viele Daten mit wertvollen Informationen, haben aber keine Zeit diese manuell auszuwerten? Mit Agent Bricks hat Databricks ein neues Feature veröffentlicht, das genau […]
Beitragsbild Databricks One
Databricks Vor 5 Monaten

Databricks One: Was steckt dahinter?

Databricks war in der Vergangenheit stark technisch orientiert; das ändert sich jetzt mit Databricks One. Zuvor richteten sich viele Funktionen an technisch erfahrene Engineers, die Pipelines bauen, SQL schreiben oder […]
Beitragsbild: Databricks Sizing
Databricks Vor 5 Monaten

Databricks Kostenschätzung: So ermitteln Sie Ihre laufenden Databricks-Kosten

Databricks ist eine leistungsstarke Plattform für Datenanalyse und KI. Doch viele Unternehmen unterschätzen die laufenden Betriebskosten. Zu oft fehlt ein klarer Überblick darüber, welche Workloads welche Ressourcen verbrauchen – und […]
Beitragsbild Databricks FinOps
Databricks Vor 6 Monaten

FinOps auf Databricks: Kosten verstehen, steuern und optimieren 

Viele unserer betreuten Kunden stehen vor ähnlichen Herausforderungen: mehr Databricks Use-Cases werden umgesetzt und neue Nutzer kommen auf die Plattform und somit steigen die monatlichen DBU-Kosten.  Genau hier setzt FinOps […]
Beitragsbild Power BI Integration in Databricks
Databricks Vor 7 Monaten

Power BI und Databricks: die wichtigsten Integrationspfade

Die Integration von Power BI und Databricks ist ein zentrales Thema in vielen Unternehmen, da sie den Brückenschlag zwischen einer skalierbaren Datenplattform und flexibler Business-Intelligence (BI) ermöglicht. Als Partner von […]
Beitragsbild: Delta Sharing
Databricks Vor 7 Monaten

Databricks Delta Sharing – Am Beispiel von Zalando

Databricks hat mit Delta Sharing ein offenes Protokoll geschaffen, das den Austausch von Daten zwischen Unternehmen sicher und zuverlässig ermöglicht. Bisher waren die verfügbaren Data Sharing-Methoden fragmentiert: SFTP-Transfers, CSV-Dateien, APIs oder proprietäre […]
Newsletter und Updates

Sie sehen gerade einen Platzhalterinhalt von HubSpot. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Mehr Informationen
Erstgespräch vereinbaren