Databricks: Kostenmodell einfach erklärt 

Sie möchten mit Databricks starten, sind sich aber nicht sicher, welche Kosten sich dadurch ergeben? Dieser Beitrag soll Ihnen als Guide für alle Kosten rund um Databricks dienen, damit Sie im Anschluss folgende Frage beantworten können: Ist Databricks wirklich kostengünstiger gegenüber anderen Datenplattformen? 

Ist Databricks kostengünstig? 

Die Antwort auf die Frage lautet: Wie viele Daten wollen Sie verarbeiten und wie intensiv soll die Nutzung der Plattform sein?  

Das Kostenmodell von Databricks basiert auf dem pay-as-you-go Modell: Abgerechnet wird nur das, was auch genutzt wird. Diese Abrechnung folgt pro Sekunde in so genannten Databricks Units. Sie brauchen sich um keine Vorabkosten oder wiederkehrenden Verträge sorgen machen, dennoch gibt es einige Punkte zu beachten.  

Zunächst kommt es darauf an, für welches Service-Level Sie sich entscheiden: Standard oder Premium. Mit dem Standard-Tarif erhalten Sie eine Plattform für Datenanalysen und Machine Learning Workloads. Mit dem Premium-Tarif erhalten Sie diese Features für Ihr gesamtes Unternehmen. 

Neben dem Tarif entscheiden Sie sich für einen Compute-Type: 

  • Jobs  
  • SQL  
  • All-Purpose 
  • Serverless  

Zu guter Letzt sind die Kosten für den Cloud-Server Ihrer Wahl zu berücksichtigen. Databricks bietet hier die Zusammenarbeit mit AWS, Microsoft Azure und GCP an. 

Solange Ihr Computer-Cluster aktiv ist, verbraucht Databricks DBUs und rechnet diese pro Sekunde ab. Was sind DBUs? 

Was sind Databricks Units? 

Databricks Unit (DBU) ist eine Einheit, mit welcher Databricks die Menge an Rechenleistung misst, die Sie pro Stunde auf der Lakehouse-Plattform verwenden. Dabei folgt die Abrechnung auf Basis der Nutzung pro Sekunde.  

Damit Sie eine Vorstellung von dem bekommen, was Sie später zahlen, multiplizieren Sie die Anzahl der genutzten DBUs mit dem Preis pro DBU.  

Wie viele DBUs ein jeweiliger Workload verbraucht, hängt von mehreren Faktoren ab, unter anderem: 

  • Wie viel Speicher verwenden Sie? 
  • In welcher Region befinden Sie sich? 
  • Welche Menge an Daten verarbeiten Sie? 

Welche Funktionen bietet Databricks für die Kosten? 

Databricks bietet eine leistungsstarke Cloud-Datenplattform, die für Datenexperten wie Data Engineers und Data Scientists bestens geeignet ist. Besonders das Data Lakehouse dient den Datenexperten als Plattform, auf denen sich Daten sowohl skalieren als auch mit ACID-Complience weiterverwenden lassen. Denn das Lakehouse vereint die Vorteile der beiden Konzepte Data Lake und Data Warehouse miteinander.  Weitere Informationen zum Data Lakehouse finden Sie in unserem Beitrag zum Data Lakehouse Ansatz.

Durch eben diese Datenarchitektur eignet sich Databricks besonders für die Grundlage des Aufbaus von anspruchsvollen Datenanalysen, Künstlicher Intelligenz und maschinellem Lernen. Databricks legt in der Marketingstrategie besonderes Augenmerk auf die geringen Kosten, die bei der Verwendung des Lakehouses entstehen.  

Ob Sie Databricks mit diesen Funktionen als kostengünstig einstufen, sollten Sie im Zusammenhang mit den eben genannten Variablen bewerten. 

Wie rechnet Databricks ab? 

Databricks rechnet – zusätzlich zu dem Server – nach der Menge der verbrauchten Rechenressourcen in so genannten Databricks Units (DBUs) ab. Es handelt sich bei dem Databricks Kostenmodell um einen On-Demand-Tarif, das heißt Sie zahlen für das, was Sie verbrauchen. Databricks Abrechnungsmodell arbeitet mit einer sekundengenauen Abrechnung und es entstehen keine Vorabkosten oder wiederkehrende Verträge. 

Daraus ergibt sich folgende Rechnung: 

Kosten Databricks= (Anzahl Server*DBU)*h/Nutzung + (Anzahl Server*Instanzenpreise)*h/Nutzung 

Wenn Sie Databricks kostenlos, aber mit eingeschränkten Funktionen nutzen möchten, z. B. um Ihr Datenteam zu schulen, können Sie die Databricks Community Edition (vollständig quelloffen) verwenden. Databricks bietet eine kostenlose 14-tägige Testversion an, wenn Sie die Software ausgiebig ausprobieren möchten. 

Sie können jedoch auf zwei Arten Rabatte auf den Standardtarif erhalten (On-Demand-Preise): 

  1. Sie verpflichten sich zu einer bestimmten Nutzungsmenge; je höher Ihre Verpflichtung, desto höher Ihr Rabatt. Außerdem können Sie den Rabatt über mehrere Clouds hinweg nutzen. 
  1. Verwenden Sie Spot-Instances, wann immer dies möglich ist, um bis zu 90 % Rabatt auf den On-Demand- oder Standardtarif zu erhalten. Databricks rechnet pro Databricks Unit (DBU) ab. 

Wir haben einen ganzen Beitrag zum Thema Kostenoptimierung bei Databricks veröffentlicht.

Fazit 

Databricks ist eine Cloud-Plattform, weshalb die Kosten von der konkreten Nutzung abhängen. Sie müssen somit zum einen die Kosten des jeweiligen Cloudanbieters (Microsoft, AWS, etc.) berücksichtigen und zum anderen dass die konkreten Nutzungskosten in DBUs abgerechnet werden.  

Somit gibt es keine eindeutige Antwort auf die zu Beginn gestellte Frage. Databricks ist je nach Nutzung günstiger oder teuer als andere Anbieter. 

Sie haben weitere Fragen zum Thema Databricks? Dann wenden Sie sich gerne jederzeit an uns

Ihr Kontakt: Vinzent Wuttke

Unternehmen sitzen auf einem ungenutzten Berg von Kundendaten. Wir von datasolut entwickeln KI, die Ihr Marketing optimiert. Damit Sie dem richtigen Kunden zur richtigen Zeit das richtige Angebot machen können.

Auch interessant für Sie