Databricks Genie Code: So automatisiert der KI-Agent deine Data-Arbeit

KI-Assistenten im Arbeitsumfeld gibt es schon seit einiger Zeit. Was Databricks mit Genie Code im März 2026 vorgestellt hat, geht jedoch weit darüber hinaus, was bisher unter „Code-Completion“ verstanden wurde. Genie Code ist ein autonomer KI-Agent, der Entwickler durch den gesamten Workflow begleiten kann. Von der Datensuche über das Modell-Training bis zur Pipeline-Erstellung in Produktion ist alles möglich.

Wer in der Databricks-Plattform täglich Notebooks schreibt, Pipelines baut oder ML-Modelle trainiert, kennt das Gefühl: Ein Großteil der Arbeitszeit geht nicht für das eigentliche Problem drauf, sondern für Vorstufen. Die richtige Tabelle finden. Exploratory Data Analysis manuell aufsetzen. Deployment-Fehler iterieren. Dashboards zusammenklicken.

Genau hier setzt Databricks Genie Code an: ein autonomer KI-Agent, der direkt im Databricks-Workspace lebt und uns durch den gesamten Workflow begleitet, von der Datenfindung über Modell-Training bis zur Pipeline-Erstellung in Produktion.

In diesem Artikel erfahren Sie, was Genie Code ist, wie es sich vom bekannten Genie (Spaces) abgrenzt und was das in der Praxis bedeutet. Außerdem geben wir eine ehrliche Einschätzung zu den aktuellen Grenzen.

Genie vs. Genie Code: Zwei Produkte für zwei Welten

Bevor wir in die Funktionalitäten einsteigen, ist eine Abgrenzung wichtig, die in der Praxis häufig zu Verwirrung führt.

Genie richtet sich an Business User. Es bietet eine einfache Chat-Oberfläche: Ein Analyst oder Manager stellt Fragen in natürlicher Sprache, Genie antwortet mit Tabellen, Charts oder Text direkt aus den Unternehmensdaten auf Databricks (diese liegen im Unity Catalog).

Das coole: es sind keine SQL-Kenntnisse und kein Umweg über das IT-Team erforderlich. Mehr dazu in unserem Artikel zur Databricks AI/BI-Plattform.

Architektur-Schaubild von Genie und Genie Code. Als KI-Agenten von Databricks verbinden sie Business- und technische Nutzer mit Lakehouse, Lakebase und Lakeflow über KI mit Data Intelligence.

Genie Code hingegen ist ein Produkt für Entwickler auf der Databricks Plattform, die täglich mit Notebooks, Pipelines und Modellen arbeiten. Das Ziel: die Arbeit von Entwicklern zu beschleunigen.

Genie Code schreibt Code, führt ihn aus, interpretiert Ergebnisse, korrigiert Fehler eigenständig und plant autonome Workflows, und das alles in der vertrauten Databricks-Umgebung.

	Genie	Genie Code
Zielgruppe	Business User	Data Practitioners (Engineers, Scientists, Analysts)
Kernfunktion	Natürlichsprachliche Fragen & Antworten über Daten	Dinge mit Daten bauen
Interaktion	Fragenstellen, Antworten lesen	Notebooks schreiben, Pipelines bauen, Modelle trainieren
Technische Tiefe	Niedrig	Hoch
Setup	Keine Installation	Keine Installation

Beide Produkte teilen eine gemeinsame Intelligence-Schicht: den Kontext und das Wissen aus dem Databricks-Workspace, insbesondere aus Unity Catalog.

Was Genie Code in der Praxis kann: Der vollständige Data-Workflow

Um die Stärke von Genie Code zu verstehen, ist ein konkretes Demo-Szenario hilfreicher als abstrakte Feature-Listen. Databricks hat bei der Produktvorstellung einen End-to-End-Workflow gezeigt, der sich von der Datenfindung bis zum produktiven Dashboard zieht. Wir haben diesen Workflow für Sie nachgebaut und kommentieren ihn aus der Praxis-Perspektive.

Schritt 1: Intelligente Datensuche (Data Discovery)

Der erste und oft zeitaufwändigste Schritt in jedem Data-Projekt ist die Frage: Welche Tabelle brauche ich eigentlich? Bisher bedeutete das: Katalog durchsuchen, Kollegen fragen, Dokumentation lesen.

Genie Code löst das agentisch: Der Nutzer beschreibt in natürlicher Sprache, was er analysieren möchte, zum Beispiel Flugverspätungen nach Airline und Route. Genie Code durchsucht eigenständig den Unity Catalog, bewertet Tabellen anhand von

Beschreibungen,
Lineage
und Code-Samples

und gibt eine priorisierte Empfehlung mit Begründung.

Das funktioniert umso besser, je vollständiger die Unity-Catalog-Metadaten sind. Hier zeigt sich einer der wichtigsten Schneeballeffekte: Wer in Tabellenbeschreibungen und Spaltenkommentare investiert, bekommt von Genie Code bessere Ergebnisse und wird dadurch motiviert, die Metadaten weiter zu verbessern.

Ein Aspekt, der in Kundengesprächen regelmäßig überrascht: Genie Code wirkt besonders stark bei Nutzern, die Databricks bislang wenig oder zögerlich genutzt haben. Wer bisher einfache SQL-Abfragen geschrieben hat, erledigt plötzlich explorative Datenanalyse, Modell-Training und Pipeline-Bau im selben Workflow, weil der Agent die Komplexitätshürden überbrückt.

Es befähigt auch nicht technische Nutzer auf einmal komplexe Probleme zu lösen.

Schritt 2: Explorative Datenanalyse (EDA)

Ein einzelner Prompt reicht für den nächsten Schritt: „Führe eine EDA auf diesem Datensatz durch und identifiziere fünf interessante Insights.“

Was dann passiert, geht über klassische Code-Completion hinaus. Genie Code erstellt bei komplexen Aufgaben einen transparenten Agent Plan beziehungsweise eine sichtbare Schritt-für-Schritt-Liste der geplanten Aktionen (z.B. „Sample data“, „Deep-dive analyses“, „Visualize and summarize“). Beim ersten Code-Ausführen fragt der Agent nach Erlaubnis; danach kann der Nutzer „Always Allow“ für ein schnelleres Arbeiten aktivieren.

Bei unseren Projekten sehen wir, dass genau dieser Kontrollmechanismus das Vertrauen in den Agenten erhöht: Man gibt Verantwortung ab, behält aber Transparenz. Das Ergebnis: Mehrere Notebook-Zellen mit Python-Code, Visualisierungen und einem strukturierten Insight-Bericht innerhalb weniger Minuten.

Schritt 3: Modell-Training und Deployment

Auf Basis der EDA kann der Nutzer direkt fragen: „Sind wir bereit für ein Predictive Model, oder brauchen wir mehr Exploration?“ Genie Code analysiert die vorliegenden Daten, benennt Probleme wie Class Imbalance und schlägt konkrete Pre-Modeling-Checks vor. Nach der Bestätigung trainiert der Agent ein Modell, zusätzlich werden alle Schritte in MLflow getrackt.

Besonders beeindruckte uns im Deployment-Schritt: Wenn beim Ausrollen des Serving Endpoints eine fehlende Dependency auftritt, erkennt Genie Code den Fehler, fügt die Dependency eigenständig hinzu und wiederholt den Versuch ohne zusätlichen Nutzereingriff. In unserem Test haben wir beobachtet, dass der Agent auch bei mehreren aufeinanderfolgenden Fehlern weitermacht, analysiert und iteriert. Das schafft Vertrauen.

Schritt 4: Dashboard-Erstellung und Pipeline-Bau

Genie Code ist nicht auf Notebooks beschränkt. Im AI/BI Dashboard-Bereich erstellt er auf Anfrage Datensätze, Charts und Layouts. Besonders nützlich: Der Agent kann auf Assets aus anderen Bereichen Bezug nehmen, also etwa das EDA-Notebook als Kontext nutzen, wenn er ein Dashboard zu denselben Daten baut.

Im Lakeflow Designer schlägt Genie Code eine Pipeline-Struktur vor (Bronze/Silver/Gold-Architektur), erstellt die entsprechenden Dateien und Ordner und führt eigenständig einen Dry Run durch. Auch hier gilt: Fehler werden ohne Nutzereingriff identifiziert und korrigiert.

Machen Sie Databricks zu Ihrem Wettbewerbsvorteil

Genie Code entfaltet seine volle Wirkung auf einer sauber aufgebauten Datenbasis. Wenn Sie wissen möchten, wo Ihr Workspace heute steht und welche Schritte den größten Effekt hätten, sprechen Sie mit uns.

Kostenlose Erstberatung sichern

Die Grundlage: Unity Catalog als Sicherheits- und Intelligenz-Schicht

Ein kritischer Aspekt, der bei der Produktbeurteilung oft unterbewertet wird: Genie Code ist nicht losgelöst von der bestehenden Governance-Infrastruktur. Er operiert strikt innerhalb der Unity-Catalog-Berechtigungen des jeweiligen Nutzers. Der Agent hat keinen Zugriff auf Daten, auf die der Nutzer selbst keinen Zugriff hat und kann keine Aktionen ausführen, für die die entsprechenden Rechte fehlen.

Das adressiert eine häufige Sorge, den wir von unseren Kunden als Feedback bekommen: „Wir wollen nicht, dass ein Large Language Model uneingeschränkt auf unsere Daten zugreift.“ Die Antwort lautet: Genie Code sieht genau das, was Sie auch sehen, nicht mehr und nicht weniger. Für potenziell destruktive Aktionen, bei denen etwas zerstört oder unwiderruflich verändert werden könnte, gibt es zusätzliche LLM-Guardrails, die diese Aktionen kontrollieren oder absichern.

Für Databricks-Nutzer, die Unity Catalog noch nicht vollständig ausgebaut haben, ist das ein starkes Argument, in die Metadatenpflege zu investieren. Gut beschriebene Tabellen, klare Spaltenkommentare und saubere Lineage verbessern nämlich direkt die Qualität der Genie-Code-Antworten.

Warum Lakehouses die Daten-Architektur der Zukunft sind

In unserem Whitepaper erfahren Sie:

Wie sich ein Data Lakehouse von anderen Architekturen unterscheidet.
Wie Sie durch ein Lakehouse KI-Anwendungen schneller umsetzen.
Wie Sie ihr internes Team befähigen selbstständig KI Projekte zu implementieren.

Jetzt herunterladen

Anpassung: MCPs, Instructions und Skills

Genie Code ist out-of-the-box einsatzbereit, aber der echte Enterprise-Mehrwert entsteht durch gezielte Konfiguration.

Dazu stehen drei Mechanismen zur Verfügung:

1. MCPs (Model Context Protocol)

Auch externe Tools lassen sich in Genie Code einbinden: Confluence, Jira, GitHub, Google Drive, Glean und weitere. Damit kann der Agent Kontext von außerhalb Databricks nutzen oder dort Aktionen ausführen.

Ein Beispiel:

In Confluence pflegen viele Unternehmen ihre internen Entwicklungsrichtlinien. Dazu gehört etwa, welche Felder in bestimmten Datenbereichen nicht gespeichert werden dürfen, wie Tabellen benannt werden sollen oder welche Qualitätsprüfungen bei jeder neuen Pipeline Pflicht sind.

Ohne MCP-Anbindung kennt Genie Code diese Regeln nicht und muss jedes Mal explizit darauf hingewiesen werden. Mit der Confluence-Anbindung liest der Agent die relevante Dokumentation beim Pipeline-Bau eigenständig aus und hält sich automatisch daran — ohne dass der Data Engineer die Vorgaben im Prompt wiederholen muss.

Sowohl Managed MCPs als auch Custom MCPs (als Databricks Apps) sind möglich.

2. Instructions

Bei Instructions handelt es sich um Markdown-Dateien, die bei jedem Prompt an Genie Code übergeben werden. Ideal für diese persistenten Standards: Variable-Naming-Conventions, bevorzugte Libraries oder auch häufig genutzte Flags. Es gibt zwei Ebenen:

User Instructions: Persönliche Präferenzen, die nur für den eigenen Account gelten
Workspace Instructions: Unternehmensweite Standards, die vom Admin für den gesamten Workspace gesetzt werden

Der einfachste Weg, diese Instructions zu pflegen, ist es, dem Agenten zu sagen „Merke dir X“. Dann fügt er es automatisch zur Instructions-Datei hinzu.

3. Agent Skills

Agent Skills sind ein System persistenter Standards, das über Markdown-Dateien aufgabenspezifische Konventionen festhält, wie zum Beispiel ML-Workflow-Standards oder Vorgaben für einen bestimmte Pipeline-Typ.

Dabei kann der Agent selbstständig entscheiden, welche Skill-Datei für die aktuelle Aufgabe relevant ist und lädt nur diese, anstatt bei jedem Prompt sofort jede Skill-Datei zu laden. So bleibt das Kontextfenster schlank und übersichtlich, was Ressourcen spart und außerdem die Qualität der Ergebnisse verbessert.

Genie Code vs. Claude Code: Für welchen Workflow eignet sich was?

In Kundenprojekten kommt regelmäßig die Frage: Brauchen wir Genie Code überhaupt, wenn wir bereits externe KI-Coding-Agenten wie Claude Code im Einsatz haben?

Lassen Sie uns die Frage klären:

Claude Code ist Anthropics allgemeiner Coding-Agent. Er läuft im Terminal, per CLI-Installation, als Desktop-App und als VS-Code- bzw. JetBrains-Extension, also unabhängig von jeder spezifischen Plattform. Sein Stärkenfeld ist breite Software-Entwicklungsarbeit: Multi-File-Editing über komplexe Codebasen hinweg, Debugging, Refactoring, Test-Ausführung, Git-Integration.

Genie Code hingegen ist ein spezialisierter Agent für den Data-Practitioner-Workflow innerhalb von Databricks, ohne Installation und darüber hinaus direkt im Workspace aktiv. Sein struktureller Vorteil: Er kennt die eigenen Unternehmensdaten und alle Databricks Artifakte.

Über Unity Catalog hat er Zugriff auf Tabellenmetadaten, Lineage und Berechtigungen und nutzt diesen Kontext bei jeder Anfrage. Hinzu kommt die tiefe Integration in Notebooks, SQL Editor, Lakeflow Pipelines, AI/BI Dashboards und MLflow.

Kriterium	Genie Code	Claude Code
Einstieg	Zero Setup – direkt in Databricks aktiv	Installation per CLI, Desktop-App oder IDE-Extension
Primäre Oberfläche	Databricks Workspace (Notebook, SQL, Dashboard, Pipeline)	Terminal, VS Code, JetBrains, Desktop-App, Web
Datenzugang	Unity Catalog — Metadaten, Lineage, Berechtigungen nativ verfügbar	Kein nativer Zugriff; Datenbankkontext muss explizit mitgegeben werden
Stärke	End-to-End Data-Workflows im Databricks-Ökosystem	Breite Software-Entwicklung, komplexe Multi-File-Codebasen
Multi-File Editing	Noch eingeschränkt (in Entwicklung)	Stärker bei komplexen Repo-Strukturen
Governance	UC-Berechtigungen gelten automatisch	Kein integriertes Governance-Modell
MCP-Integration	Managed + Custom MCPs als Databricks Apps	MCP-Unterstützung vorhanden

Die ehrliche Einordnung: Beide Tools sind keine Konkurrenten, sondern für unterschiedliche Aufgaben optimiert. Data Engineers und Data Scientists, die täglich in Databricks arbeiten, bekommen mit Genie Code einen Agenten, der genau diesen Kontext kennt – ohne Vorbereitung und ohne Kontext-Briefing. Claude Code ist die sinnvollere Wahl für allgemeine Software-Entwicklungsaufgaben außerhalb des Databricks-Ökosystems.

Wir sehen bei unseren Databricks-Kunden typischerweise folgende Nutzerverteilung: Etwa die Hälfte der technischen Nutzer zögert noch, KI-Agenten aktiv zu nutzen. Die Hemmschwelle ist somit real. Etwa 40 Prozent haben Genie Code schnell getestet und berichten von einer messbaren Zeitersparnis. Nur ein kleiner Teil vergleicht aktiv beide Tools und benennt Feature-Gaps.

Aktuelle Limitierungen (Stand: Juni 2026)

Was Genie Code noch nicht vollständig beherrscht, lässt sich klar benennen:

Multi-File Editing: Das gleichzeitige Bearbeiten mehrerer Notebooks oder Notebook + Python Files ist noch nicht so smooth, wie man es sich wünscht.
Surface-Abdeckung: Nicht alle Bereiche von Databricks sind vollständig abgedeckt: Jobs, Ingestion, Lineage, Governance und einige ML-Tools fehlen noch.
Latenz: Es ist spürbar, aber laut Databricks hat sich das in den letzten Wochen deutlich verbessert. Es besteht jedoch weiterer Verbesserungsbedarf.
Thread Management: Alte Threads referenzieren oder durchsuchen ist noch nicht optimal gelöst.
Asset Search: Die Suche nach relevanten Assets für die aktuelle Aufgabe ist noch verbesserungsfähig.

Das sind keine Show-Stopper für die meisten Workflows, aber relevante Einschränkungen für Teams mit komplexen Multi-File-Projekten. Wer Bugs entdeckt, sollte das Bug-Icon am Ende einer Agenten-Antwort nutzen: Es kopiert eine Trace ID, die das Databricks-Team für die Fehleranalyse benötigt.

Roadmap: Wohin die Reise geht

Was Databricks in der Produkt Roadmap kommuniziert:

Background Agents: Künftig soll der Agent auch dann arbeiten, wenn der Laptop geschlossen ist: langläufige Pipeline-Builds, parallele Analysen und proaktive Untersuchungen.

Autopilot: Data Engineers verbringen heute viel Zeit mit Wartungsaufgaben wie Schema-Evolution, Abhängigkeits-Upgrades und Fehlerbehandlung in Jobs. Autopilot soll bei Job-Failures selbstständig die Ursache analysieren, Korrekturen vorschlagen, diese validieren und automatisch einen Pull-Request öffnen – und das, ohne dass der Ingenieur aktiv werden muss.

Agent-centric UX: Heute wechseln die Nutzer zwischen der Dashboard-, der Pipeline- und der Notebook-Seite. Die Vision: Es gibt nur einen Thread und der Agent koordiniert alles. Ein Prompt wie „Analysiere X, erstelle ein Dashboard und aktualisiere es wöchentlich” soll zu einem vollständig autonomen Workflow führen.

Fazit

Genie Code ist kein weiteres Autocomplete-Feature. Es beschleunigt den vollständigen Workflow für Databricks-Entwickler, von der Datensuche bis hin zum produktiven Dashboard. Wir sind teilweise selber überrascht wie gut Genie Code für Databricks spezifische Probleme funktioniert und unsere Arbeit deutlich beschleunigt.

Wer Databricks bereits nutzt, sollte drei Dinge priorisieren:

Unity Catalog mit sauberen Metadaten ausbauen,
Workspace Instructions frühzeitig definieren und
mit einem klar abgegrenzten Use Case starten. Der Hebel zeigt sich schnell – meistens schon im ersten vollständigen Workflow.

Vinzent Wuttke

Geschäftsführer

Ihr nächster Schritt mit uns!

Databricks ist eine der leistungsfähigsten Plattformen für Daten und KI – aber ihr volles Potenzial entfaltet sich erst, wenn Ihr Team sie wirklich beherrscht. Lassen Sie uns gemeinsam schauen, welche Schulungspakete zu Ihrer Ausgangssituation passen.

Im kostenlosen Erstgespräch klären wir:

Welche Rollen und Teams von welchem Paket am meisten profitieren
Ob und wie wir Inhalte auf Ihre Datenarchitektur und Use Cases anpassen
Wie ein realistischer Zeitplan und die nächsten Schritte aussehen

Erstgespräch vereinbaren

Häufige Fragen zu Databricks Genie Code

Was ist Databricks Genie Code?

Databricks Genie Code ist ein KI-Agent im Databricks-Workspace. Er begleitet Data Engineers, Data Scientists und andere technische Nutzer durch komplexe Daten-Workflows – von der Datensuche über das Modelltraining bis hin zur Pipeline-Erstellung. Er arbeitet kontextbewusst auf Basis von Unity Catalog und ist ohne zusätzliche Installation sofort einsatzbereit.

Was ist der Unterschied zwischen Genie (Spaces) und Genie Code?

Genie (Spaces) richtet sich an Business User ohne technisches Vorwissen: Sie stellen Fragen in natürlicher Sprache und erhalten direkte Antworten aus den Unternehmensdaten.

Genie Code ist für technische Nutzer: er schreibt und führt Code aus, trainiert Modelle, baut Pipelines und erstellt Dashboards. Beide teilen dieselbe Datenbasis, sind aber für grundlegend unterschiedliche Aufgaben gebaut.

Wie sicher ist Genie Code im Umgang mit Unternehmensdaten?

Genie Code operiert ausschließlich innerhalb der Unity-Catalog-Berechtigungen des jeweiligen Nutzers und hat somit keinen Zugriff auf Daten, auf die der Nutzer selbst auch keinen Zugriff hat. Für potenziell weitreichende Aktionen gibt es zusätzliche Sicherheitsmechanismen, die vor der Ausführung eine Bestätigung einfordern.

Brauche ich Genie Code, wenn ich bereits Claude Code oder Cursor nutze?

Das kommt auf den Anwendungsfall an. Allgemeine Coding-Agenten wie Claude Code sind für breite Software-Entwicklungsaufgaben gebaut und kennen Ihre internen Datenbankstrukturen nicht ohne expliziten Kontext. Genie Code ist spezialisiert auf den Data-Practitioner-Workflow in Databricks und versteht Ihren Workspace (Tabellenstruktur, Datenherkunft und Berechtigungen) von Hause aus. In der Praxis ergänzen sich beide.

Was kostet Databricks Genie Code?

Genie Code ist Bestandteil des Databricks-Workspace und erfordert keine separate Lizenz. Voraussetzung ist, dass die sogenannten „Partner Powered AI Features“ im Workspace aktiviert sind. Für spezifische Kostenfragen empfehlen wir, direkt mit Ihrem Databricks-Ansprechpartner oder einem zertifizierten Databricks-Partner zu sprechen.

Update: Ab Juli 2026 ändert sich das Pricing auf eine DBU und Nutzer basierte Abrechnung. Es gibt zwar ein Freikontigent, was allerdings schnell aufgebraucht sein könnte. Weitere Informationen

Funktioniert Genie Code auch ohne gepflegten Unity Catalog?

Ja, Genie Code ist grundsätzlich sofort nutzbar. Die Qualität der Antworten, insbesondere bei der Datensuche, steigt jedoch deutlich mit dem Ausbaugrad des Unity Catalog. Gut beschriebene Tabellen und Spalten sind keine Voraussetzung, aber ein klarer Vorteil.

Databricks Genie Code: So automatisiert der KI-Agent deine Data-Arbeit

Genie vs. Genie Code: Zwei Produkte für zwei Welten

Was Genie Code in der Praxis kann: Der vollständige Data-Workflow

Schritt 1: Intelligente Datensuche (Data Discovery)

Schritt 2: Explorative Datenanalyse (EDA)

Schritt 3: Modell-Training und Deployment

Schritt 4: Dashboard-Erstellung und Pipeline-Bau

Machen Sie Databricks zu Ihrem Wettbewerbsvorteil

Die Grundlage: Unity Catalog als Sicherheits- und Intelligenz-Schicht

Warum Lakehouses die Daten-Architektur der Zukunft sind

Anpassung: MCPs, Instructions und Skills

1. MCPs (Model Context Protocol)

2. Instructions

3. Agent Skills

Genie Code vs. Claude Code: Für welchen Workflow eignet sich was?

Aktuelle Limitierungen (Stand: Juni 2026)

Roadmap: Wohin die Reise geht

Fazit

Ihr nächster Schritt mit uns!

Häufige Fragen zu Databricks Genie Code

Weiterlesen

Databricks Summit 2026: Diese neuen Features sollten Sie jetzt auf Ihre Roadmap setzen

Databricks Genie Space: Einschätzung und Best-Practices

Microsoft Fabric vs. Databricks: Der Praxis-Guide

Alle Databricks Features im Überblick: Was die Plattform in 2026 wirklich kann

Datenschutz meistern: 9 Best Practices, die jedes Unternehmen kennen muss

Data Privacy auf Databricks

Agent Bricks Databricks: KI-Agenten bauen und optimieren

Databricks Genie: Was steckt dahinter?

Databricks Kostenschätzung: So ermitteln Sie Ihre laufenden Databricks-Kosten