Machine Learning Feature Store in der Telekommunikationsbranche

Machine-Learning-Projekte sind komplex und oft sehr teuer. Dies liegt insbesondere an der aufwendigen Vorverarbeitung der Daten. Eine Herausforderung ist die konsistente und qualitätsgesicherte Speicherung der Daten sowie die Bereitstellung für unterschiedlichste Data Scientists.

Aus diesem Grund ist der Einsatz eines Machine Learning Feature Stores ein zentraler Bestandteil jeder Data Science Plattform.

Welche Prozesse der Einsatz eines Feature Stores strukturiert und welche zahlreichen Vorteile ein solcher ML Feature Store mit sich bringt, erfahren Sie im folgenden KI Use Case.

In diesem Praxisbeispiel stellen wir Ihnen vor, wie wir für ein Telekommunikationsunternehmen einen Machine Learning Feature Store implementiert, Machine Learning skalierbar gemacht und damit das Data Science Team erfolgreich entlastet haben.

Auf einen Blick:

  • Branche: Telekommunikation
  • Projektziel: Time-to-Value für ML-Projekte reduzieren und Produktivität des Data Science Team steigern durch Feature Store

Machine-Learning-Infrastruktur ohne Feature Store

Zahlreiche KI-basierte Vorhersagen unterstützen bereits die Marketing- und Vertriebsprozesse unseres Kunden, einem führenden Telekommunikationsunternehmen mit Sitz in Köln. Die Vorhersagen ermöglichen es, zukünftige Ereignisse wie Tarifwechsel auf Basis von Daten aus der Vergangenheit abzuschätzen.

Unter anderem können so Vertragskündigungen, Abschlussaffinitäten oder auch die Häufigkeit von Kundenanfragen besser eingeschätzt werden.

Das Ergebnis ist vielversprechend, aber die Entwicklung solcher Prognosetools ist nicht einfach.

Vor diesen Herausforderungen stand unser Kunde

Hohe Komplexität

Ein KI-System ist extrem komplex und erfordert einen hohen manuellen Aufwand. Das Data Science Team ist stark damit beschäftigt, verschiedene Datenquellen zu verwalten, Metadaten zu pflegen und Datenquellen zu verfolgen, anstatt sich auf das eigentliche Modelltraining zu konzentrieren.

Skalierbarkeit & Zeitaufwand

Ein großer Teil der wertvollen Zeit geht bei der Datenaufbereitung verloren. Projekte und Anwendungen des maschinellen Lernens sind daher teuer und schwer skalierbar. Dies liegt unter anderem an mangelnder Datenqualität und langen Entwicklungszyklen.

Ineffiziente Datenaufbereitung

Die ML-Infrastruktur ist nicht standardisiert und wenig skalierbar. Unterschiedliche Modelle greifen auf dieselben Datenquellen zu, was zu einem hohen Aufwand bei der Datenaufbereitung und zu doppeltem Programmcode führt. Dies erhöht das Fehlerpotential erheblich.

ML Feature Store steigert Effizienz und Qualität

Unser Ziel war es, mit dem Feature Store ein System zu implementieren, das das Data Science Team entlastet. Außerdem wollten wir, dass das System die Features so speichert, dass ein strukturiertes, standardisiertes und automatisiertes Arbeiten mit den Datenquellen möglich ist.

Das Ergebnis waren rund 800 qualitativ hochwertige Features – und das täglich. Neben diesem Erfolgserlebnis konnte auch die Effizienz des Data Science Teams massiv gesteigert werden, da mit dem Feature Store nicht nur besser, sondern auch schneller gearbeitet werden kann.

Nach der Implementierung des Machine Learning Feature Store in der Telekommunikationsbranche konnte auch ein Rückgang der Ausgaben für neue Data Science Projekte verzeichnet werden.

Wie gehen wir dabei vor?

1.

Planung

Ziele und Anforderungen definieren, Stakeholder einbinden, Technologie und Architektur auswählen.

2.

Implementierung

Dateninfrastruktur vorbereiten, Funktionalitäten entwickeln, Automatisierung und Integration sicherstellen.

3.

Optimierung

Testen, Monitoring implementieren, Feedback einholen, kontinuierliche Optimierung, Dokumentation und Schulung.

Wie funktioniert der Feature Store?

Um den Überblick über die Data Science Projekte zu behalten, wurde ein einheitlicher Machine Learning Feature Store entwickelt. Dadurch konnten 800 qualitativ hochwertige Features pro Tag identifiziert werden. Angetrieben von den bereits beschriebenen Problemen entwickeln wir einen Feature Store für das Telekommunikationsunternehmen. Wir nutzen zentrale Datenspeicher für Lerndaten, um eine optimale Skalierbarkeit zu erreichen und somit die Effizienz von ML-Anwendungen zu steigern. Der Feature Store dient als zentraler Datenspeicher zur Verwaltung von Daten und Features, die während des Data Science Prozesses aufbereitet werden. In diesem Datenspeicher stellen die Data Science Mitarbeiter die kuratierten Daten bereit.

Michelangelo Ubers Machine Learning Plattform

Die Nutzung des Feature Stores bringt nicht nur teaminterne Vorteile mit sich (bessere Koordination und effizientes Zeitmanagement), sondern auch in Bezug auf die Qualität. Durch die Speicherung der Features im Store wird der Prozess des Model Deployments standardisiert, da hier die gleiche Logik wie im Lernprozess verwendet wird und somit eine konsistente Plattform entsteht.

Die folgende Grafik zeigt, dass die Features nun durch den Feature Store strukturiert zur Verfügung stehen – unabhängig von den Modellen.

Machine Learning mit Feature Store Beispiel Architektur

Die folgende Tabelle zeigt ein Flatfile mit den für den Telekommunikationssektor verwendeten Merkmalen:

Zielvariablen 
Wechsel in Produkt x 
1=Kunde hat gewechselt 2=Kunde hat nicht gewechselt 
Kundenstammdaten 
Geburtsdatum 
Geschlecht 
Tage seit Anlage 
Alter des Kunden zum Stichtag 
Geschlecht des Kunden 
Tage seit Anlage des Kunden 

Transaktionshistorie 
Anzahl aktive Verträge und Optionen Vertragsalter (bestehender Vertrag) 
Umsatz nach Zeitperiode 
Rabatte nach Zeitperiode 
Nutzungsentgelte nach Zeitperiode Veränderung Nutzungsgelte zum Vormonat  

Endgeräte-Flag 
Hersteller des genutzten Endgerätes 
Tage seit Letztkauf 
Gebuchtes Datenvolumen 
Zusätzlich gebuchtes Datenvolumen 
Verbrauchtes Datenvolumen nach Zeitperiode 

Anzahl aktiver Verträge zum Stichtag 
Alter des Vertrags in Monaten 
Nettoumsatz z.B. letzte 1/3/6 Monate 
Rabatte z.B. letzte 1/3/6 Monate 
Nutzungsentgelte z.B. letzte 1/3/6 M. 
Veränderung Nutzungsgelte im Vergleich zum Vormonat 

Vertrag in Kombination mit Handy gekauft? 
Herstellername des Endgerätes 
Tage seit letzter Bestellung v. Kunde 
Monatl. Verfügbares Datenvolumen 
Zusätzl. Datenvolumen letzte 1/3/6 Monate 
Verbr. Datenvolumen letzte 1/3/6 Monate 

Verhaltensdaten aus Website und mobiler App 
Anzahl Sessions nach Zeitperiode  
Anzahl Besuche nach Produktdetailseiten und Zeitperiode 
Anzahl Warenkörbe nach Zeitperiode 

Anzahl Sessions innerhalb der letzten 30/90/180 Tage Anzahl Besuche innerhalb der letzten 30/90/180 Tage 
Anzahl Warenkörbe innerhalb der letzten 30/90/180 Tage 

Vorteile eines ML-Feature Stores

Nach der Implementierung des Feature Stores konnte auch ein Rückgang der Ausgaben für neue Data Science Projekte verzeichnet werden. Wie die folgende Grafik zeigt, kann durch die Speicherung der Daten im Feature Store die Anzahl der Features über die Zeit erhöht und die Kosten für neue Data Science Projekte gesenkt werden.

Abschließend lässt sich sagen, dass Machine Learning Feature Stores viele Probleme von Data Science Projekten adressieren und durch die damit einhergehende Automatisierung eine große Effizienzsteigerung schaffen.

Kostenreduktion in Data Science Projekten durch einen ML Feature Store

Kostenreduktion in Data Science Projekten durch einen Machine Learning Feature Store in der Telekommunikationsbranche

Diese Ergebnisse konnten wir erzielen:

Effizienter Einsatz von Data Scientists

Durch die Zentralisierung und Automatisierung von Prozessen können Data Scientists den Zeitaufwand für repetitive Aufgaben deutlich reduzieren. Dadurch können sie sich auf komplexere und wertschöpfende Aufgaben konzentrieren.

Hoher Automatisierungsgrad

Die Plattform ermöglicht die Automatisierung von Validierungsprozessen, was nicht nur die Qualitätssicherung von Features verbessert, sondern auch zu einem automatischen Re-Training von Modellen führen kann. Dies erhöht die Effizienz und Zuverlässigkeit von Anwendungen des maschinellen Lernens.

Skalierbarkeit und Zentralisierung

Eine zentrale ML-Datenbank erhöht die Effizienz des Teams, da Probleme wie unübersichtliche Codeskripte und Datenpipeline-Dschungel vermieden werden. Neue Projekte und Modelle können schneller skaliert und implementiert werden, da die notwendige Infrastruktur und standardisierte Prozesse bereits vorhanden sind.

Welche Probleme konnten durch eine KI-gestützte Selektion vermieden werden? 

  • Ineffiziente Nutzung des Marketing Budgets
  • Komplexe Selektionslogiken, die nicht auf den zukünftigen Wert des Kunden einzahlen
  • Ungenutztes Umsatzpotenzial

Dieser Artikel hat Sie inspiriert, auch mit einem ML Feature Store zu arbeiten? Dann kontaktieren Sie uns!

Profilbild von Vinzent Wuttke Geschäftsführer Datasolut GmbH
Vinzent Wuttke
Geschäftsführer

Ihr Ansprechpartner

Ob und wie künstliche Intelligenz Ihnen weiterhelfen kann, können Sie in einem ersten, unverbindlichen Gespräch mit uns herausfinden.

In diesem Gespräch erfahren Sie:

  • Wie Ihr Use-Case technisch am besten umgesetzt werden kann
  • Wie wir maximal sicher mit Ihren Kundendaten umgehen
  • Wie lange wir für die Umsetzung benötigen und wie ein konkreter Projektplan aussehen könnte
Jetzt Erstgespräch vereinbaren
Newsletter und Updates

Sie sehen gerade einen Platzhalterinhalt von HubSpot. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Mehr Informationen
Erstgespräch vereinbaren