Data Analytics mit SAP S/4HANA®

| Autor/in:hokomedia

SAP Predictive Analytics - Einsatzgebiete

1 Einleitung:

Nachdem im ersten Teil dieser Artikelserie die Änderungen der Datenbanktechnologie und des Datenmodells der SAP HANA DB gegenüber dem SAP ECC-System beschrieben sowie die neuen Transaktionen zur Durchführung von Tabellenanalysen vorgestellt wurden, geht es in diesem Beitrag um den Baustein SAP Predictive Analytics.

Abbildung 1: Data Analytics Werkzeuge in S/4HANA®- das Curriculum unserer Beitragsserie

Bevor dieser Baustein mit seinen Komponenten vorgestellt wird, soll in diesem Artikel ein kurzer Einblick in mögliche Einsatzgebiete der Predictive Analytics gegeben werden.

2 Data Analytics

Bei Data Analytics geht es darum Erkenntnisse aus Daten zu extrahieren. Der Begriff umfasst alle Prozesse, Werkzeuge und Techniken, die zu diesem Zweck zum Einsatz kommen. Aber auch das Sammeln, Organisieren und Speichern der Daten spielt eine wesentliche Rolle. Kurz gesagt: Das Ziel von Data Analytics ist es, mit Hilfe der vorhandenen Technologie, Datenverarbeitungsalgorithmen und statistischen Verfahren das Management im Entscheidungsfindungsprozess zu unterstützen.

Die vier verschiedenen Klassen von Data Analytics Methoden beantworten folgende Fragestellungen (siehe folgende Abbildung):

  1. Was ist in der Vergangenheit passiert? – Descriptive Analytics
  2. Warum ist das passiert? – Diagnostic Analytics
  3. Was wird in Zukunft geschehen? – Predictive Analytics
  4. Was ist das Beste was passieren kann? – Prescriptive Analytics
Abbildung 2: Die vier verschiedenen Klassen der Data Analytics Methoden – Quelle: SAP®

Descriptive Analytics

Wie der Name schon sagt, beschreibt die deskriptive Analyse (Descriptive Analytics) die Vergangenheit – man analysiert die Vergangenheit und versucht, daraus Erkenntnisse zu gewinnen, die die Zukunft beeinflussen werden.

Der erste Schritt in der deskriptiven Analyse ist die Datenintegration – Rohdaten aus verschiedenen Quellen integrieren, bereinigen und operative Standardberichte oder Ad-hoc-Berichte erstellen.

Meines Erachtens ist die deskriptive Analyse die Basis und das Fundament für die Analysefähigkeiten im Unternehmen – die erste Phase sollte darin bestehen, die Vergangenheit und die Ereignisse zu verstehen und aus den Daten Erkenntnisse zu gewinnen.

Diagnostic Analytics

Bei der diagnostischen Analyse (Diagnostic Analytics) geht es darum, die Gründe für frühere Ergebnisse zu verstehen. Nachdem man verstanden hat, was passiert ist, hilft diese Analyseform zu verstehen, was die Gründe und Ursachen für die Ergebnisse sind.

Bei der diagnostischen Analyse werden Techniken wie Drilldown, Datenermittlung, Data Mining und Visualisierungstools (wie Dashboards) eingesetzt. Sie identifiziert Muster, Trends und Segmentierungen und wendet statistische Modelle und Algorithmen an, um Korrelationen und Verbindungen zwischen verschiedenen Variablen zu verstehen.

Predictive Analytics

Bei der prädiktiven Analyse (Predictive Analytics) geht es um die Vorhersage der Zukunft, um die Beantwortung der Fragen “was wird passieren?” oder “was wird wahrscheinlich passieren?”.

Sie nutzt Techniken wie Regressionsanalyse, Prognose, multivariate Statistik und prädiktive Modellierung, um historische und aktuelle Daten zu analysieren und künftige Ergebnisse vorherzusagen und zu prognostizieren.

Zwar gibt es keinen Algorithmus mit 100-prozentiger Genauigkeit, aber die prädiktive Analytik zielt auf eine möglichst hohe Genauigkeit der Vorhersagemodelle ab.

Einige Beispiele für den Einsatz von Predictive Analytics in der Wirtschaft: Vorhersage von Kundenabwanderung, LTV (Life Time Value) der Nutzer, Betrugsaktivitäten, Umsatz und Nachfrage.

Prescriptive Analytics

Diese Art der Analyse ermöglicht das Empfehlen einer optimalen Strategie mit verschiedenen Maßnahmen – sie beantwortet die Frage “was ist das Beste, was passieren könnte” oder “was sollte getan werden”, indem sie das Ergebnis zukünftiger Maßnahmen quantifiziert und auf der Grundlage der Vorhersagen die besten Maßnahmen empfiehlt.

Mit einem Wort: Bei der präskriptiven Analytik geht es um Optimierung – Optimierung von Entscheidungen und zukünftigen Ergebnissen.

Die für die präskriptive Analytik verwendeten Tools sind Geschäftsregeln, Algorithmen, Simulationen, maschinelles Lernen und computergestützte Modellierungsverfahren. Diese Tools verwenden Daten aus verschiedenen Quellen, darunter Echtzeit- und historische Daten, Big Data und Transaktionsdaten.

Unter den verschiedenen Analysekategorien ist die präskriptive Analyse die komplexere, und die meisten Unternehmen setzen diese Techniken noch nicht ein. Diese Art der Analyse kann jedoch erhebliche Auswirkungen auf das Unternehmen haben.

In dem Maße, in dem das Unternehmen seine analytischen Fähigkeiten entwickelt und verbessert, wird es proaktiver und weniger passiv, und der Wert für das Unternehmen sowie der Wettbewerbsvorteil steigen ebenfalls.

In diesem Beitrag wird die Klasse 3 der Data Analytics Methoden vorgestellt. Es geht also um die Fragestellung „Was wird in Zukunft geschehen?

3 Predictive Analytics

Predictive Analytics ist ein Teilbereich des Data Minings, der sich ausschließlich mit der Vorhersage von Ereignissen und Trends beschäftigt. Das wesentliche Element von Predictive-Analytics-Ansätzen ist der Prädikator. Dies ist ein Merkmal, die für eine Person oder Einheit erhoben wird und auf deren Basis zukünftiges Verhalten vorhergesagt werden kann. Die ermittelten Prädikatoren werden in einem Vorhersagemodell kombiniert und anschließend kalibriert, so dass die Wahrscheinlichkeiten künftig eintretender Ereignisse mit einer akzeptablen Zuverlässigkeit vorhergesagt werden können.

3.1 Einige Praxisbeispiele

Pregnancy Prediction

Target ist nach WalMart der zweitgrößte Discounteinzelhändler der USA. Kleidung, Möbel, Spielzeug, Zahnpasta – dort gibt es alles und das möglichst billig. Vor einiger Zeit kam ein wütender Mann in eine Target-Filiale außerhalb von Minneapolis und wollte den Filialleiter sprechen. Er wedelte vor dessen Nase mit Rabattgutscheinen herum und beschwerte sich: “Meine Tochter hat die hier in ihrer Post gefunden. Sie ist noch in der Highschool, und Sie schicken Ihr Rabattmarken für Babysachen und Kinderbetten? Wollen Sie sie etwa ermuntern, schwanger zu werden?”

Der Filialleiter schaute sich die Gutscheine an, sie waren eindeutig an die Tochter des Mannes adressiert und priesen unter anderem Schwangerschaftsmode und Wickelkommoden an. Er entschuldigte sich wortreich für das Missverständnis. Ein paar Tage später rief er noch einmal bei dem Vater an, weil er noch einmal für den Ärger um Verzeihung bitten wollte. Zu seinem Erstaunen war der Vater reichlich beschämt und sagte: “Ich hatte ein längeres Gespräch mit meiner Tochter. Dabei musste ich feststellen, dass es Aktivitäten in meinem Haus gibt, von denen ich keine Ahnung hatte. Sie wird im August ein Kind bekommen. Und ich schulde Ihnen eine Entschuldigung.”
(Quelle: https://netzpolitik.org/2014/algorithmen-allmaechtig-freiheit-in-den-zeiten-der-statistik/)

Wie konnte Target diese Vorhersage treffen? Der Data Scientist Andrew Pole des Discounters beobachtete, wie sich die Einkaufsgewohnheiten einer Frau änderten, je näher ihr Geburtstermin rückte, den die Frauen in dem Register bereitwillig angegeben hatten. Er führte einen Test nach dem anderen durch und analysierte die Daten, und schon bald kristallisierten sich einige nützliche Muster heraus. Lotionen, zum Beispiel. Viele Menschen kaufen Lotionen, aber einem von Poles Kollegen fiel auf, dass die Frauen im Babyregister zu Beginn des zweiten Trimesters größere Mengen an unparfümierter Lotion kauften. Ein anderer Analyst stellte fest, dass schwangere Frauen in den ersten 20 Wochen vermehrt Nahrungsergänzungsmittel wie Kalzium, Magnesium und Zink kaufen. Viele Kunden kaufen Seife und Wattebäusche, aber wenn jemand plötzlich anfängt, zusätzlich zu Händedesinfektionsmitteln und Waschlappen jede Menge parfümfreie Seife und extragroße Beutel mit Wattebäuschen zu kaufen, ist das ein Zeichen dafür, dass der Geburtstermin kurz bevorstehen könnte.

Als Pole die Daten analysierte, konnte er etwa 25 Produkte identifizieren, die es ihm ermöglichten, jedem Käufer eine “Schwangerschaftsvorhersage” zuzuordnen. Noch wichtiger ist, dass er auch den Geburtstermin innerhalb eines kleinen Zeitfensters abschätzen konnte, so dass Target Coupons verschicken konnte, die auf ganz bestimmte Phasen der Schwangerschaft abgestimmt waren.

Amazon (Feinwaage)

Eine besondere „Kundenbindung“ zeigt folgendes Beispiel. Wer kennt es nicht: Man bestellt oder schaut sich bei Amazon einen Artikel an, dann bekommt man durch die Algorithmen der Predictive Analytics weiter unten unter der Rubrik „Kunden, die diesen Artikel gekauft haben, kauften auch“ weitere Produktempfehlungen, die man ebenfalls kaufen könnte.

Ist man einer Präzisionswaage interessiert, bekommt man auch Kaufempfehlungen für eine „Kräutermühle“ mit Hanfdeckel und den entsprechenden Blättchen. Hier scheinen also Dealer nicht nur die Feinwaage, sondern auch die entsprechenden Utensilien dazugekauft zu haben.

Es geht um Ähnlichkeit. Das Verhalten des einzelnen Kunden wird mit dem Verhalten der Zielgruppe verglichen und wenn es sich ähnelt, wird der Kunde auch zum Ziel, ob sie etwas damit zu tun haben, oder nicht. Sie können es nicht verhindern, Sie können es nicht beeinflussen, ja Sie erfahren es nicht einmal.

Abbildung 3: Kaufempfehlungen beim Kauf einer Präzisionswaage – Quelle: Amazon.de – Abruf am 29.08.21

Predictive Policing

Für Fans der Kurzgeschichte „The Minority Report“ von Phillip K. Dick (oder die Umsetzung als Film mit Tom Cruise aus dem Jahr 2002) dürfte das Konzept der prädiktiven Polizeiarbeit bereits bekannt sein. Diese Technologie war damals Science-Fiction ist aber zu großen Teilen heutzutage schon Realität geworden.

Zur Vorhersage von Methoden werden derzeit vier Methoden eingesetzt:

  • Vorhersage von Ort und Zeit, an denen es wahrscheinlich ist, dass Verbrechen auftreten werden
  • Vorhersage von Personen, die wahrscheinlich ein Verbrechen begehen werden
  • Vorhersage von Täterprofilen
  • Vorhersage von Personen oder demographischen Merkmalen, die mit hoher Wahrscheinlichkeit zu Opfern von Straftaten werden können

Die Basis der Vorhersagemodelle ist das Sammeln und Analysieren von zahlreichen Informationen. Beispiele hierfür sind historische Kriminalitätsdaten, Notrufaufzeichnungen, Wirtschaftsdaten und geografische Informationen (siehe nachfolgende Abbildung)

 

Abbildung 4: Beispiele für Prädiktoren im Predictive Policing – Quelle: Spiegel Online – Abruf am 28.08.21

Das System PredPol war eines der ersten Predictive Policing Systeme der Welt und ist der am häufigsten eingesetzte Predictive-Policing-Algorithmus der USA. In der folgenden Abbildung sehen wir links eine Heatmap der tatsächlich eingetretenen Kriminalfälle. Daraus wird eine Prognosekarte errechnet, die auf der rechten Seite zu sehen ist. Die Los Angeles Times berichtete, dass von den Polizeibeamten erwartet wird, dass sie während ihrer Schicht in diesen Gebieten patrouillieren, da das System ihre Bewegungen über das GPS in ihren Streifenwagen verfolgt.

Abbildung 5: Ein Beispiel für das Mapping-System von PredPol – Quelle: digital.hbs.edu – Abruf am 28.08.21

Kredit-Scoring

Auch bei der Vergabe von Krediten wird mit den Algorithmen der Predictive Analytics gearbeitet. Jedem Kunden wird aus der Erhebung bestimmter Kriterien (z.B. „Kunde seit“, „Wohnort“, „Straße“, „Beruf“, „Sicherheiten“, „Familienstatus“, „Anzahl Kinder“, „Schufa-Auskunft“) die anhand eines Fragebogens erhoben worden, ein Score berechnet, der eine Aussage darüber geben soll, mit welcher Wahrscheinlichkeit der Kunde den Kredit wieder zurückzahlen wird.

Diese regelbasierten Systeme werden mit den Kundendaten der Vergangenheit trainiert, um dann für den einzelnen Kunden eine Vorhersage über seine Kreditwürdigkeit zu berechnen.

Versicherungen oder Auskunfteien (wie Schufa) wenden ähnliche Verfahren ein. Apropos Schufa: Vor einigen Jahren hat die Schufa über ein Forschungsprojekt nachgedacht, Daten aus den sozialen Medien (Facebook, Twitter …) ebenfalls in das Scoring einzubeziehen.

4 Zusammenfassung und Ausblick

In diesem Beitrag wurde dargestellt, in welche vier Klassen sich Data Analytics Methoden einteilen lassen. Der Baustein SAP Predictive Analytics ist ein zentraler Baustein der Data Analytics Funktionalitäten der SAP HANA. An Beispielen aus verschiedenen Anwendungsgebieten wurde gezeigt, welche Vorhersagen durch die Anwendung von Algorithmen der Predictive Analytics möglich sind. SAP HANA stellt Funktionsbibliotheken und Softwarelösungen zur Verfügung, um diese Algorithmen in der Praxis anzuwenden.

In den nächsten Beiträgen werden drei Komponenten der SAP Predictive Analytics vorgestellt:

  • SAP Predicted Analytics®
  • PAL® (Predicted Analytics Library) und
  • SAP Analytics Cloud ® (SAC)

Zu Beginn wird im Folgebeitrag SAP Predictive Analytics mit seinen Funktionalitäten anhand von Beispielen aus dem Prüfungsalltag vorgestellt.

Abbildung 6: Startbildschirm von SAP Predictive Analytics ®

SAP Predictive Analytics ist eine Desktop Data-Mining-Anwendung für statistische Analysen, die es ermöglicht, Prognosemodelle zu entwickeln, mit denen man verborgene Zusammenhänge in den Daten erkennen und Vorhersagen treffen kann. Beliebige SAP- oder Nicht-SAP-Datenbanken können in die Applikation eingebunden werden. Die Datenanalysen werden als Analysepipelines zusammengebaut.