14
gebnis in besonderer Weise von der Güte
der zuvor getroffenen Annahmen abhängt.
Um die Annahmen zu prüfen, wurde die Erstel-
lung des Modells, getrieben durch Hypothesen-
tests aufbauend auf den Erkenntnissen aus der
Literatur sowie aus dem Geschäftsverständnis
und durch iterative Versuche, verbessert. Da-
durch konnten in der Modeling-Phase die Para-
meter für jedes Produkt weiter optimiert wer-
den, sodass ein Bestimmtheitsmaß des Mo-
dells (R²) von mindestens 0,85 erreicht wurde.
Für ein akzeptables Modell sollte ein Bestimmt-
heitsmaß von mindestens 0,8 vorliegen, um
eine genaue Prognose erstellen zu können
(Henseler et al. 2009). Modelle lassen sich ver-
bessern durch die Untersuchung der Residuen,
welche noch unerklärte Muster aufweisen kön-
nen. Um den verschiedenen Einflussfaktoren
auf die Produktverkäufe gerecht zu werden,
wurden verschiedene Modelle für unterschied
liche Produktgruppen erstellt.
In der Evaluationsphase wird das zuvor Mo-
dellierte bewertet und auf die Zielerreichung
hin überprüft. Neben der Betrachtung des Be-
stimmtheitsmaßes wurde in dem Projekt eine
Kreuzvalidierung durchgeführt. So nutzte man
90% der Daten, um das Modell anzulernen,
und 10%, um die getroffene Prognose zu va-
lidieren. Insbesondere der Mean Absolute
Percentage Error (MAPE) und Mean Absolute
Error (MAE) erwiesen sich als gute Fehlerma-
ße (Crone 2010). In der letzten Phase des
CRISP-DM wird das erarbeitete Wissen orga-
nisiert, aufbereitet und dokumentiert, damit
die Nutzer der Projektergebnisse mit dem
Modell arbeiten können.
Das Prozessmodell CRISP-DM hat sich in dem
Projekt bei McDonald’s Deutschland aufgrund
der iterativen Arbeitsweise mit den Daten als
wertvolles Werkzeug erwiesen. Für die prakti-
sche Implementierung des Modells wurde ein
Konzept entwickelt, bei dem jeweils eine csv-
Datei im Statistikprogramm „R“ zum Anler-
nen, zum Erstellen der Prognose und zur Vali-
dierung der Prognose eingelesen wird (vgl.
Abbildung 5). Die Kreuzvalidierung ist nur ein-
mal für die Überprüfung des Modells notwen-
dig. Anschließend ist der gesamte Datensatz
zum Anlernen anwendbar. Mithilfe der Daten
und der linearen Regression kann eine Prog-
Das Ziel des Projektes, mithilfe von Predictive
Analytics die Planung des Produktmix zu ver-
bessern, erfordert einen Ansatz für eine exakte
Verkaufsprognose auf Produktebene. Das Er-
gebnis muss sich somit in konkreten Zahlen für
die einzelnen Produktverkäufe ausdrücken. In
der Literatur ließen sich für die Projektanforde-
rungen zunächst
zwei Methoden als vielver-
sprechende Ansätze identifizieren: neuro-
nale Netze und lineare Regressionen
. Mit
neuronalen Netzen konnte bereits die Nachfra-
ge nach einigen Lebensmittelprodukten prog-
nostiziert werden (Doganis et al. 2006). Proble-
matisch an neuronalen Netzen ist, dass diese
mathematisch komplex sind, spezielle Soft-
ware, viel Rechenzeit und viel Fachwissen be-
nötigen und Ergebnisse schwer zu interpretie-
ren sind. Mit neuronalen Netzen konnten zwar
gute Ergebnisse erzielt werden, aber da für das
Projekt die Transparenz von hoher Priorität war,
wurde dieser Ansatz verworfen.
Fokussierung auf lineare
Regression
Als weiterer potentieller Ansatz für das Projekt
wurden Regressionen identifiziert, da auch die-
se Methode numerische Ergebnisse liefert. Au-
ßerdem hat sich für die Prognose von Restau-
rantbesuchen insbesondere die Zeitreihenana-
lyse als Sonderform der linearen Regression als
geeignet erwiesen. Aufgrund der Transparenz
und der bereits erfolgreichen Anwendung der
linearen Regression für die Umsatzprognose
wurde der Ansatz weiterverfolgt.
Es ist aber zu
beachten, dass bei diesem Modell das Er-
der Nutzer eine große Rolle für die spätere Um-
setzung und Akzeptanz des Modells spielt. Für
das Projekt der Produktmix-Planung bei
McDonald’s Deutschland wurden die Anforde-
rungskriterien, wie in Abbildung 4 dargestellt,
priorisiert. Die Basis für jedes Modell bildet die
Erstellbarkeit, z. B. bedingt durch die benötigte
Speicher- bzw. Rechenkapazität des Modells.
Auf diesem Fundament fußen
vier gleichwer-
tige Kriterien: Genauigkeit, Verständlich-
keit, Bedienbarkeit und Anpassungsmög-
lichkeit
. Eine Anforderung des Einsatzes von
Predictive Analytics ist es, eine möglichst ge-
naue Prognose zu erstellen. Da das Modell für
die Produktmix-Planung bei McDonald’s
Deutschland von Controllern und nicht von
Data Analysts implementiert und genutzt wird,
ist es in den Augen der Projektteilnehmer er-
forderlich, dass die Methode neben der Genau-
igkeit gleichzeitig verständlich und bedienbar
bleibt. Außerdem sind Anpassungsmöglichkei-
ten im Modell notwendig, da sich Geschäfts-
modelle und das Kundenverhalten wandeln
können. Über diese Kriterien wurde Transpa-
renz als höchste Anforderung gestellt. Nur ein
transparentes Modell ermöglicht es dem Cont-
roller, das Modell zu validieren und gegebenen-
falls anzupassen, die Ergebnisse verständlich
zu kommunizieren und detaillierte Rückfragen
zu beantworten. In der Literatur wurde eine
Vielzahl von Methoden im Bereich Predictive
Analytics identifiziert, die nach diesen Kriterien
betrachtet wurden. Im Folgenden werden zwei
Methoden exemplarisch vorgestellt, wobei die
Priorisierung der Anforderungen zu einer ein-
deutigen Entscheidung für eine der beiden Me-
thoden geführt hat.
Abb. 4: Priorisierung der Anforderungen an das Predictive-Analytics-Modell
Predictive Analytics bei McDonald’s