Bessere Produktvorschläge durch Empfehlungsdienste im Dialogmarketing

In diesem Artikel lesen Sie, wie m-result Data Science nutzt um Dialogmarketing durch individuelle Produktvorschläge zu verbessern. 

Empfehlungsdienste

Empfehlungsdienste sind Techniken des maschinellen Lernens die helfen, aus einer Menge an Auswahlmöglichkeiten relevante Informationen zu finden. Zum Einsatz kommen diese Techniken nicht nur bei Onlineshops, Videostreaming oder in sozialen Netzwerken, sondern führen auch im Dialogmarketing zu Verbesserungen der Verkäufe und Kundenzufriedenheit.

Problemstellung

Im Rahmen des Dialogmarketings werden regelmäßig Aussendungen an Kunden verschickt. Ziel ist es dabei, den Kunden an die Marke zu binden und das Interesse an neuen Produkten zu wecken. Bisher wurde dazu meist das aktuellste Produkt in bestimmten Aussendungen vorgestellt. Die Umstellung auf individuelle Aussendungen mit kundenspezifischen Produktvorschlägen, wurde im Rahmen der Datenstrategie entwickelt und hat zu positiven Effekten beim Verkauf, sowie der Kundenzufriedenheit geführt.

Datenbasis

Die Daten bestehen aus Verkäufen von Händlern mit Standorten in ganz Deutschland und umfassen insgesamt 129.654 Beobachtungen und 117 Produkte in verschiedenen Ausführungen. Die folgende Grafik bildet die Verteilung der zehn am häufigsten gekauften Produkte mit anonymisierter Produktbezeichnung ab.
 

Abbildung 1: Verteilung der 10 häufigsten Produkte

 

Das Produkt B_0_c gehört mit 13.078 Verkäufen, neben B_1_c sowie B_0_a, zu den beliebtesten Produkten. In 122.581 Fällen haben Kunden einen Kauf und in 6.696 Fällen wurden mindestens zwei Käufe getätigt.
 

Produktbewertungen

Bewertungen durch Kunden sind ein wichtiges Element bei Empfehlungsdiensten, denn die Vergabe von Sternen oder Likes dient nicht nur dazu die Beliebtheit des Produktes zu messen, sondern auch dazu Korrelationen zwischen Produkten oder Kunden zu finden.

Die vorliegenden Daten verfügen über keine direkte Bewertung durch Kunden. Die Bewertung steht indirekt über die binäre Information "Kauf" bzw. "kein Kauf" zur Verfügung.

Methoden

Empfehlungsdienste basieren auf Techniken des maschinellen Lernens, ein wesentlicher Bestandteil der Data Science. Die folgenden Standardmethoden, werden im weiteren Verlauf auf die Daten angewendet und die daraus resultierenden Modelle evaluiert.

  1. IBCF (Item-based-collaborative filtering) ist produktbasiertes kollaboratives Filtern und schlägt einem Kunden Produkte vor, die ähnlich den bisher gekauften Produkten dieses Kunden sind.
  2. UBCF (User-based-collaborative filtering) ist kundenbasiertes kollaboratives Filtern und schlägt einem Kunden Produkte vor, die von Kunden mit ähnlichem Konsumverhalten am häufigsten gekauft wurden.
  3. Hybride kombinieren mehrere Methoden nach bestimmten Gewichtungen und sollen so zu einem besseren Ergbnis führen.
  4. ALS (alternating least square) ist ein Matrixfaktorisierungsalgorithmus, welcher für kollaboratives Filtern sehr großer Datenmengen entwickelt wurde. Die Methode ist skalierbar und geeignet, wenn wenige Bewertungen vorliegen.
  5. Random bezeichnet hier zufällige Vorschläge. diese dienen hier ausschließlich dem Vergleich mit anderen Methoden.
  6. Popular ist eine Methode, welche das am häufigsten gekaufte Produkt vorschlägt. Diese Methode dient dem Vergleich zur bisher durchgeführten Kampagne.

Evaluierung

Die Bewertung der Vorhersagegüte der unterschiedlichen Modelle erfolgt durch die Konfusionsmatrix. Dies ist ein Konzept aus der Statistik, welches die tatsächlichen Beobachtungen (Käufe) den vorhergesagten Beobachtungen (Produktvorschläge) gegenüberstellt.
 

Abbildung 2: Konfusionsmatrix


Aus dieser Matrix werden weitere Kennzahlen für die Bewertung abgeleitet.

  • Die Sensitivität (Richtig-Positiv-Rate): RP / (RP + FN) gibt die Wahrscheinlichkeit an, mit der eine positive Beobachtung korrekt als positiv klassifiziert wird.
  • Die Ausfallrate (Falsch-Positiv-Rate): FP / (FP + RN) gibt den Anteil der fälschlich als positiv klassifizierten Beobachtung an, die in Wirklichkeit negativ sind.
  • Die Genauigkeit (Positiver-Vorhersagewert): (RP / RP + FP) gibt den Anteil der korrekt als positiv klassifizierten Beobachtung an der Gesamtheit der als positiv klassifizierten Beobachtung an.

Aus der Sensitivität und der Ausfallrate leitet sich eine Visualisierung ab, welche einen Vergleich der Methoden untereinander zulässt. Ziel ist es dabei, eine möglichst hohe Richtig-Positiv-Rate bei möglichst kleiner Falsch-Positiv-Rate zu finden.

Diese Receiver Operating Characteristic kurz ROC stellt die Abhängigkeit der Sensitivität als Funktion der Ausfallrate für verschiedene Parameterwerte dar.

Abbildung 3: Theoretische ROC-Kurve

 

Bei Produktempfehlungen entsprechen diese Parameterwerte der Anzahl an vorgeschlagenen Produkten. Sagt ein Modell beispielsweise zwei Produkte vorher, werden diese mit den tatsächlich gekauften Produkten verglichen und die Konfusionsmatrix berechnet. Jeder Punkt auf der ROC entspricht den Ergebnissen der entsprechenden Konfusionmatrix. Bei steigender Anzahl an Produktvorschlägen tendiert die Richtig-Positiv-Rate sowie die Falsch-Positiv-Rate gegen eins.

Die Diagonale in Abbildung 3 entspricht dem zufälligen Vorschlagen von Produkten und wird als Benchmark verwendet. Desto größer die Fläche zwischen der Diagonalen und der ROC, desto besser sind die Produktvorschläge für das Modell. Das beste Modell liegt demnach, bei gegebener Anzahl an Produktvorschlägen, in der oberen linken Ecke der Abbildung, weil dort die Richtig-Positiv-Rate maximiert und die Falsch-Positiv-Rate minimiert ist.

Ergebnisse

Die sechs Methoden werden auf die Daten für bis zu 100 Produktvorschläge in 12 Schritten (1 bis 5, 10, 20, …, 100) berechnet. Die folgende Grafik zeigt die empirischen Ergebnisse der ROC-Kurven für jedes Modell.
 

Abbildung 4: Empirische ROC-Kurve

Abbildung 5: Empirische ROC-Kurven (Ausschnitt)

 

In der oberen Grafik (Abb. 4) zeigt sich, dass die Popular- und ALS-Methode in den meisten Fällen über eine bessere Ausfallrate und Sensitivität verfügen als die anderen Methoden.

Die untere Grafik (Abb. 5) zeigt den Verlauf für bis zu vier Produktvorschlägen. Die ALS-Methode zeigt die kleinste Ausfallrate und gleichzeitig die höchste Sensitivität bei einem bis zwei Produktvorschlägen, bei drei ist dies IBCF und ab vier die Popular-Methode.

Für diese Daten und mit einem Produktvorschlag pro Aussendung, ist das beste Modell die ALS-Methode.

Zusammenfassung

Empfehlungsdienste sind nicht auf den Onlinebereich beschränkt, sondern kommen auch in der analogen Welt erfolgreich zum Einsatz. Welche Methode einsetzbar ist unterscheidet sich je nach Ziel, Anwendungsfall und Daten.

Der Implementierung geht eine professionelle Bewertung der Umsetzbarkeit, Prüfung der Anforderungen an die Daten, sowie Messung des ökonomischen Erfolgs voraus.