Assoziationsanalyse

Die Assoziationsanalyse bezeichnet die Suche nach starken Regeln. Diese daraus folgenden Assoziationsregeln beschreiben Korrelationen zwischen gemeinsam auftretenden Dingen. Der Zweck einer Assoziationsanalyse besteht also darin, Items (Elemente einer Menge, wie z. B. einzelne Artikel eines Warenkorbs) zu ermitteln, die das Auftreten anderer Items innerhalb einer Transaktion implizieren. Eine solcherart aufgedeckte Beziehung zwischen zwei oder mehr Items kann dann als Regel der Form „Wenn Item(menge) A, dann Item(menge) B“ bzw. A → B dargestellt werden.

Ein typisches Anwendungsfeld sind die Zusammenhänge beim Einkauf, die sogenannte Warenkorbanalyse, um gezielt Werbemaßnahmen einzuleiten. Bei 80 Prozent der Einkäufe, in denen Bier gekauft wird, werden auch Kartoffelchips gekauft. Beide Produkte kommen in 10 Prozent der Einkäufe vor. Häufig werden diese Erkenntnisse im Crossmarketing genutzt.

Kenngrößen von Assoziationsregeln sind:

  • Support: relative Häufigkeit der Beispiele, in denen die Regel anwendbar ist.
  • Konfidenz: relative Häufigkeit der Beispiele, in denen die Regel richtig ist.
  • Lift: Der Lift gibt an, wie hoch der Konfidenzwert für die Regel den Erwartungswert übertrifft, er zeigt also die generelle Bedeutung einer Regel.

Beispiel

Gegeben sei eine Assoziationsregel {Zahnbürste} → {Zahncreme}.

  • Support: Mit dem Support wird berechnet, welcher Anteil aller Transaktionen für die Regel {Zahnbürste} → {Zahncreme} gilt. Zur Berechnung wird die Anzahl der Transaktionen, in denen beide interessierenden Itemmengen vorkommen, durch die Anzahl aller Transaktionen geteilt.
  • Konfidenz: Für welchen Anteil der Transaktionen, in denen {Zahnbürste} vorkommt, kommt auch {Zahncreme} vor? Zur Berechnung der Konfidenz wird die Anzahl aller regelerfüllenden Transaktionen durch die Anzahl der Transaktionen, die {Zahnbürste} enthalten, geteilt.
  • Lift: Angenommen, 10 Prozent aller Kunden kaufen {Zahncreme}, aber 50 Prozent aller Kunden, die {Zahnbürste} kaufen, kaufen auch {Zahncreme}. Dann hat die Regel einen fünffachen Lift.

Algorithmen sind so zu entwerfen, dass alle Assoziationsregeln mit einer vorab festzulegenden Mindestkonfidenz und Mindestsupport gefunden werden. Die Verfahren sollen keine Annahmen über die zu analysierenden Merkmale benötigen. Dies wäre beispielsweise bei einem Versandhandel mit vielen Tausend Artikeln auch nicht denkbar.

Der erste Algorithmus zur Assoziationsanalyse ist der AIS-Algorithmnus (benannt nach seinen Entwicklern Agrawal, Imielinski und Swami) aus dem der Apriori-Algorithmus entwickelt wurde. Dieser wird mehr und mehr vom wesentlich effizienteren FPGrowth-Algorithmus abgelöst.

Anwendungsgebiete

Crossmarketing: Dem Kunden werden bei der Betrachtung eines Artikels in einem Webshop auch Artikel angezeigt, die andere Kunden dazugekauft haben (z. B. Digitalkamera → Speicherkarte)

Weblinks


Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Data-Mining — Unter Data Mining (der englische Begriff bedeutet etwa „aus einem Datenberg etwas Wertvolles extrahieren“, eine adäquate deutsche Übersetzung existiert nicht.[1] Der Duden empfiehlt die Schreibweise „Data Mining“[2]) versteht man die… …   Deutsch Wikipedia

  • Data Mining — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Data mining — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Dataminer — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Datamining — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Datenschürfung — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Matchplus — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Apriori-Algorithmus — Der Apriori Algorithmus ist ein Verfahren zur Assoziationsanalyse, einem Bereich des Data Mining. Er dient der Auffindung von sinnvollen und nützlichen Zusammenhängen in transaktionsbasierten Datenbasen, die in Form von sogenannten… …   Deutsch Wikipedia

  • Lift — Der Ausdruck Lift bezeichnet Aufzugsanlage, eine Vorrichtung für den senkrechten Transport in Gebäuden Skilift, Aufstiegshilfe für Skifahrer Lift (Band), eine deutsche Artrockband In der Assoziationsanalyse der Unterschied zwischen erwartetem und …   Deutsch Wikipedia

  • Sequenzmuster — Ein Sequenzmuster ist die gleichförmige Abfolge von Elementen in Transaktionen. Das Suchen von Sequenzmuster ist ein Methode von Data Mining. Um ein Beispiel zu nennen, wird bei Transaktionen mit Kundeneinkäufen die folgende Frage gestellt:… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”