K-Means-Algorithmus

K-Means-Algorithmus

Der k-Means-Algorithmus ist ein Verfahren, das in einer Menge von Objekten ähnliche Objekte zu Gruppen zusammenfasst. Der Algorithmus ist eine Inkarnation des EM-Algorithmus und zeichnet sich durch seine Einfachheit aus und wurde intensiv erforscht.

Die Ähnlichkeit der Objekte wird durch eine Abstandsfunktion modelliert.

Algorithmus

Vor der Ausführung des k-Means-Algorithmus muss die Anzahl k der zu ermittelnden Gruppen festgelegt werden. Des Weiteren wird ein Hilfsalgorithmus benötigt, der zu mehreren Objekten ein Zentrum ermittelt. Der k-Means-Algorithmus selbst besteht aus fünf Schritten.

  1. Bestimmung von k Clusterzentren.
  2. Jedes Objekt wird demjenigen Cluster zugeordnet, dessen Zentrum ihm am nächsten liegt.
  3. Für jedes Cluster wird das Zentrum neu berechnet.
  4. Basierend auf den neu berechneten Zentren werden die Objekte wieder wie in Schritt 2 auf die Cluster verteilt.
  5. Wurde bei der Neuverteilung mindestens ein Objekt einem anderen Cluster zugeordnet, dann wiederhole den Algorithmus beginnend mit Schritt 3.

Beispiel

Die folgenden Bilder zeigen einen Durchlauf des k-Means-Algorithmus zur Bestimmung von drei Gruppen.

Bild:K_Means_Example_Step_1.svg Drei Clusterzentren wurden zufällig gewählt.
Bild:K_Means_Example_Step_2.svg Die durch Rechtecke repräsentierten Objekte (Datenpunkte) werden jeweils dem Cluster mit dem nächsten Clusterzentrum zugeordnet.
Bild:K_Means_Example_Step_3.svg Die Zentren (jeweilige Schwerpunkte) der Cluster werden neu berechnet.
Bild:K_Means_Example_Step_4.svg Die Objekte werden neu verteilt und erneut dem Cluster zugewiesen, dessen Zentrum am nächsten ist.

Siehe auch

  • Global K-means-Algorithmus
  • Fast Global K-Means-Algorithmus
  • Clustering

Wikimedia Foundation.

Игры ⚽ Поможем написать реферат

Schlagen Sie auch in anderen Wörterbüchern nach:

  • k-Means-Algorithmus — Ein k Means Algorithmus ist ein Verfahren zur Clusteranalyse. Dabei wird aus einer Menge von ähnlichen Objekten eine vorher bekannte Anzahl von k Gruppen gebildet. Der Algorithmus ist eine der am häufigsten verwendeten Techniken zur Gruppierung… …   Deutsch Wikipedia

  • EM-Algorithmus — Der Expectation Maximization Algorithmus (kurz EM Algorithmus, selten auch Estimation Maximization Algorithmus) ist ein Algorithmus der mathematischen Statistik. Inhaltsverzeichnis 1 Kernidee 2 Mathematische Formulierung 2.1 Funktionsweise …   Deutsch Wikipedia

  • Fuzzy C-Means — Der Fuzzy C Means Algorithmus ist ein unüberwachter Clustering Algorithmus, der eine Erweiterung des k Means Clustering Algorithmus ist. In einer generalisierten Form wurde er von Bezdek (1981) vorgestellt.[1] Inhaltsverzeichnis 1 Grundidee 2… …   Deutsch Wikipedia

  • K-Means — Der k Means Algorithmus ist ein Verfahren, das in einer Menge von Objekten ähnliche Objekte zu Gruppen zusammenfasst. Der Algorithmus ist eine Inkarnation des EM Algorithmus und zeichnet sich durch seine Einfachheit aus und wurde intensiv… …   Deutsch Wikipedia

  • K-means — Der k Means Algorithmus ist ein Verfahren, das in einer Menge von Objekten ähnliche Objekte zu Gruppen zusammenfasst. Der Algorithmus ist eine Inkarnation des EM Algorithmus und zeichnet sich durch seine Einfachheit aus und wurde intensiv… …   Deutsch Wikipedia

  • Expectation-Maximization-Algorithmus — Der Expectation Maximization Algorithmus (kurz EM Algorithmus, selten auch Estimation Maximization Algorithmus) ist ein Algorithmus der mathematischen Statistik. Der EM Algorithmus wird vorrangig zur Ballungsanalyse verwendet (Siehe hierzu den… …   Deutsch Wikipedia

  • Clusteranalyse — Dieser Artikel wurde aufgrund von inhaltlichen Mängeln auf der Qualitätssicherungsseite der Redaktion Informatik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Informatik auf ein akzeptables Niveau zu bringen. Hilf… …   Deutsch Wikipedia

  • Ballungsanalyse — Unter Clusteranalyse (der Begriff Ballungsanalyse wird selten verwendet) versteht man strukturentdeckende, multivariate Analyseverfahren zur Ermittlung von Gruppen (Clustern) von Objekten, deren Eigenschaften oder Eigenschaftsausprägungen… …   Deutsch Wikipedia

  • Cluster-Analyse — Unter Clusteranalyse (der Begriff Ballungsanalyse wird selten verwendet) versteht man strukturentdeckende, multivariate Analyseverfahren zur Ermittlung von Gruppen (Clustern) von Objekten, deren Eigenschaften oder Eigenschaftsausprägungen… …   Deutsch Wikipedia

  • Clustering — Unter Clusteranalyse (der Begriff Ballungsanalyse wird selten verwendet) versteht man strukturentdeckende, multivariate Analyseverfahren zur Ermittlung von Gruppen (Clustern) von Objekten, deren Eigenschaften oder Eigenschaftsausprägungen… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”