Algorithmus von Kruskal

Algorithmus von Kruskal

Der Algorithmus von Kruskal ist ein Algorithmus der Graphentheorie zur Berechnung minimaler Spannbäume von ungerichteten Graphen. Der Graph muss dazu zusätzlich zusammenhängend, kantengewichtet und endlich sein.

Der Algorithmus stammt von Joseph Kruskal, der ihn 1956 in der Zeitschrift „Proceedings of the American Mathematical Society“ veröffentlichte. Er beschrieb ihn dort wie folgt:

Führe den folgenden Schritt so oft wie möglich aus: Wähle unter den noch nicht ausgewählten Kanten von G (dem Graphen) die kürzeste Kante, die mit den schon gewählten Kanten keinen Kreis bildet.[1]

Die kürzeste Kante bezeichnet dabei jeweils die Kante mit dem kleinsten Kantengewicht. Nach Abschluss des Algorithmus bilden die ausgewählten Kanten einen minimalen Spannbaum des Graphen.

Wendet man den Algorithmus auf unzusammenhängende Graphen an, so berechnet er für jede Zusammenhangskomponente des Graphen einen minimalen Spannbaum. Diese Bäume bilden einen minimalen aufspannenden Wald.

Inhaltsverzeichnis

Beispiel

Prim Algorithm 0.svg Dies ist der Graph zu dem der Algorithmus von Kruskal einen minimalen Spannbaum berechnen wird. Die Zahlen bei den einzelnen Kanten geben das jeweilige Kantengewicht an. Zu Beginn ist noch keine Kante ausgewählt.
Kruskal Algorithm 1.svg Die Kanten AD und CE sind die kürzesten (noch nicht ausgewählten) Kanten des Graphen. Beide können ausgewählt werden. Hier wird zufällig AD ausgewählt. (Dass diese keinen Kreis bildet, ist im ersten Schritt selbstverständlich.)
Kruskal Algorithm 2.svg Nun ist CE die kürzeste, noch nicht ausgewählte Kante. Da sie mit AD keinen Kreis bildet, wird sie nun ausgewählt.
Kruskal Algorithm 3.svg Die nächste Kante ist DF mit Länge 6. Sie bildet mit den schon gewählten Kanten keinen Kreis und wird deshalb ausgewählt.
Kruskal Algorithm 4.svg Jetzt könnten die Kanten AB und BE, jeweils mit Länge 7 ausgewählt werden. Es wird zufällig AB gewählt. Die Kante BD wird rot markiert, da sie mit den bis jetzt gewählten Kanten einen Kreis bilden würde und somit im weiteren Verlauf des Algorithmus nicht mehr berücksichtigt werden muss.
Kruskal Algorithm 5.svg BE ist nun mit Länge 7 die kürzeste der noch nicht ausgewählten Kanten und da sie mit den bisher gewählten keinen Kreis bildet wird sie ausgewählt. Analog zur Kante BD im letzten Schritt werden jetzt die Kanten BC, DE und FE rot markiert.
Kruskal Algorithm 6.svg Als letzte wird die Kante EG mit Länge 9 ausgewählt, da alle kürzeren bzw. gleich langen Kanten entweder schon ausgewählt sind oder einen Kreis bilden würden. Die Kante FG wird rot markiert. Da nun alle nicht ausgewählten Kanten einen Kreis bilden würden (sie sind rot markiert) ist der Algorithmus am Ende angelangt und der grüne Graph ist ein minimaler Spannbaum des zugrundeliegenden Graphen.

Formalisierter Algorithmus

Die Grundidee ist, die Kanten in Reihenfolge aufsteigender Kantengewichte zu durchlaufen und jede Kante zur Lösung hinzuzufügen, die mit allen zuvor gewählten Kanten keinen Kreis bildet. Es werden somit sukzessiv sogenannte Komponenten zum minimalen Spannbaum verbunden.

Input

Als Eingabe dient ein zusammenhängender kantenbewerteter Graph G = (V,\,E,\,w). V bezeichnet die Menge der Ecken (vertices), E die Menge der Kanten (edges). Die Gewichtsfunktion w: E \rightarrow \R ordnet jeder Kante ein Kantengewicht zu.

Output

Der Algorithmus liefert einen minimalen Spannbaum M = (V,\,E') mit E' \subseteq E.

Algorithmus

Der Algorithmus von Kruskal arbeitet nicht-deterministisch, d.h. er liefert unter Umständen beim wiederholten Ausführen unterschiedliche Ergebnisse. Alle diese Ergebnisse sind minimale Spannbäume von G.

G = (V,E,w): ein zusammenhängender, ungerichteter, kantengewichteter Graph
kruskal(G)
1  E' \leftarrow \emptyset
2  L \leftarrow E
3  Sortiere die Kanten in L aufsteigend nach ihrem Kantengewicht.
4  solange L \neq \emptyset
5      wähle eine Kante e \in L mit kleinstem Kantengewicht
6      entferne die Kante e aus L
7      wenn der Graph (V,E' \cup \lbrace e \rbrace) keinen Kreis enthält
8          dann E' \leftarrow E' \cup \lbrace e \rbrace
9  M = (V,E') ist ein minimaler Spannbaum von G.


Derselbe Algorithmus lässt sich analog für einen maximalen Spannbaum anwenden. Sei G = (V,E,w) etwa ein zusammenhängender kantengewichteter Graph. Dann gibt man G' = (V,E,w') mit w'(e) = sw(e), s \in \mathbb{N} und \forall e \in E \,: s > w(e) im Algorithmus von Kruskal ein. Als Ausgabe erhält man schließlich einen minimalen Spannbaum von G' und somit einen maximalen von G.

Korrektheitsbeweis

Sei G = (V,E,w) ein zusammenhängender kantengewichteter Graph und M = (V,E') die Ausgabe des Algorithmus von Kruskal. Um nun die Korrektheit des Algorithmus zu beweisen, muss Folgendes gezeigt werden:

  1. der Algorithmus terminiert (er enthält keine Endlosschleife).
  2. M ist ein minimaler Spannbaum von G, also:
    1. M ist spannender Teilgraph von G.
    2. M enthält keinen Kreis.
    3. M ist zusammenhängend.
    4. M ist bezüglich G minimal.

Im Nachstehenden folgen einige Beweisideen, die die Gültigkeit der einzelnen Aussagen darlegen:

Terminierung
Durch Zeile 6 wird in jedem Schleifendurchlauf genau ein Element aus L entfernt. Außerdem wird L durch keine weitere Operation verändert. Aus L werden wegen Zeile 4 nur solange Elemente entfernt, bis L = \emptyset. Da zu Beginn im Algorithmus L = E gesetzt wurde und E nach Definition nur endlich ist, wird auch die Schleife nur endlich oft durchlaufen. Daraus kann man folgern, dass Kruskals Algorithmus terminiert.
M ist spannender Teilgraph von G
Da die Menge der Knoten nach Definition des Algorithmus bei M und G gleich ist und wegen Zeile 8 offensichtlich E' \subseteq E gilt, ist M spannender Teilgraph von G.
M enthält keinen Kreis
Dass M keinen Kreis beinhalten kann, ist durch Zeile 7 trivial.
M ist zusammenhängend
Im Folgenden wird indirekt gezeigt, dass M zusammenhängend ist. Sei M also nicht zusammenhängend. Dann gibt es in M zwei Knoten x und y, die nicht durch einen Weg verbunden sind. Da aber x und y in G durch einen Weg verbunden sind, existiert eine Kante k in G, welche nicht in M vorhanden ist. Der Algorithmus betrachtet in Zeile 7 garantiert jede Kante aus G und damit auch k. Der Graph (V,E' \cup \lbrace k \rbrace) in Zeile 7 muss kreisfrei sein, da es zwischen x und y in M = (V,E') keinen Weg gibt. Mit Zeile 8 wird k dann in M eingefügt. Dies widerspricht allerdings der Tatsache, dass k nicht in M enthalten ist. Somit ist unsere Annahme hinfällig und M doch zusammenhängend.
M ist bezüglich G minimal
Wir zeigen durch Induktion, dass für k = 0,...,n die folgende Behauptung wahr ist:

Wenn F die Kantenmenge ist, die im k-ten Schritt des Algorithmus erzeugt wurde, dann gibt es einen minimalen Spannbaum der F enthält. Die Behauptung ist für k = 0 wahr, d.h. F = \emptyset (d.h. es ist noch keine Kante eingeplant). Jeder minimale Spannbaum erfüllt die Behauptung und es existiert ein minimaler Spannbaum, da ein gewichteter, zusammenhängender Graph immer einen minimalen Spannbaum besitzt. Jetzt nehmen wir an, dass die Behauptung für 1 \le k < n erfüllt ist und F die vom Algorithmus nach Schritt k erzeugte Kantenmenge ist. Es sei M der minimale Spannbaum der F enthält. Wir betrachten jetzt den Fall k + 1. Dafür sei e die letzte vom Algorithmus eingefügte Kante.

e \in M
Behauptung ist auch für F + e erfüllt, da der minimale Spannbaum F um eine Kante aus dem minimalen Spannbaum M erweitert wird.
e \notin M
Dann enthält M + e einen Kreis und es gibt eine Kante f die im Kreis, aber nicht in F liegt. (Wenn es keine solche Kante f geben würde, dann hätte e nicht zu F hinzufügt werden können, da dann ein Kreis entstanden wäre.) Damit ist Mf + e ein Baum. Weiterhin kann das Gewicht von f nicht geringer als das Gewicht von e sein, da sonst der Algorithmus f anstelle von e hinzugefügt hätte. Mit w(f) \le w(e) folgt, dass w(M-f+e) \le w(M) gilt. Da aber M minimaler Spannbaum ist, gilt außerdem w(M) \le w(M-f+e) und daraus folgt w(Mf + e) = w(M). Somit ist Mf + e ein minimaler Spannbaum, der F + e enthält, und die Behauptung ist erfüllt.

Damit folgt für k = n, dass der Kruskal-Algorithmus nach n Schritten eine Menge F erzeugt, die zu einem minimalen Spannbaum erweitert werden kann. Da aber das Ergebnis nach n Schritten des Algorithmus bereits ein Baum ist (wie oben gezeigt wurde), muss dieser minimal sein.

Zeitkomplexität

Im folgenden sei \left|E\right| die Anzahl der Kanten und \left|V\right| die Anzahl der Knoten. Die Laufzeit des Algorithmus setzt sich zusammen aus dem notwendigen Sortieren der Kanten nach ihrem Gewicht und dem Überprüfen, ob der Graph kreisfrei ist. Das Sortieren benötigt eine Laufzeit von \mathcal{O}\bigl(\left|E\right| \cdot \log(\left|E\right|)\bigr), was der Größenordnung \mathcal{O}\bigl(\left|E\right| \cdot \log(\left|V\right|)\bigr) entspricht, da der Graph zusammenhängend ist und somit \left|V\right|-1 \leq \left|E\right| \leq \frac{\left|V\right|(\left|V\right|-1)}{2} gilt. Bei einer geeigneten Implementierung ist das Überprüfen auf Kreisfreiheit schneller möglich, so dass das Sortieren die Gesamtlaufzeit bestimmt. Insbesondere bei Graphen mit vielen Kanten ist insofern der Algorithmus von Prim effizienter.

Wenn die Kanten bereits vorsortiert sind, arbeitet der Algorithmus von Kruskal schneller. Man betrachtet nun, wie schnell das Überprüfen auf Kreisfreiheit möglich ist. Um eine bestmögliche Laufzeit zu erreichen, speichert man alle Knoten in einer Union-Find-Struktur. Diese enthält Informationen darüber, welche Knoten zusammenhängen. Zu Beginn ist noch keine Kante in den Spannbaum eingetragen, daher ist jeder Knoten für sich in einer einzelnen Partition. Wenn eine Kante (v1,v2) hinzugefügt werden soll, wird überprüft, ob v1 und v2 in verschiedenen Partitionen liegen. Dazu dient die Operation Find(x): Sie liefert einen Repräsentant der Partition, in dem der Knoten x liegt. Wenn Find(v1) und Find(v2) verschiedene Ergebnisse liefern, dann kann die Kante hinzugefügt werden und die Partitionen der beiden Knoten werden vereinigt (Union). Ansonsten würde durch Hinzunehmen der Kante ein Kreis entstehen, die Kante wird also verworfen. Insgesamt wird die Operation Find 2\cdot \left|E\right| (für jede Kante) und die Operation Union \left|V\right|-1 mal aufgerufen. Bei Verwenden der Heuristiken Union-By-Size und Pfadkompression ergibt eine amortisierte Laufzeitanalyse für den Algorithmus [2] eine Komplexität von \mathcal{O}(\left|E\right| \cdot \log^* \left|V\right|). Dabei ist log  * (n) definiert als \min \Bigl\{s\in\mathbb{N} \mid \underbrace{\log\bigl(\log(\ldots\log(n)\ldots)\bigr)}_{s-\text{mal}} \le 1 \Bigr\} und praktisch konstant. Theoretisch wächst diese Funktion jedoch unendlich, weshalb sie in der O-Notation nicht weggelassen werden kann.

Sonstiges

Der Algorithmus diente Kruskal ursprünglich als Hilfsmittel für einen vereinfachten Beweis, dass ein Graph mit paarweise verschiedenen Kantengewichten einen eindeutigen minimalen Spannbaum besitzt.

Weblinks

Wikibooks Wikibooks: Algorithmus von Kruskal – Implementierungen in der Algorithmensammlung

Quellen und Bemerkungen

  1. Joseph Kruskal: On the shortest spanning subtree and the traveling salesman problem. In: Proceedings of the American Mathematical Society. 7 (1956), S. 48–50
  2. Skript Theoretische Informatik III

Wikimedia Foundation.

Игры ⚽ Нужен реферат?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Algorithmus von Dijkstra — Der Algorithmus von Dijkstra (nach seinem Erfinder Edsger W. Dijkstra) dient der Berechnung eines kürzesten Pfades zwischen einem Startknoten und einem beliebigen Knoten in einem kantengewichteten Graphen. Die Gewichte dürfen dabei nicht negativ… …   Deutsch Wikipedia

  • Algorithmus von Jarnik, Prim und Dijkstra — Der Algorithmus von Prim dient der Berechnung eines minimalen Spannbaumes in einem zusammenhängenden, ungerichteten, kantengewichteten Graphen. Der Algorithmus wurde 1930 von dem tschechischen Mathematiker Vojtěch Jarník entwickelt. 1957 wurde er …   Deutsch Wikipedia

  • Algorithmus von Prim — Der Algorithmus von Prim dient der Berechnung eines minimalen Spannbaumes in einem zusammenhängenden, ungerichteten, kantengewichteten Graphen. Der Algorithmus wurde 1930 vom tschechischen Mathematiker Vojtěch Jarník entwickelt. 1957 wurde er… …   Deutsch Wikipedia

  • Algorithmus von Boruvka — Der Algorithmus von Borůvka gilt als erster Algorithmus zum Auffinden minimaler Spannbäume in ungerichteten Graphen. Er wurde 1926 von dem tschechischen Mathematiker Otakar Borůvka beschrieben. Die beiden bekannteren Algorithmen zur Lösung dieses …   Deutsch Wikipedia

  • Algorithmus von Borůvka — Der Algorithmus von Borůvka gilt als erster Algorithmus zum Auffinden minimaler Spannbäume in ungerichteten Graphen. Er wurde 1926 von dem tschechischen Mathematiker Otakar Borůvka beschrieben. Die beiden bekannteren Algorithmen zur Lösung dieses …   Deutsch Wikipedia

  • Kruskal — ist der Familienname von: Joseph Kruskal (1929–2010), US amerikanischer Mathematiker und Statistiker Martin Kruskal (1925–2006), US amerikanischer Mathematiker und Physiker William Kruskal (1919–2005), US amerikanischer Mathematiker und… …   Deutsch Wikipedia

  • Kruskal-Algorithmus — Der Algorithmus von Kruskal ist ein Algorithmus der Graphentheorie zur Berechnung minimaler Spannbäume von ungerichteten Graphen. Der Graph muss dazu zusätzlich zusammenhängend, kantengewichtet und endlich sein. Der Algorithmus stammt von Joseph… …   Deutsch Wikipedia

  • Dijkstras Algorithmus — Der Algorithmus von Dijkstra (nach seinem Erfinder Edsger W. Dijkstra) dient der Berechnung eines kürzesten Pfades zwischen einem Startknoten und einem beliebigen Knoten in einem kantengewichteten Graphen. Die Gewichte dürfen dabei nicht negativ… …   Deutsch Wikipedia

  • Prim-Dijkstra-Algorithmus — Der Algorithmus von Prim dient der Berechnung eines minimalen Spannbaumes in einem zusammenhängenden, ungerichteten, kantengewichteten Graphen. Der Algorithmus wurde 1930 von dem tschechischen Mathematiker Vojtěch Jarník entwickelt. 1957 wurde er …   Deutsch Wikipedia

  • Primscher Algorithmus — Der Algorithmus von Prim dient der Berechnung eines minimalen Spannbaumes in einem zusammenhängenden, ungerichteten, kantengewichteten Graphen. Der Algorithmus wurde 1930 von dem tschechischen Mathematiker Vojtěch Jarník entwickelt. 1957 wurde er …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”