Sortierverfahren

Ein Sortierverfahren ist ein Algorithmus, der dazu dient, eine Liste von Elementen zu sortieren. Voraussetzung ist, dass auf der Menge der Elemente eine strenge schwache Ordnung definiert ist, z. B. die lexikographische Ordnung von Zeichenketten oder die numerische Ordnung von Zahlen.

Es gibt verschiedene Sortierverfahren, die unterschiedlich effizient arbeiten. Die Komplexität eines Algorithmus, also die Anzahl der nötigen Operationen, wird üblicherweise in der Landau-Notation dargestellt. Einige Sortierverfahren benötigen außerdem neben dem zur Speicherung des Arrays nötigen noch weiteren Speicherplatz. Komplexität und Speicherbedarf hängen bei einigen Sortierverfahren von der anfänglichen Anordnung der Werte im Array ab, man unterscheidet dann zwischen Best Case (bester Fall), Average Case (Durchschnittsverhalten) und Worst Case (schlechtester Fall).

Man unterscheidet zudem zwischen stabilen und instabilen Sortierverfahren. Stabile Sortierverfahren sind solche, die die relative Reihenfolge von Elementen, die bezüglich der Ordnung äquivalent sind, nicht verändern, während instabile Sortierverfahren dies nicht garantieren.

Zudem unterscheidet man zwischen Sortierverfahren, die in-place (auch in situ) arbeiten, d. h. die mit einer von der Anzahl der zu sortierenden Elemente unabhängigen Menge zusätzlichen Speicherplatzes funktionieren, und solchen, die dies nicht tun (out-of-place oder ex situ genannt).

Und man unterscheidet auch zwischen natürlichen Sortierverfahren, die bei vorsortierten Daten schneller arbeiten als bei unsortierten Daten, und solchen, die es nicht tun. Algorithmen, bei denen der Kontrollfluss von den Daten abhängt, nennt man adaptiv und dementsprechend Sortierverfahren, die nicht von den Eingabedaten abhängen, nicht-adaptiv. Nicht-adaptive Algorithmen sind demnach besonders interessant für Hardware-Implementierungen.

Aus Gründen der Vollständigkeit sollen neben den hier beschriebenen Software-basierten Sortierverfahren auch die Möglichkeiten zur manuellen Sortierung (etwa von Karteikarten) sowie elektro-mechanische Sortierverfahren (z. B. für Lochkarten) erwähnt werden.

Inhaltsverzeichnis

1 Vergleichsbasiertes Sortieren
2 Nicht-vergleichsbasiertes Sortieren
3 Sortierung nach Beziehungen
4 Indirektes Sortieren
5 Beweis der unteren Schranke für vergleichsbasiertes Sortieren
6 Literatur
7 Weblinks

Vergleichsbasiertes Sortieren

Allgemeine Verfahren basieren auf dem paarweisen Vergleich der zu sortierenden Elemente. Bei der Komplexitätsanalyse wird davon ausgegangen, dass der Aufwand zum Vergleich zweier Elemente konstant ist.

Sortierverfahren	Best-Case	Average-Case	Worst-Case	Stabil	Zusätzlicher Speicherbedarf (sofern nicht in-place)
AVL Tree Sort (höhen-balanciert)	$\mathcal{O}( n )$ 1!	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	ja	$\mathcal{O}( n )$
Binary Tree Sort	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	$\mathcal{O}(n^2)$ 2!	ja	$\mathcal{O}( n )$
Bubblesort	$\mathcal{O}(n)$ 1!	$\mathcal{O}(n^2)$ 2!	$\mathcal{O}(n^2)$ 2!	ja	–
Combsort	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	$\mathcal{O}( n^2 )$ 2!	nein	–
Gnomesort	$\mathcal{O}( n )$ 1!		$\mathcal{O}( n^2 )$ 2!	ja	–
Heapsort	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	nein	–
Insertionsort	$\mathcal{O}(n)$ 1!	$\mathcal{O}(n^2)$ 2!	$\mathcal{O}(n^2)$ 2!	ja	–
Introsort	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	nein	–
Merge Insertion	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	ja	implementierungsabhängig keine, $\mathcal{O}( n )$ oder $\mathcal{O}( n \cdot \log (n) )$
Mergesort	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	ja	bei Arrays: $\mathcal{O}( n )$ , je nach Implementierung auch $\mathcal{O}( n \cdot \log (n) )$
Natural Mergesort	$\mathcal{O}( n )$ 1!	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	ja	bei Arrays: $\mathcal{O}( n )$ , je nach Implementierung auch $\mathcal{O}( n \cdot \log (n) )$
Quicksort	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	$\mathcal{O}( n^2 )$ 2!	nein	–
Selectionsort	$\mathcal{O}( n^2 )$ 2!	$\mathcal{O}( n^2 )$ 2!	$\mathcal{O}( n^2 )$ 2!	nein	–
Shakersort (Cocktailsort)	$\mathcal{O}( n )$ 1!	$\mathcal{O}( n^2 )$ 2!	$\mathcal{O}( n^2 )$ 2!	ja	–
Shellsort		$\mathcal{O}( n \cdot \log (n)^2 )$ 1.00002!	$\mathcal{O}( n^{1,25} )$ 1.25!	nein	–
Smoothsort	$\mathcal{O}( n )$ 1!	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	$\mathcal{O}( n \cdot \log (n) )$ 1.00001!	nein	–
Stoogesort	$\mathcal{O}( n^{2,71} )$ 2.71!	$\mathcal{O}( n^{2,71} )$ 2.71!	$\mathcal{O}( n^{2,71} )$ 2.71!	nein	–
Swap-Sort			$\mathcal{O}( n^2 )$ 2!	ja

Bei diesen Verfahren gilt das 0-1-Sortier-Lemma von Knuth: Wenn ein Sortieralgorithmus ausschließlich aus Operationen der Art „Vergleich-und-Austausch-wenn-größer“ besteht und wenn von vornherein (unabhängig von den zu sortierenden Daten) feststeht, an welchen Positionen die Werte miteinander verglichen und gegebenenfalls vertauscht werden, dann gilt: Der Algorithmus sortiert genau alle Eingabedatensätze, wenn er alle Eingabedatensätze sortiert, die nur aus Nullen und Einsen bestehen. Dieses Lemma sichert zu, dass bei bestimmten Sortieralgorithmen für den Nachweis der Korrektheit die Betrachtung von 0-1-Eingaben genügt.

Unsinnige Sortierverfahren:

Sortierverfahren	Best-Case	Average-Case	Worst-Case	Stabil	Zusätzlicher Speicherbedarf (sofern nicht in-place)
Bogosort	$\mathcal{O}( n )$	$\mathcal{O}( n \cdot n! )$	$\infty$	nein	–
Slowsort	$\mathcal{O}\left(n^{\frac{\log(n)}{(2+e)}}\right)$	$\mathcal{O}\left( n^{\frac{\log(n)}{2}} \right)$	$\infty$	nein	–

Nicht-vergleichsbasiertes Sortieren

Bei Sortierverfahren, die nicht auf Vergleichen beruhen, steigt die benötigte Zeit linear mit der Anzahl der zu sortierenden Elemente. Bei großen Anzahlen zu sortierender Datensätze sind diese Algorithmen den vergleichsbasierten Verfahren überlegen, sofern sie angewendet werden können. Sie können allerdings nur für numerische Datentypen verwendet werden.

Sortierverfahren	Zeit	Stabil	Rekursiv	Zusätzlicher Speicherbedarf
Bucketsort	$\mathcal{O}\left( n + k\right)$	ja	nein	$\mathcal{O}\left( k \right)$
Countingsort	$\mathcal{O}\left( n + m\right)$	ja	nein	$\mathcal{O}\left( m \right)$
Radixsort	$\mathcal{O}\left( n \cdot d\right)$	ja	möglich	$\mathcal{O}\left( n \right)$

Dabei stellt n die Anzahl der Elemente dar, k die Anzahl der möglichen Werte, m die Differenz aus Maximal- und Minimalwert der Eingabe und d die Anzahl der Stellen der längsten Eingabe.

Sortierung nach Beziehungen

Wenn nicht mehr nach Eigenschaften, sondern nur noch nach paarweisen Beziehungen sortiert werden kann, so spricht man von einer topologischen Sortierung. Dies ist beispielsweise der Fall, wenn Aufgaben erledigt werden müssen, manche Aufgaben aber unbedingt vor anderen durchzuführen sind, bei anderen jedoch die Reihenfolge keine Rolle spielt.

Für das topologische Sortieren gibt es Algorithmen, deren Laufzeit von der Anzahl der Beziehungen $\mathcal{O}\left( m \right)$ abhängt. Topologisches Sortieren ist nicht möglich, wenn gegenseitige (zyklische) Abhängigkeiten bestehen. Eine topologische Sortierung muss nicht eindeutig sein.

Wenn die Beziehungen vollständig sind, also für je zwei Objekte eine Abhängigkeit vorgegeben ist, so geht die topologische Sortierung in eine gewöhnliche Sortierung über. Das Laufzeitverhalten der Algorithmen bei n Objekten ist dann $\mathcal{O}\left( 1 \right)$ .

Indirektes Sortieren

In den Fällen, bei denen das Umstellen der Daten mit hohem Aufwand verbunden ist, kann man auch indirektes Sortieren anwenden. Man benötigt dazu zusätzlichen Speicher proportional zur Anzahl der Elemente (in der Regel 4 Bytes pro Element). Dann wird dieses Array indirekt sortiert. Um die eigentlichen Daten letztendlich in die richtige Reihenfolge zu bringen, ist ein zusätzlicher Aufwand von $\mathcal{O}\left( n \right)$ erforderlich.

Beweis der unteren Schranke für vergleichsbasiertes Sortieren

Es lässt sich beweisen, dass ein vergleichsbasiertes Sortierverfahren nicht schneller als $\Omega(n\cdot \log(n))$ sein kann:

Sei $B$ der Entscheidungsbaum für die Zahlenfolge $X = (x_1, \ldots ,x_n)$ . Da alle Permutationen von $X$ das Ergebnis des Sortieralgorithmus sein könnten, muss der Entscheidungsbaum $B$ mindestens $n!$ Blätter haben. Da eine Mindestanzahl von Schritten gesucht ist, treten im Entscheidungsbaum keine unnötigen Vergleiche auf.

In einem Entscheidungsbaum mit $n!$ Blättern beträgt die maximale und die mittlere Tiefe eines Blattes mindestens $log(n!)$ . Da eine untere Schranke gesucht ist, kann $n!$ mittels $n! \ge \left( \frac{n}{2} \right)^{n/2}$ nach unten hin abgeschätzt werden. Damit gilt $\log(n!) \ge \left( \frac{n}{2} \right)\cdot\log\left( \frac{n}{2} \right)=\Omega(n\cdot\log(n))$ .

Es bleibt noch zu zeigen, dass in einem Binärbaum mit $k$ Blättern die maximale und die mittlere Tiefe eines Blattes mindestens $log(k)$ beträgt. Angenommen $B$ sei ein Binärbaum, für welchen die obige Aussage nicht gilt. Seien $T 1$ und $T 2$ Teilbäume eines Binärbaumes mit $k > 2$ Blättern. Für die Anzahl der Blätter $k 1$ in $T 1$ bzw. $k 2$ in $T 2$ gilt nun offensichtlich $k 1 < k$ , $k 2 < k$ und $k 1 + k 2 = k$ . Für die Tiefe jedes Blattes, bezogen auf die Wurzel von $B$ , gilt:

$\mbox{tiefe}_{mittlere}(B)=\frac{k_1}{k}\cdot(\mbox{tiefe}_{mittlere}(T_1)+1)+\frac{k_2}{k}\cdot(\mbox{tiefe}_{mittlere}(T_2)+1)$

$\ge \frac{k_1}{k}\cdot(\log(k_1)+1)+\frac{k_2}{k}\cdot(\log(k_2)+1) = \frac{1}{k}\cdot(k_1\cdot\log(2\cdot k_1)+k_2\cdot \log(2\cdot k_2))$

Das Minimum dieser Funktion liegt nun bei $k 1 + k 2 = k$ und $k_1 = k_2 = \frac{k}{2}$ . Eingesetzt in obige Formel ergibt das:

$\mbox{tiefe}_{mittlere}(B) \ge \frac{1}{k}\cdot \left(\frac{k}{2}\cdot\log(k)+\frac{k}{2}\cdot\log(k)\right) =\log(k)$ .

Dies ergibt einen Widerspruch zur Annahme, womit obige Aussage bewiesen ist.

Literatur

Donald E. Knuth: Sorting and Searching. In: The Art of Computer Programming, Band 3. 2. Auflage. Addison Wesley, Boston 2003, ISBN 0-201-89685-0.
Niklaus Wirth: Algorithmen und Datenstrukturen. 5. Auflage. Teubner Verlag, Stuttgart/Leipzig 1999, ISBN 3-519-22250-7.
Robert Sedgewick: Algorithms in Java, Part 1–4. 3. Auflage. Addison-Wesley, Boston 2002, ISBN 0-201-36120-5.
Thomas H. Cormen, Charles Leiserson, Ronald L. Rivest, Clifford Stein: Algorithmen - Eine Einführung. 3. Auflage. Oldenbourg Verlag, München 2010 (Originaltitel: Introduction to Algorithms, übersetzt von Paul Molitor), ISBN 978-3-486-59002-9.
Thomas H. Cormen, Charles Leiserson, Ronald L. Rivest, Clifford Stein: Introduction to Algorithms. 3. Auflage. The MIT Press, Cambridge (Mass.)/London 2009, ISBN 978-0-262-03384-8.
Thomas Ottmann, Peter Widmayer: Algorithmen und Datenstrukturen. 3. Auflage. Spektrum Verlag, Heidelberg/Berlin/Oxford 1996, ISBN 3-8274-0110-0.
Anany Levitin: Introduction to The Design and Analysis of Algorithms. 2. Auflage. Pearson Addison-Wesley, Boston 2007, ISBN 978-0-321-36413-5.

Weblinks

Commons: Sortieralgorithmen – Sammlung von Bildern, Videos und Audiodateien

Grafischer Vergleich Einige Sortieralgorithmen (Java)
Übersicht und Beschreibung vielfältiger Sortieralgorithmen oder alternativ
AniSort – Visualisierung von 6 verschiedenen Sortieralgorithmen (Java Applet)
JavaScript – Interaktive Visualisierung verschiedener Sortieralgorithmen

Kategorie:

Sortieralgorithmus

Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

Stabil (Sortierverfahren) — Ein stabiles Sortierverfahren ist ein Sortieralgorithmus, der die Reihenfolge der Datensätze, deren Sortierschlüssel gleich sind, bewahrt. Wenn beispielsweise eine Liste alphabetisch sortierter Personendateien nach dem Geburtsdatum neu sortiert… … Deutsch Wikipedia
Stabiles Sortierverfahren — Ein stabiles Sortierverfahren ist ein Sortieralgorithmus, der die Reihenfolge der Datensätze, deren Sortierschlüssel gleich sind, bewahrt. Wenn beispielsweise eine Liste alphabetisch sortierter Personendateien nach dem Geburtsdatum neu sortiert… … Deutsch Wikipedia
Stabilität (Sortierverfahren) — Ein stabiles Sortierverfahren ist ein Sortieralgorithmus, der die Reihenfolge der Datensätze, deren Sortierschlüssel gleich sind, bewahrt. Wenn beispielsweise eine Liste alphabetisch sortierter Personendateien nach dem Geburtsdatum neu sortiert… … Deutsch Wikipedia
Sortieralgorithmen — Ein Sortierverfahren ist ein Algorithmus, der dazu dient, eine Liste von Elementen zu sortieren. Voraussetzung ist, dass auf der Menge der Elemente eine strenge schwache Ordnung definiert ist, z. B. die lexikographische Ordnung von Zeichenketten… … Deutsch Wikipedia
Sortieralgorithmus — Ein Sortierverfahren ist ein Algorithmus, der dazu dient, eine Liste von Elementen zu sortieren. Voraussetzung ist, dass auf der Menge der Elemente eine strenge schwache Ordnung definiert ist, z. B. die lexikographische Ordnung von Zeichenketten… … Deutsch Wikipedia
Distributionsort — Radixsort (von lat. Wurzel, Basis) oder auch Distributionsort (von engl. Distribution – „Verteilung“), oder im Deutschen Fachverteilen, ist ein lineares, stabiles Sortierverfahren, das out of place arbeitet und auf Countingsort basiert. Das… … Deutsch Wikipedia
Einfügesort — Insertionsort (engl. insertion – das Einfügen, sort – sortieren) ist ein einfaches stabiles Sortierverfahren. Es ist weit weniger effizient als andere anspruchsvollere Sortierverfahren. Dafür hat es jedoch folgende Vorteile: Es ist einfach zu… … Deutsch Wikipedia
Fachverteilen — Radixsort (von lat. Wurzel, Basis) oder auch Distributionsort (von engl. Distribution – „Verteilung“), oder im Deutschen Fachverteilen, ist ein lineares, stabiles Sortierverfahren, das out of place arbeitet und auf Countingsort basiert. Das… … Deutsch Wikipedia
Fachverteilung — Radixsort (von lat. Wurzel, Basis) oder auch Distributionsort (von engl. Distribution – „Verteilung“), oder im Deutschen Fachverteilen, ist ein lineares, stabiles Sortierverfahren, das out of place arbeitet und auf Countingsort basiert. Das… … Deutsch Wikipedia
Gieriger Algorithmus — Greedy Algorithmen bzw. Gierige Algorithmen bilden eine spezielle Klasse von Algorithmen, wie sie in der Informatik auftreten. Sie zeichnen sich dadurch aus, dass sie schrittweise denjenigen Folgezustand auswählen, der zum Zeitpunkt der Wahl den… … Deutsch Wikipedia

Academic dictionaries and encyclopedias

Sortierverfahren

Inhaltsverzeichnis

Vergleichsbasiertes Sortieren

Nicht-vergleichsbasiertes Sortieren

Sortierung nach Beziehungen

Indirektes Sortieren

Beweis der unteren Schranke für vergleichsbasiertes Sortieren

Literatur

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Sortierverfahren

Inhaltsverzeichnis

Vergleichsbasiertes Sortieren

Nicht-vergleichsbasiertes Sortieren

Sortierung nach Beziehungen

Indirektes Sortieren

Beweis der unteren Schranke für vergleichsbasiertes Sortieren

Literatur

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link