Cantor'sche Paarungsfunktion

Cantor'sche Paarungsfunktion

Die Cantorsche Paarungsfunktion (manchmal auch Nummerierungsfunktion) ist eine in der theoretischen Informatik verwendete Abbildung, die auf dem Diagonalargument von Cantor basiert. Ihre Verallgemeinerung von Paaren auf Tupel wird als Cantorsche Tupelfunktion bezeichnet.

Mit ihr kann man ein beliebiges Paar (i, j) natürlicher Zahlen durch eine einzige natürliche Zahl k darstellen. Man nummeriert damit alle Zahlenpaare. Diese Nummerierung ist sogar eindeutig umkehrbar. Das heißt, man kann aus der Zahl k das ursprüngliche Zahlenpaar (i, j) wieder ermitteln. Die Idee der diagonalen Abzählung der Menge aller Paare natürlicher Zahlen \mathbb{N}^2 geht auf Georg Cantor zurück.

Mathematisch gesprochen heißt das: Die Cantorsche Paarungsfunktion ist eine bijektive totale Funktion, die jedem 2-Tupel (i, j) natürlicher Zahlen eine natürliche Zahl k zuordnet.

Inhaltsverzeichnis

Motivation

In der theoretischen Informatik wird die Cantorsche Paarungsfunktion benutzt, um Funktionen, die mehr als einen Parameter haben, auf Funktionen zurückführen, die nur genau einen Parameter haben, was viele Beweise deutlich erleichtert.

Die Zurückführung eines Problems auf ein (evtl. einfacheres) bereits bekanntes Problem, ist eine bewährte Beweistechnik, die man als Reduktion bezeichnet.

Mit der Cantorschen Paarungsfunktion lässt sich die Berechenbarkeit von k-stelligen Zahlenfunktionen auf die Berechenbarkeit von einstelligen Zahlenfunktionen reduzieren. D.h. man kann sich bei der Untersuchung der Berechenbarkeit von Zahlenfunktionen auf die Untersuchung von einstelligen beschränken und weiß, dass die gewonnenen Ergebnisse für alle, also auch für die mehrstelligen Zahlenfunktionen gelten.

Grundsätzliches

Es ist vielleicht nicht unmittelbar einsichtig, dass es möglich ist, alle beliebigen Kombinationen von zwei Zahlen durch eine Zahl zu verschlüsseln: Die Menge aller Zahlenpaare \mathbb{N}^2 = \mathbb{N}\times\mathbb{N} scheint viel größer zu sein als die Menge aller Zahlen \mathbb{N}.

  ^
  | . . . . . . . . . . . .
  x x x x x x x x x x x x .
  x x x x x x x x x x x x .
  x x x x x x x x x x x x .    ~
 -x-x-x-x-x-x-x-x-x-x-x-x->    =   -x-x-x-x-x-x-x-x-x-x-x-x-> 
  |                                 0

 |N x |N als zweidimensionales     |N als Menge von Punkten
 Gitter                            auf dem Zahlenstrahl  1     

Die Cantorsche Paarungsfunktion zeigt jedoch, dass beide Mengen gleich groß sind, denn sie stellt eine 1:1-Beziehung her, sie ist eine Bijektion.

Eine Menge, die man bijektiv auf die natürlichen Zahlen abbilden kann, nennt man abzählbar unendlich; insbesondere haben die natürlichen Zahlen selbst diese Eigenschaft. Die Cantorsche Paarungsfunktion zeigt dann, dass auch die Menge der Paare natürlicher Zahlen abzählbar unendlich ist.

Definition

Die Cantorsche Paarungsfunktion definiert man als

\pi : \mathbb{N} \times \mathbb{N} \to \mathbb{N}, ~ (x,y) \mapsto 
      \pi(x, y) := \sum_{i=0}^{x+y} i + y = \frac{1}{2} (x + y) (x + y + 1) + y

wobei man die natürlichen Zahlen bei 0 beginnen lässt.

Kurzschreibweise:

\langle i, j \rangle = \pi(i,j) = k

k kodiert das Paar (i, j)

Hier ist eine Skizze der Diagonal-Abzählung:

   | 0   1   2   3   4    y
 --+----------------------->
 0 | 0   2   5   9  14   .
 1 | 1   4   8  13   .
 2 | 3   7  12   .
 3 | 6  11   .
 4 |10   .
   | .
 x v

Auf den Achsen sind die beiden Werte aufgetragen, wie in einer Entfernungstabelle schlägt man den Wert der Cantorschen Paarungsfunktion im Schnittpunkt nach, zum Beispiel \langle 1, 2\rangle = 8.

Die Nummerierung ist denkbar einfach: Man zählt diagonal mit Null beginnend die Paare ab: (0,0), (1,0), (0,1), (2,0), (1,1), (0,2) usw.

Man kann das obige Bildungsgesetz direkt ablesen, wenn man sich die Summation jeweils über eine Spalte verdeutlicht.

Erweiterung auf n-Tupel

Durch mehrfache Anwendung lassen sich auch n-Tupel eindeutig nummerieren. Man definiert induktiv für k = 1,2,3,\ldots die Funktionen

\pi^{(k)} : \mathbb{N}^k \to \mathbb{N}

mit Hilfe der Paarungsfunktion π durch:

π(1)(x) = x

und

\pi^{(n+1)}(x_1, \ldots, x_{n+1}) = \pi(\pi^{(n)}(x_1, \ldots, x_{n}), x_{n+1})

Die Funktionen π(k) bezeichnet man als Cantorsche Tupelfunktionen.

Kurzschreibweise:

\langle x_1, x_2, \ldots, x_n\rangle  := \pi^{(n)}(x_1, x_2, \ldots, x_n)

Umkehrfunktion

Die Cantorsche Paarungsfunktion ist umkehrbar. Die Umkehrung ist eindeutig und berechenbar. Letzteres ist für die Anwendung in der theoretischen Informatik wichtig, da die Berechenbarkeit der Funktion und der Umkehrfunktion Bedingung sind, um ohne Probleme alle berechenbaren Funktionen durch einstellige Funktionen darzustellen.

Umkehrbar heißt, man kann aus einer Zahl n auf die beiden Zahlen x und y schließen, für die gilt: n = π(x,y). Die Umkehrfunktion setzt sich aus zwei Hilfsfunktionen f und q zusammen. Diese Funktionen werden weiter unten formal definiert.

Beispiel

Welches Zahlenpaar repräsentiert die Zahl 17?

Dazu bestimmt man zunächst eine Zahl j, die die größte Zahl ist, für die gilt f(j) \le 17. Das lässt sich am einfachsten durch Ausprobieren ermitteln. Dabei hilft die Wertetabelle von f(j):

 j      1    2    3    4    5    6 
 f(j)   1    3    6   10   15   21

Damit ergibt sich j zu 5. Dann ist y = 17 - f(j) = 17 - f(5) = 17 - 15 = 2. Und x = j - y = 5 - 2 = 3.

Also ist <3,2> = 17. Das lässt sich einfach anhand der Skizze oben verifizieren.

Formale Definition

Man schreibt ihre Inverse \left(\pi^{(k)}\right)^{-1}:\mathbb{N} \to \mathbb{N}^k komponentenweise als \pi^{(k)}_i:\mathbb{N} \to \mathbb{N}, wobei gilt:

\pi^{(k)}_i = \mbox{pr}^{(k)}_i \circ \left(\pi^{(k)}\right)^{-1}

vermöge der Projektion

\mbox{pr}^{(k)}_i(x_1, \ldots, x_k) = x_i,

welche die i-te Komponente aus einem Tupel der Länge k auswählt.

Bei Paaren (der Fall k = 2) schreibt man kurz \pi^{(2)}_1 = \pi_1 und \pi^{(2)}_2 = \pi_2, so dass man die Inverse der Paarungsfunktion als π − 1 = (π12) schreiben kann.

Mit den Hilfsfunktionen

f(w) = \sum_{i=0}^w i = \frac{1}{2}w(w+1)

und

q(z) = \max\{v | f(v) \le z\}

kann man π1 und π2 wie folgt berechnen:

π2(z) = zf(q(z))

und

π1(z) = q(z) − π2(z).

Computerimplementierungen

Implementierung der Berechnungen in Java

Bei großen Werten von z steigt der Zeitbedarf durch die WHILE-Schleife enorm, daher wurde darauf verzichtet, Schleifen zu verwenden.

 public class Cantor {
   public static long compute(long x, long y) {
     return (x+y)*(x+y+1)/2 + y;
   }
   public static long computeX(long z) {
     long j  = (long) Math.floor(Math.sqrt(0.25 + 2*z) - 0.5);
     return j - computeY(z);
   }
   public static long computeY(long z) {
     long j  = (long) Math.floor(Math.sqrt(0.25 + 2*z) - 0.5);
     return z - j*(j+1)/2;
   }
 }

Die Methode compute berechnet die dem übergebenen Zahlenpaar x und y zugeordnete Zahl, computeX und computeY sind die Umkehrfunktionen von compute.

Pascal-Programm zur Berechnung der Umkehrung

Das folgende Pascal-Programm berechnet die Umkehrfunktion π − 1:

procedure CantorPair(    I   : Integer;
                     Var X,Y : Integer);
{ Gibt das i-te Paar (X,Y) in Diagonalabzaehlung zurueck }
var
   J : Integer;
  
   function F(Z : Integer) : Integer;
   begin
      F := Z * (Z + 1) div 2  
   end;

   function Q(Z : Integer) : Integer;
   var
      V : Integer;
   begin
      V := 0;
      while F(V) <= Z do
         V := V + 1;
      Q := V - 1
   end;

begin
   J := Q(I);
   Y := I - F(J);
   X := J - Y;
end;


Hinweis: Wird das Pascal-Programm auf realen Rechnern übersetzt, muss es mit den Einschränkungen realer Rechner leben. Das heißt insbesondere, dass Speicherplatzbegrenzungen und Rundungsungenauigkeiten das Ergebnis verfälschen können. Das ist allerdings erst bei sehr großen Werten von z bzw. x und y relevant. Für die Anschauung ist ein Pascal-Programm jedoch verständlicher als eine Registermaschine.

Berechenbarkeit

Die Cantorsche Paarungsfunktion ist eine totale, bijektive, berechenbare (sogar primitiv rekursive) Funktion, daher ist auch ihre Umkehrung berechenbar.

Beweis Berechenbarkeit der Cantorschen Paarungsfunktion

Eine Methode, zu beweisen, dass eine Funktion berechenbar ist, ist eine Registermaschine anzugeben, die die Funktion berechnet.

Dieser Maschine muss man im Register R1 den Funktionsparameter x und im Register R2 y übergeben. Man erhält dann im Ausgaberegister R0 den Wert von π an der Stelle (x,y).

Die folgende zweistellige Maschine berechnet die Cantorsche Paarungsfunktion \pi(x,y) = \frac{1}{2} (x + y) (x + y + 1) + y:

R4 = R1 + R2;
R5 = R1 + R2 + 1;
R4 = R4 * R5;
R4 = R4 / 2;
R0 = R4 + R2;

Auf einen formalen Beweis, dass die Registermaschine tatsächlich die Funktion berechnet, wird verzichtet: Das ist offensichtlich erkennbar, wenn man die Funktionsvorschrift zur Berechnung der Cantorschen Paarungsfunktion mit der Maschine vergleicht.

Diese Registermaschine nutzt jedoch Befehle, die die einfache Registermaschine nicht kennt. Die einfache Registermaschine kennt nur die Operationen R+1, R-1 und den einfachen Test.

Durch Verfeinerung lässt sich diese Registermaschine aber auf eine einfache Registermaschine zurückführen.

Damit gibt es eine Registermaschine, die die Cantorsche Paarungsfunktion berechnet. Somit ist die Cantorsche Paarungsfunktion berechenbar.

Beweis der Berechenbarkeit der Umkehrfunktion

Für den Beweis der Umkehrfunktion bietet es sich an, eine andere Definition der Berechenbarkeit zu nutzen:

Eine Funktion ist berechenbar, genau dann, wenn ein WHILE-Programm existiert, das diese Funktion berechnet.

Das oben angegebene Pascal-Programm lässt sich zu einem WHILE-Programm verfeinern. Also gibt es ein WHILE-Programm, das die Umkehrfunktion berechnet. Somit ist auch die Umkehrung berechenbar.

Anwendung der Berechenbarkeit

Dadurch, dass die Cantorsche Paarungsfunktion und ihre Umkehrung berechenbar sind, folgt, dass es für die Theorie der Berechenbarkeit ausreichend ist, sich mit einstelligen Funktionen von \mathbb{N} \to \mathbb{N} zu befassen. Für Funktionen von \mathbb{N}^n \to \mathbb{N}^n folgt die Berechenbarkeit dann durch die Anwendung der Cantorschen Paarungsfunktion und ihrer Umkehrfunktion:

 f : \mathbb{N}^n \to \mathbb{N}^m berechenbar, genau dann wenn es eine Funktion g gibt, mit
 g : \mathbb{N} \to \mathbb{N},
 \forall n \in \mathbb{N}^n gilt f (n) := \pi_m^{-1} ( g ( \pi_n (n) ) )
 und g ist berechenbar.

Man kann zum Beispiel zeigen, dass sich alle rationalen Zahlen durch ein 3-Tupel i,j,k darstellen lassen. Damit kann man die Berechenbarkeit leicht von den natürlichen Zahlen auf die Menge der rationalen Zahlen erweitern.

Herkunft

Die Idee stammt aus der Mengenlehre von Georg Cantor. Er hatte die Idee, die Größe einer Menge (Mächtigkeit, Kardinalität) mit der Größe einer anderen Menge zu vergleichen, indem man versucht, eine 1:1 Abbildung (Bijektion) der Elemente dieser Menge mit den Elementen der anderen Menge zu finden. Jedem Element der ersten Menge soll genau ein Element der zweiten Menge zugeordnet werden und umgekehrt. Das erscheint kompliziert, findet aber seine Berechtigung, wenn es um Mengen mit unendlich vielen Elementen geht. Siehe auch Galileis Paradoxon.

Mit einer Diagonal-Abzählung, wie oben angedeutet, zeigt man leicht, dass bei einer abzählbaren Menge M das kartesische Produkt M \times M = M^2 = \{ (a, b) | a,b \in M \} genau so mächtig ist wie M, was vielleicht gegen die Intuition spricht, da hier die Mengen in unterschiedlicher Mächtigkeit bzw. die Tupel in verschiedener Länge auftreten.

Alternativen

Es gibt viele andere Möglichkeiten Paare natürlicher Zahlen bijektiv durch eine natürliche Zahl zu kodieren, z. B. kann man ein wenig anders abzählen:

   | 0   1   2   3   4    y
 --+----------------------->
 0 | 0   2   3   9  10   .
 1 | 1   4   8  11   .
 2 | 5   7  12   .
 3 | 6  13  .
 4 |14   .
   | .
 x v

Auch die einfache Formel 2^x\cdot(2y+1) liefert eine Bijektion zwischen {\mathbb N}\times 
{\mathbb N} und {\mathbb N} \setminus \{0\}:


   | 0   1   2   3   4    y
 --+----------------------->
 0 | 1   3   5   7   9   .
 1 | 2   6  10  14  18   .
 2 | 4  12  20  28  36   .       z=2^x\cdot(2y+1)
 3 | 8  24  40  56  72   . 
 4 |16  48  80 112 144   .
   | .
 x v

Beweis der Umkehrbarkeit: Faktorisiere z. Dann ist x die größte natürliche Zahl, sodass 2x ein Teiler von z ist, also die Anzahl der Faktoren 2 in der Primfaktorzerlegung von x. Sei R= z/2x. Dann ist y=(R-1)/2.

Die Primfaktorzerlegung gibt eine Möglichkeit an, beliebige endliche Tupel natürlicher Zahlen durch natürliche Zahlen zu kodieren:

\langle i_1, i_2, i_3, i_4, i_5, \ldots \rangle  = 2^{i_1+1} 3^{i_2+1} 5^{i_3+1} 7^{i_4+1} 11^{i_5+1} \cdots

Die Erhöhung der Indizes ik um 1 stellt sicher, dass ein Eintrag 0 von einem nicht existenten Eintrag unterschieden werden kann.

Beispiel:

\langle 2, 1, 0, 1, 0\rangle = 2^3 3^2 5^1 7^2 11^1    =  8\cdot 9 \cdot 5 \cdot 49 \cdot 11 und \langle 2, 1, 0, 1\rangle = 2^3 3^2 5^1 7^2    =  8\cdot 9 \cdot 5 \cdot 49

Literatur

  • Klaus Weihrauch: Computability, Springer (1987), ISBN 3-540-13721-1
  • Klaus Weihrauch: Einführung in die Theoretische Informatik A, Kurs 01653 der FernUniversität in Hagen (die aktualisierte Fassung des 1. Teils des Computability Buches, einsehbar in Studienzentren oder im Rahmen eines Akademiestudiums einzeln beziehbar)
  • Eric W. Weisstein et al.: Pairing Function, MathWorld--A Wolfram Web Resource
  • Erk, Priese: Theoretische Informatik, 2. Auflage, Springer, S. 263 f, ISBN 3540426248
  • Schöning: Theoretische Informatik kurzgefasst, 4. Auflage, Spektrum, S. 111 f, ISBN 3827410991

Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”