Bootstrap (Statistik)

Bootstrapping ist in der Statistik eine Methode des Resampling, dabei werden wiederholt Statistiken auf der Grundlage lediglich einer Stichprobe berechnet. Die zugrunde liegende theoretische Verteilung muss nicht bekannt sein. Diese Methode wurde erstmals von Bradley Efron 1979 in Bootstrap Methods: Another Look at the Jackknife beschrieben.

Der Bootstrap ersetzt in der Regel die theoretische Verteilungsfunktion F einer Zufallsvariablen durch die empirische Verteilungsfunktion (relative Summenhäufigkeitsfunktion) \hat{F} der Stichprobe x_1,\ldots,x_n.

Dafür werden im einfachsten Fall B Bootstrap-Stichproben x_b = (x_1^*,\ldots,x_n^*) \, , b = 1, \ldots, B dadurch generiert, dass jeweils n mal aus der gegebenen Stichprobe ein Wert mit Zurücklegen gezogen wird. Dies entspricht dem wiederholten Ziehen von Zufallszahlen aus der empirischen Verteilungsfunktion \hat{F}. Für jede Bootstrap-Stichprobe wird der Wert T_b(x_1^*,\ldots,x_n^*) = T(x_b) der interessierenden Statistik T berechnet. Die Verteilung von T(X_1,\ldots,X_n) wird schließlich durch die empirische Verteilung der B Werte T_b(x_1^*,\ldots,x_n^*) approximiert.

In weniger intuitiven Modellen wird nicht bloß ein wiederholtes Ziehen aus den bereits vorliegenden Daten durchgeführt. Methodisch lässt sich in Bootstrap-Verfahren auch so vorgehen, dass bestimmte Kenngrößen der unbekannten Verteilung geschätzt werden und anhand dieser Informationen Daten neu generiert werden, indem eine Verteilung mit den geschätzten Größen erzeugt wird. Speziell wenn statistische Tests nicht durchgeführt werden können, weil beispielsweise die Grenzverteilung im Zentralen Grenzwertsatz unbekannt ist, lassen sich so Quantile und/oder p-Werte schätzen.

Weblinks

Literatur

  • Bradley Efron: Bootstrap Methods: Another Look at the Jackknife. In: The Annals of Statistics. 7, Nr. 1, 1979, S. 1–26. doi:10.1214/aos/1176344552
  • B. Efron, R.J. Tibshirani: An introduction to the bootstrap, New York: Chapman & Hall, 1993

Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Statistik — ist die Lehre von Methoden zum Umgang mit quantitativen Informationen (Daten). Sie ist eine Möglichkeit, eine systematische Verbindung zwischen Erfahrung (Empirie) und Theorie herzustellen.[1] Sie ist damit unter anderem die Zusammenfassung… …   Deutsch Wikipedia

  • Bootstrap-Verfahren —   [ buːtstræp , englisch], Resampling Verfahren [ri sɑmpliȖ , englisch], moderne, computerintensive Verfahren der mathematische Statistik. Bei ihnen beruht die statistische Entscheidung nicht direkt auf der ursprünglichen Stichprobe x = (x1, x2 …   Universal-Lexikon

  • Bootstrap — Bootstrapping (englisch für Stiefelschlaufe) steht für: Bootstrapping (Elektrotechnik), zum Erzeugen dynamischer Spannungsquellen in der Elektrotechnik Bootstrapping (Informatik), um auf einen Computersystem aus einem einfachen Prozess ein… …   Deutsch Wikipedia

  • Bootstrap-Kondensator — Bootstrapping (englisch für Stiefelschlaufe) steht für: Bootstrapping (Elektrotechnik), zum Erzeugen dynamischer Spannungsquellen in der Elektrotechnik Bootstrapping (Informatik), um auf einen Computersystem aus einem einfachen Prozess ein… …   Deutsch Wikipedia

  • Bootstrap-Methode — Bootstrapping (englisch für Stiefelschlaufe) steht für: Bootstrapping (Elektrotechnik), zum Erzeugen dynamischer Spannungsquellen in der Elektrotechnik Bootstrapping (Informatik), um auf einen Computersystem aus einem einfachen Prozess ein… …   Deutsch Wikipedia

  • Bootstrap Kondensator — Bootstrapping (englisch für Stiefelschlaufe) steht für: Bootstrapping (Elektrotechnik), zum Erzeugen dynamischer Spannungsquellen in der Elektrotechnik Bootstrapping (Informatik), um auf einen Computersystem aus einem einfachen Prozess ein… …   Deutsch Wikipedia

  • Bootstrapping (Statistik) — Bootstrapping ist in der Statistik eine Methode des Resampling. Dabei werden wiederholt Statistiken auf der Grundlage lediglich einer Stichprobe berechnet. Verwendung finden Bootstrap Methoden, wenn die theoretische Verteilung der… …   Deutsch Wikipedia

  • Jackknife (Statistik) — Jackknife ist in der Statistik eine Methode des Resampling. Jackknife dient dazu, den zufälligen Fehler einer Schätzmethode und eine etwaige Verzerrung zu schätzen. Dabei wird aus den Daten der Stichprobe jeweils ein Datensatz weggelassen und der …   Deutsch Wikipedia

  • Breiman — Leo Breiman (* 27. Januar 1928 in New York City; † 7. Juli 2005 in Berkeley (Kalifornien)) war ein Statistiker an der University of California, Berkeley. Breiman ist der einzige Sohn der osteuropäischen Einwanderer Max und Lena Breiman, sein… …   Deutsch Wikipedia

  • Schätzfunktion — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Bitte hilf mit, die Mängel dieses… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”