Beta-Binomialverteilung

Die Beta-Binomialverteilung ist eine univariate diskrete Wahrscheinlichkeitsverteilung, welche als eine Art Verallgemeinerung der Binomialverteilung angesehen werden kann, da in dieser die Wahrscheinlichkeit von x Erfolgen auf n bei gegebener Wahrscheinlichkeit eines Einzelerfolges angegeben wird, während in der Beta-Binomialverteilung die Erfolgswahrscheinlichkeit nur ungenau bekannt ist und durch eine Betaverteilung B(a,b) beschrieben wird. Es handelt sich somit um eine Mischverteilung.

Die Beta-Binomialverteilung hat drei Parameter: n, a, b

Inhaltsverzeichnis

Definition

Sei X~BeB(n,a,b) eine Zufallsvariable, die wie eine Beta-Binomialverteilung mit den Parametern n, a, b verteilt ist, dann gilt für den Träger x \in \{0,1,\ldots,n\}

P(X=x) = C {n \choose x} \Gamma(a+x) \Gamma(b+n-x)

wobei die Konstante C folgender Massen berechnet wird

C = \frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b) \Gamma (a+b+n)}

und Γ die Gammafunktion ist.

Eine alternative Schreibweise ist

P(X=x) = {n \choose x} \frac{\Beta(a+x , b+n-x)}{\Beta (a, b)}

wobei Β die Betafunktion ist.

Eigenschaften

Der Erwartungswert hängt von allen drei Parametern ab:

E(X) = n \frac{a}{a+b},

so wie auch die Varianz:

Var(X) = n \frac{a b}{(a+b)^2} \frac{a+b+n}{a+b+1}.

Die Schiefe wird angegeben mit

(a + b + 2 n)\frac{b-a}{a+b+2} \sqrt{\frac{1+a+b}{n a b (n+a+b)}}

Spezialfälle

Falls a=1 und b=1, dann handelt es sich um eine diskrete Gleichverteilung mit P(X=x)=\tfrac1{n+1}, da der Träger n + 1 Werte beinhaltet.

Anwendungsbereiche

Die Beta-Binomialverteilung wird typischerweise in Fällen angewendet, bei denen man üblicherweise eine Binomialverteilung benützen würde, aber nicht davon ausgehen kann, dass alle Einzelereignisse dieselbe Wahrscheinlichkeit haben einzutreten, sondern diese Wahrscheinlichkeiten mehr oder minder glockenförmig um einen Wert liegen.

Will man zum Beispiel wissen, wie viele Glühbirnen innerhalb der nächsten 12 Monaten platzen werden, geht aber davon aus, dass die Wahrscheinlichkeit zu platzen von Glühbirne zu Glühbirne abweicht, dann ist eine Beta-Binomialverteilung angebracht.

Empirisch kann man vermuten, mit einer Beta-Binomialverteilung zu tun zu haben, obwohl man eher an ein Binomialmodell denken würde, falls die Daten mehr streuen als von der Binomialverteilung vorgesehen.

Beispiel

Modell in der Bayessche Statistik

Ein Korb enthält eine unbekannte Anzahl von Bälle, von denen man aus anderen Stichproben weiß, dass der Anteil roter Bälle von einer Betaverteilung B(a,b) beschrieben wird.

Es sollen n-mal Bälle gezogen werden (mit Zurücklegen). Die Wahrscheinlichkeit, dass x mal ein roter Ball gezogen wird, ist in der Beta-Binomialverteilung BetaB(n,a,b).

Zahlenbeispiel

Ausgehend von einer kompletten Unwissenheit der apriori Verteilung, die mit einer Beta(1,1) beschrieben wird (Alternativen sind z.B. Beta(\tfrac 12,\tfrac 12), wird eine "Vorstudie" mit einer Ziehung (mit Wiederholung) von 15 Bällen organisiert. Einer dieser Bälle ist rot. Somit wird di a posteriori Verteilung mit der Beta(1 + 1,1 + 14) = Beta(2,15) beschrieben.

Die eigentliche "Studie" sieht eine Ziehung von 40 Bällen vor. Gefragt ist die Wahrscheinlichkeit, dass genau zwei Mal ein roter Ball gezogen wird.

Da in dieser zweiten Ziehung die Wahrscheinlichkeit P(X = x) jene einer BeB(40,2,15) ist, lässt sie sich wie folgt berechnen:

P(X=2, n=40, a=2, b=15) = C {40 \choose 2} \Gamma(2+2) \Gamma(15+40-2)

wobei

C = \frac{\Gamma(2+15)}{\Gamma(2) \Gamma(15) \Gamma (2+15+40)}

und da {40 \choose 2} =  780 und außerdem allgemein \Gamma(k) = (k-1)!\, ist, erhält man

Die im Beispiel benützten Zufallsvariablen
P(X=2 | n=40, a=2, b=15) = \frac{16!}{1 \ 14! \ 56!} (780 \ 6 \ 52!) =
= 780 \ 6 \ \frac{16!}{14!} \ \frac{54!}{56!} = \frac{780}{53} \  \frac{6}{54} \  \frac{15}{55} \ \frac{16}{56} =
 = \frac{260}{53}  \  \frac{2}{77} = 0,12741975 = 12,74%

Dieses Ergebnis weicht wesentlich von jenem, welcher mit einer "einfachen" Binomialverteilung B(n=40, p=\tfrac 1{15} berechnet worden wäre. In diesem Fall bekommt wäre das Ergebnis P(X=2,n=40, p=\tfrac1{15})= 25,19%.

Aus der Grafik wird ersichtlich, dass die "einfache" Binomialverteilung B(n=40, p=\tfrac 1{15}) weniger Ergebnisse "zulässt" als die BeB(n = 40,a = 2,b = 15). Dies geschieht, da man in dem Bayesianischen Modell nicht vernachlässigt, dass der "wahre" Anteil an roten Bällen im Grunde unbekannt ist, und somit die Ergebnisse weit verstreuter sein können.

Literatur

  • Leonhard Held: Methoden der statistischen Inferenz. Likelihood und Bayes, Unter Mitwirkung von Daniel Sabanés Bové, Spektrum Akademischer Verlag Heidelberg 2008, ISBN 978-3-8274-1939-2
  • Jim Albert: Bayesian Computation With R, Springer New York, 2009, ISBN 978-0-387-92297-3 [1]

Siehe auch

Weblinks


Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Binomialverteilung — Dichtefunktion Verteilungsfunktion …   Deutsch Wikipedia

  • Beta-Verteilung — Betaverteilung für verschiedene Parameterwerte Dichten verschiedener beta verteilter Zufallsgrößen Die Betaverteilung ist eine kontinuierliche Wahrsc …   Deutsch Wikipedia

  • Negative Binomialverteilung — Wahrscheinlichkeitsfunktion der negativen Binomialverteilung für r = 10; p = 0.2 (blau), p = 0.5 (grün) und p = 0.8 (rot) Die negative Binomialverteilung (auch Pascal Verteilung) ist eine diskrete Wahrscheinlic …   Deutsch Wikipedia

  • Poisson-Gamma-Verteilung — Die Poisson Gamma Verteilung ist eine univariate Verteilung für diskrete Zufallsvariablen, die in der Bayesschen Statistik und in der Inferenztheorie eine wichtige Rolle spielt, da es sich um eine Mischverteilung handelt. Sie wird auch als… …   Deutsch Wikipedia

  • Liste univariater Wahrscheinlichkeitsverteilungen — Diese Liste univariater Wahrscheinlichkeitsverteilungen gibt einen Überblick über die bekanntesten univariaten (eindimensionalen) Wahrscheinlichkeitsverteilungen. Wahrscheinlichkeitsverteilungen beschreiben, wie sich die Wahrscheinlichkeiten auf… …   Deutsch Wikipedia

  • Bernoullikette — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Dabei werden Artikel gelöscht, die nicht… …   Deutsch Wikipedia

  • Binomial-Verteilung — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Dabei werden Artikel gelöscht, die nicht… …   Deutsch Wikipedia

  • Poissonscher Grenzwertsatz — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Dabei werden Artikel gelöscht, die nicht… …   Deutsch Wikipedia

  • Ziehen mit Zurücklegen — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Dabei werden Artikel gelöscht, die nicht… …   Deutsch Wikipedia

  • Diskrete Verteilung — In der Wahrscheinlichkeitstheorie gibt die Wahrscheinlichkeitsverteilung an, wie sich die Wahrscheinlichkeiten auf die möglichen Zufallsergebnisse, insbesondere die möglichen Werte einer Zufallsvariable, verteilen. Die… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”