Satz von Cochran

Satz von Cochran

In der Statistik wird der Satz von Cochran in der Varianzanalyse verwendet. Der Satz geht auf den schottischen Mathematiker William Gemmell Cochran zurück.

Man nimmt an U1, ..., Un seien stochastisch unabhängige standardnormalverteilte Zufallsvariablen, und es gilt


\sum_{i=1}^n U_i^2=Q_1+\cdots + Q_k,

wobei jedes Qi die Summe der Quadrate von Linearkombinationen der Us darstellt. Ferner nimmt man an, dass


r_1+\cdots +r_k=n,

wobei ri der Rang von Qi ist. Der Satz von Cochran besagt, dass die Qi unabhängig sind mit einer Chi-Quadrat-Verteilung mit ri Freiheitsgraden.

Der Satz von Cochran ist die Umkehrung des Satzes von Fisher.

Beispiel

Falls X1, ..., Xn unabhängige normalverteilte Zufallsvariablen mit Erwartungswert μ und Standardabweichung σ sind, dann gilt

U_i=(X_i-\mu)/\sigma \;

ist standardnormalverteilt für jedes i.

Jetzt kann man folgendes schreiben


\sum_{i=1}^{n} U_i^2=\sum\limits_{i=1}^{n}\left(\frac{X_i-\overline{X}}{\sigma}\right)^2
+ n\left(\frac{\overline{X}-\mu}{\sigma}\right)^2

Damit man diese Identität erkennt, muss man auf beiden Seiten mit σ multiplizieren und beachten, dass gilt


\sum_{i=1}^{n}(X_i-\mu)^2=
\sum_{i=1}^{n}(X_i-\overline{X}+\overline{X}-\mu)^2

und erweitert, um zu zeigen


\sum_{i=1}^{n}(X_i-\overline{X})^2+\sum_{i=1}^{n}(\overline{X}-\mu)^2+
2\sum_{i=1}^{n}(X_i-\overline{X})(\overline{X}-\mu).

Der dritte Term ist null, weil dies gleich einer Konstante mal

\sum_{i=1}^{n}(\overline{X}-X_i),

ist, und der zweite Term ist besteht nur aus n identischen Termen, die zusammengefügt wurden.

Kombiniert man die obigen Ergebnisse und teilt anschließend durch σ2, dann erhält man:


\sum_{i=1}^{n}\left(\frac{X_i-\mu}{\sigma}\right)^2=
\sum_{i=1}^{n}\left(\frac{X_i-\overline{X}}{\sigma}\right)^2
+n\left(\frac{\overline{X}-\mu}{\sigma}\right)^2
=Q_1+Q_2.

Jetzt ist der Rang von Q2 gerade gleich 1 (es ist das Quadrat von nur einer Linearkombination der standardnormalverteilten Zufallsvariablen). Der Rang von Q1 ist gleich n − 1, und daher sind die Bedingungen des Satzes von Cochran erfüllt.

Der Satz von Cochran besagt dann, dass Q1 und Q2 unabhängig sind, mit einer Chi-Quadrat-Verteilung mit n − 1 und 1 Freiheitsgrad.

Dies zeigt, dass der Mittelwert und die Varianz unabhängig sind; Ferner gilt


(\overline{X}-\mu)^2\sim \frac{\sigma^2}{n}\chi^2_1.

Um die Varianz σ2 zu schätzen, wird ein häufig verwendeter Schätzer benutzt


\widehat{\sigma}^2=
\frac{1}{n}\sum_{i=1}^{n}\left(
X_i-\overline{X}\right)^2.

Der Satz von Cochran zeigt, dass


\widehat{\sigma}^2\sim
\frac{\sigma^2}{n}\chi^2_{n-1},

was zeigt, dass der Erwartungswert von \widehat{\sigma}^2 von σ2 (n − 1)/n ist.

Beide Verteilungen sind proportional zur wahren aber unbekannten Varianz σ2; Daher ist ihr Verhältnis unabhängig von σ2, und weil sie unabhängig sind, erhält man


\frac{\left(\overline{X}-\mu\right)^2}
{\frac{1}{n}\sum_{i=1}^{n}\left(X_i-\overline{X}\right)^2}\sim
F_{1,n}
,

wobei F1,n die F-Verteilung mit 1 und n Freiheitsgraden darstellt (siehe auch Student's t-Verteilung).


Wikimedia Foundation.

См. также в других словарях:

  • William Gemmell Cochran — (* 15. Juli 1909 in Rutherglen bei Glasgow, Schottland; † 29. März 1980 in Orleans (Massachusetts)) war ein schottischer Statistiker. Cochran studierte Mathematik an der Universität von Glasgow und Cambridge. In den Jahren 1934 bis 1939 arbeitete …   Deutsch Wikipedia

  • Liste mathematischer Sätze — Inhaltsverzeichnis A B C D E F G H I J K L M N O P Q R S T U V W X Y Z A Satz von Abel Ruffini: eine allgemeine Polynomgleichung vom …   Deutsch Wikipedia

  • Einfachregression — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… …   Deutsch Wikipedia

  • Lineare Regressionsanalyse — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… …   Deutsch Wikipedia

  • Multiple Regression — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… …   Deutsch Wikipedia

  • OLS-Regression — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… …   Deutsch Wikipedia

  • Ordinary Least Squares — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… …   Deutsch Wikipedia

  • Regressions-Analyse — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… …   Deutsch Wikipedia

  • Regressionsgerade — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… …   Deutsch Wikipedia

  • Regressionskurve — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… …   Deutsch Wikipedia


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»