Allgemeines Lineares Modell

Das Lineare Modell ist eines der am häufigsten untersuchten Modelle in der Statistik. Viele statistische Verfahren wie Mittelwertsvergleiche und varianzanalytische Verfahren, Korrelations- und Regressionsrechnung kann man als Spezialfälle linearer Modelle ansehen.

Inhaltsverzeichnis

Modellbeschreibung

Grundvoraussetzung für die Anwendung solcher Modelle in der statistischen Praxis ist die Annahme, dass ein linearer Zusammenhang zwischen den beobachteten Daten und den bekannten Einflussvariablen besteht. Die Methoden der Statistik (prominent ist vor allem die Methode der kleinsten Quadrate) liefern dann rein quantitative Resultate über den konkreten Zusammenhang zwischen Beobachtungen und Einflüssen.

Damit solche Modelle überhaupt statistisch beobachtet werden können, wird zusätzlich angenommen, dass die Daten nicht direkt beobachtet werden können, sondern mit Fehlern behaftet sind. Formal lassen sich allgemeine lineare Modelle dann durch Matrixgleichungen der Form

\vec y = \mathbf{X}\vec{\beta} + \vec{\varepsilon}

darstellen, dabei ist

\vec y = \begin{pmatrix} y_1 \\ \vdots \\ y_n \end{pmatrix}

der Vektor der abhängigen Variablen,

\mathbf{ X} = \begin{pmatrix}
 x_{11} & \dots & x_{1k}\\
\vdots & \ddots & \vdots \\
x_{n1} & \dots & x_{nk} \end{pmatrix}

die Matrix der unabhängigen Variablen, auch Designmatrix genannt,

\vec{\beta} = \begin{pmatrix} \beta_1 \\ \vdots \\ \beta_k \end{pmatrix}

der Vektor der Gewichte der mit X beschriebenen Variablen sowie

\vec{\varepsilon} = \begin{pmatrix} \varepsilon_1 \\ \vdots \\ \varepsilon_n \end{pmatrix}

der Vektor der Fehler bzw. Residuen.

Voraussetzungen

Die wesentliche Voraussetzung an das lineare Modell ist, dass es bis auf den Fehlerterm \vec{\varepsilon} das „wirkliche“ Modell beschreibt. Dabei wird in der Regel nicht genau spezifiziert, von welcher Art der Fehler ist; er kann beispielsweise von zusätzlichen Faktoren oder Messfehlern herrühren. Jedoch nimmt man als Grundvoraussetzung an, dass dessen Erwartungswert (in allen Komponenten) 0 ist. Diese Annahme bedeutet, dass das Modell

\vec y = \mathbf{X}\vec{\beta}

grundsätzlich für korrekt gehalten wird und die beobachtete Abweichung als zufällig angesehen wird oder von vernachlässigbaren äußeren Einflüssen herrührt.

Über diese grundlegende Annahme hinaus sind grundsätzlich alle Verteilungsannahmen an \vec{\varepsilon} erlaubt. Typisch ist die Annahme, dass die Komponenten des Vektors unkorreliert sind und dieselbe Varianz σ2 besitzen, wodurch sich mit Hilfe klassischer Verfahren wie der Methode der kleinsten Quadrate einfache Schätzer für \vec{\beta} und σ2 ergeben. Wird zudem vorausgesetzt, dass der Vektor \vec{\varepsilon} multivariat normalverteilt ist, lässt sich ferner zeigen, dass die beiden Schätzer Lösungen der Maximum-Likelihood-Gleichungen sind. Im diesem Modell ist die Unabhängigkeit der Fehler dann gleichbedeutend mit der der yi.

In der Realität ergeben sich oft Situationen, in denen die Annahme der identisch normalverteilten und unabhängigen Fehler nicht haltbar ist. Dieser Fall liegt vor, wenn einige der unabhängigen Variablen und somit auch die Fehler teilweise korreliert sind. Diese notwendige Abweichung von der Annahme der Unabhängigkeit bringt erhebliche methodische Probleme mit sich, da einige der üblichen Schätzverfahren nicht mehr anwendbar sind.

Ziel

Mit Methoden der Regressionsanalyse lassen sich in vielen Fällen aus den Daten sinnvolle Schätzungen und Grenzwertsätze für \vec{\beta} herleiten. Ob tatsächlich ein linearer Zusammenhang zwischen \vec{y} und der Matrix \mathbf{X} besteht, wird dabei nicht untersucht. Lineare Modelle lassen sich immer „hinschreiben“, nur: Ob sie für den konkreten Fall wirklich geeignet sind, muss vorher theoretisch geklärt werden. In den meisten Fällen wird diese Untersuchung jedoch nicht vorgenommen – in bestimmten Situationen liegen überhaupt keine Informationen über die Struktur des Zusammenhangs vor, in anderen Situationen wird ein lineares Modell aufgrund der vergleichsweise einfachen mathematischen Behandlung gewählt.

Die Frage nach der Güte des linearen Zusammenhangs zwischen den beobachteten Daten \vec y und den Regressoren \mathbf{X} wird üblicherweise mit Hilfe des (korrigierten) Bestimmtheitsmaßes R2 beantwortet. Mit dessen Hilfe lässt sich klären, welcher Anteil der Variabilität im Modell durch die gewählten Regressoren erklärt werden kann. Ist dieses Maß klein, so werden üblicherweise weitere Regressoren hinzugenommen.

Varianten

Lineare Modelle lassen sich dahingehend erweitern, dass keine feste Designmatrix untersucht wird, sondern auch diese zufallsbehaftet ist. Die Untersuchungsmethoden ändern sich in diesem Fall nicht substantiell, werden aber deutlich komplizierter und damit rechenaufwendiger.

Sonstiges

Lineare statistische Modelle lassen sich bei entsprechender Umformung im Rahmen einer allgemein gültigen Regressionsgleichung darstellen. Entsprechend können aus der allgemeinen Form (neue) spezielle lineare Verfahren abgeleitet werden.

Literatur

  • Andres, J.: Das allgemeine lineare Modell. In Edgar Erdfelder, Rainer Mausfeld, Thorsten Meiser & Georg Rudinger (Hrsg.), Handbuch quantitative Methoden, 1996 (S.185-200); Weinheim: Belz.
  • Moosbrugger, H.: "Lineare Modelle: Regressions- und Varianzanalysen" (3. Auflage), 2002; Bern, Göttingen, Toronto, Seattle: Verlag Hans Huber
  • Werner, J.: Lineare Statistik, 1997, Weinheim: Belz.

Weblinks


Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Black-Box-Modell — Die Regelungstechnik ist ein Gebiet der Ingenieurwissenschaft und Teilgebiet der Automatisierungstechnik. Sie befasst sich mit der gezielten Beeinflussung von physikalischen, chemischen, biologischen oder anderen Größen in Geräten, Anlagen,… …   Deutsch Wikipedia

  • Grey-Box-Modell — Die Regelungstechnik ist ein Gebiet der Ingenieurwissenschaft und Teilgebiet der Automatisierungstechnik. Sie befasst sich mit der gezielten Beeinflussung von physikalischen, chemischen, biologischen oder anderen Größen in Geräten, Anlagen,… …   Deutsch Wikipedia

  • White-Box-Modell — Die Regelungstechnik ist ein Gebiet der Ingenieurwissenschaft und Teilgebiet der Automatisierungstechnik. Sie befasst sich mit der gezielten Beeinflussung von physikalischen, chemischen, biologischen oder anderen Größen in Geräten, Anlagen,… …   Deutsch Wikipedia

  • ALM — Das Wort Alm bezeichnet: Alm (Bergweide), die Bezeichnung für eine Bergweide, Bergmatte Almhütte, als Abkürzung vor allem in Tirol und Bayern Alm (Fluss), der Name eines Flusses in Österreich Maria Alm, der Name einer Gemeinde im Salzburger Land… …   Deutsch Wikipedia

  • Alm — bezeichnet: eine Bergweide, Bergmatte, alpiner Rasen als Vegetation oder Naturraum, siehe Alm (Bergweide) – dort auch zur Etymologie das Wirtschaftsgebäude einer Alm, die Almhütte unverfestigte Kalkmassen in der Geologie, siehe Weißerde eine alte …   Deutsch Wikipedia

  • Almo (Software) — Aktuelle Version 11.0.4 (4. Januar 2009) Betriebssystem Windows, Kategorie Statistiksoftware Lizenz kommerziell Deutschsprachig ja ? …   Deutsch Wikipedia

  • Regelkreis — Blockschaltbild eines einfachen Standardregelkreises, bestehend aus der Regelstrecke, dem Regler und einer negativen Rückkopplung der Regelgröße y (auch Istwert). Die Regelgröße y wird mit der Führungsgröße (Sollwert) w verglichen. Die… …   Deutsch Wikipedia

  • Regelsystem — Blockschaltbild eines einfachen Standardregelkreises, bestehend aus der Regelstrecke …   Deutsch Wikipedia

  • Smith-Prädiktor — Blockschaltbild eines einfachen Standardregelkreises, bestehend aus der Regelstrecke …   Deutsch Wikipedia

  • Störgrößenaufschaltung — Blockschaltbild eines einfachen Standardregelkreises, bestehend aus der Regelstrecke …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”