Benutzer:P. Birken/Skizze
Allgemeinere Ansätze
[Bearbeiten | Quelltext bearbeiten]Hauptartikel: Regressionsanalyse Weicht man die starken Anforderungen im Verfahren an die Beobachtungsfehler auf, erhält man so genannte verallgemeinerte Kleinste-Quadrate-Ansätze. Wichtige Spezialfälle haben dann wieder eigene Namen, etwa die gewichteten kleinsten Quadrate, bei denen die Fehler zwar weiter als unkorreliert angenommen werden, aber nicht mehr von gleicher Varianz. Dies führt auf ein Problem der Form
Variieren die Varianzen stark, so haben die entsprechenden Normalgleichungen eine sehr große Kondition, weswegen das Problem direkt gelöst werden sollte.
Nimmt man noch weiter an, dass die Fehler in den Messdaten auch in der Modellfunktion berücksichtigt werden sollten, ergeben sich die "totalen kleinsten Quadrate" in der Form
- ,
wobei der Fehler im Modell und der Fehler in den Daten ist.
Schließlich gibt es noch die Möglichkeit, keine Normalverteilung zugrunde zu legen. Dies entspricht beispielsweise der Minimierung nicht in der euklidischen Norm, sondern der 1-Norm.
Alternativer Vorschlag:
Gewichtete Kleinst-Quadrate-Modelle
[Bearbeiten | Quelltext bearbeiten]Im Modell der gewichteten kleinsten Quadrate werden die quadrierten Residuen passend gewichtet, so dass man als Ansatz
erhält. Dieser Ansatz ist ein Ergebnis des verallgemeinerten, oder auch generalisiert genannten, linearen Modells. Man erhält es, wenn man statt der Annahme stochastisch unabhängiger normalverteilter Störvariablen mit gleicher Varianz eine Verteilung der Exponentialfamilie, wie etwa die Binomialverteilung zulässt. Dies ermöglicht beispielsweise die Modellierung der abhängigen Variablen als Indikatorvariable, die nur die Werte 0 und 1 annehmen kann. Aber auch die Verwendung normalverteilter Störvariablen mit beliebiger Kovarianzmatrix wird durch das generalisierte Modell abgedeckt. Die folgenden Abschnitte geben Beispiele für den gewichteten Ansatz:
Normalverteilte Störgröße mit Kovarianzmatrix
[Bearbeiten | Quelltext bearbeiten]Die n Störvariablen haben eine nxn-Kovarianzmatrix , die positiv definit ist. Es ergibt sich hier für das GLS-Problem (GLS = generalized least squares)der Vektor der Regressionskoeffizienten
als Lösung des Kleinst-Quadrate-Problems. Diese Lösung wird verallgemeinerter Schätzer oder auch Aitken-Schätzer genannt. Methodisch diffizil ist hier meistens die konkrete Schätzung der Kovarianzmatrix , gefolgt von der eigentlichen GLS-Schätzung.
Ist die Kovarianzmatrix der Störgröße eine Diagonalmatrix, auf deren Hauptdiagonale die Varianzen der einzelnen Störgrößen stehen, ist die Inverse der Kovarianzmatrix eine Diagonalmatrix, deren Elemente die Kehrwerte der entsprechenden Varianzen sind. Hier vereinfacht sich die Quadratsumme der Residuen zu
Der Lösungsvektor x ist dann
mit der obengenannten Inversen. Bezeichnet man die ite Zeile der Matrix A mit , dann ergibt sich der Vektor x als
mit \sigma^2 als arithmetischem Mittel der einzelnen Varianzen
Bildet die Matrix A der unabhängigen Variablen eine Designmatrix, die in einer Gruppierung der y-Werte resultiert, deren Varianz gruppenweise gleich bleibt, werden die y-Werte durch die Gruppengröße geteilt und dann entsprechend weiterverarbeitet. Hier muss ich ausbauen.