Gleichmäßig bester Test

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Ein gleichmäßig bester Test (GB-Test), gleichmäßig trennschärfster Test, gleichmäßig schärfster Test, gleichmäßig mächtigster Test, oder kurz bester Test ist ein spezieller statistischer Test in der Testtheorie, einem Teilgebiet der mathematischen Statistik. Gleichmäßig beste Tests zeichnen sich dadurch aus, dass die Wahrscheinlichkeit für einen Fehler 1. Art immer unter einer vorgegebenen Grenze liegt, gleichzeitig aber die Wahrscheinlichkeit für ein Fehler 2. Art kleiner ist als die jedes weiteren Tests, der ebenfalls die vorgegebene Grenze für den Fehler 1. Art einhält. Nachteil an gleichmäßig besten Tests ist, dass sie im Gegensatz zu anderen Klassen von optimalen Schätzern wie strengen Tests und Maximin-Tests nur unter sehr eingeschränkten Rahmenbedingungen existieren.

Teils findet sich auch die Bezeichnung als UMP-Test, die aus dem Englischen von Uniform Most Powerful (gleichmäßig trennschärfster bzw. gleichmäßig mächtigster) abgeleitet ist.

Gegeben sei ein Statistisches Modell sowie eine disjunkte Zerlegung von in Nullhypothese und Alternative . Sei die Menge aller statistischen Tests zum Niveau , das heißt alle Statistiken

,

für die

gilt. Sei

die Gütefunktion des Tests . Der Test heißt dann ein gleichmäßig bester Test (oder gleichmäßig trennschärfster Test) zum Niveau , wenn für alle weiteren die Trennschärfe von größer ist als die Trennschärfe von . Es gilt also

.

Alternativ kann ein gleichmäßig bester Test auch definiert werden als derjenige Test, dessen Gütefunktion auf der Alternative mit der einhüllenden Gütefunktion (englisch envelope power function) von übereinstimmt.

Gleichmäßig beste Tests müssen im Allgemeinen nicht existieren. Wichtigstes Hilfsmittel zur Herleitung von Existenzaussagen und zur Konstruktion von gleichmäßig besten Tests ist das Neyman-Pearson-Lemma, das teils auch das Fundamentallemma der mathematischen Statistik genannt wird.

Einfache Hypothesen

[Bearbeiten | Quelltext bearbeiten]

Für Tests mit einfachen Hypothesen, also einer einelementigen Nullhypothese und einer einelementigen Alternative liefert das Neyman-Pearson-Lemma die Existenz eines gleichmäßig besten Tests zu einem vorgegebenen Niveau . Dieser Test ist der Neyman-Pearson-Test, ein Likelihood-Quotienten-Test. Einzige zusätzliche Voraussetzung ist die Existenz der Wahrscheinlichkeitsdichtefunktionen von Nullhypothese und Alternative.

Nach dem Lemma von Stein konvergiert die Trennschärfe des Neyman-Pearson-Tests mit exponentieller Geschwindigkeit bei wachsender Stichprobengröße gegen .

Einseitige Tests

[Bearbeiten | Quelltext bearbeiten]

In einparametrigen Modellen mit monotonem Dichtequotient in existiert ein gleichmäßig bester einseitiger Test zu einem vorgegebenen Niveau , also ein Test bei dem Nullhypothese und Alternative von der Form

sind. Dabei ist und eine vorgegebene Zahl aus . Der Test ist dann gegeben durch

.

Dabei sind so zu wählen, dass die Bedingung erfüllt ist. Des Weiteren ist die Gütefunktion monoton. Bei einem Vertauschen von Nullhypothese und Alternative kehren sich die kleinergleich/größergleich-Zeichen um.

Eine große Verteilungsklasse mit monotonem Dichtequotient ist die einparametrische Exponentialfamilie (wenn die Parameterfunktion monoton ist oder die Familie in natürlicher Parametrisierung vorliegt).

Das Ergebnis über beste einseitige Tests leitet sich direkt aus dem Neyman-Pearson-Lemma ab: Aufgrund der Monotonie des Dichtequotienten ist der Test von gegen für alle ein gleichmäßig bester Test, somit ist ein gleichmäßig bester Test von gegen . Da man zeigen kann, dass die Gütefunktion monoton ist, hält der Test für alle das Niveau ein und ist somit ein gleichmäßig bester Test zum Niveau von gegen .

Weitere Aussagen

[Bearbeiten | Quelltext bearbeiten]

Weitere Existenzaussagen erhält man beispielsweise durch die Einschränkung auf kleinere Klassen von Tests wie unverfälschte Tests, für diese lassen sich Aussagen beispielsweise mithilfe von ähnlichen Tests herleiten.

Verwandte Begriffe

[Bearbeiten | Quelltext bearbeiten]

Der zum gleichmäßig besten Test duale Begriff für Konfidenzbereiche (im Sinne der Dualität von Tests und Konfidenzbereichen) ist der gleichmäßig bester Konfidenzbereich.