Benutzer:Maximus666/Spielwiese
In der Wahrscheinlichkeitstheorie und in der Statistik ist eine Exponentialfamilie eine Klasse von Wahrscheinlichkeitsverteilungen einer ganz bestimmten Form. Man wählt diese spezielle Form, um bestimmte Rechenvorteile auszunutzen oder aus Gründen der Verallgemeinerung. Exponentialfamilien sind in gewissem Sinne sehr natürliche Verteilungen. Das Konzept der Exponentialfamilien geht zurück auf [1] E. J. G. Pitman,[2] G. Darmois,[3] und B. O. Koopman[4] (1935–6).
Definition
[Bearbeiten | Quelltext bearbeiten]Es folgt eine Reihe immer allgemeinerer Definitionen einer Exponentialfamilie. Der gewöhnliche Leser möchte sich vielleicht auf die erste und einfachste Definition konzentrieren. Diese bezieht sich auf eine ein-parametrischen Familie diskreter oder stetiger Wahrscheinlichkeitsverteilungen.
Skalarer Parameter
[Bearbeiten | Quelltext bearbeiten]Eine einparametrische Exponentialfamilie ist eine Menge von Wahrscheinlichkeitsverteilungen, deren Dichtefunktion (oder im diskreten Fall: Wahrscheinlichkeitsfunktion) sich in der folgenden Form darstellen lässt:
wobei , , , und bekannte Funktionen sind.
Der Wert ist der Parameter der Familie.
Beachte, dass x oft ein Vektor von Realisationen einer Zufallsgröße ist. In diesem Fall gilt: ( bezeichnet den Raum der möglichen Ausprägungen von x).
Die Exponentialfamilie ist in kanonischer Form, falls . Indem man einen transformierten Parameter definiert, ist es immer möglich eine Exponentialfamilie in kanonische Form zu bringen. Die kanonische Form ist nicht eindeutig (man kann mit einer beliebigen Konstanten ungleich Null multiplizieren und gleichzeitig T(x) durch die Konstante teilen).
Weiter unten ist ein Beispiel einer Normalverteilung mit unbekannten Erwartungswert bei bekannter Varianz.
Vektorieller Parameter
[Bearbeiten | Quelltext bearbeiten]Die einparametrische Definition kann erweitert werden auf eine Definition mit einem vektoriellem Parameter . Eine Familie von Verteilungen gehört zu einer vektoriellen Exponentialfamilie wenn die Dichtefunktion (oder Wahrscheinlichkeitsfunktion der diskreten Verteilung) in folgender Form geschrieben werden kann:
Wie im Fall mit skalarem Parameter, wird von einer Exponentialfamilie in kanonischer Form gesprochen, wenn math>\eta_i({\boldsymbol \theta}) = \theta_i</math>, for all gilt.
Weiter unten findet sich eine Beispiel einer Normalverteilung mit unbekanntem Erwartungswert und unbekannter Varianz.
Maßtheoretische Formulierung
[Bearbeiten | Quelltext bearbeiten]Wir benutzen Verteilunsfunktionen, um sowohl den diskreten, als auch den stetigen Fall gleichzeitig abzuhandeln.
Sei H eine nicht-fallende Funktion einer reellen Variable und H(x) strebt gegen 0 wenn x gegen geht. Dann sind Lebesgue-Stieltjes-Integrale bezüglich dH(x) Integrale bezüglich des "Referenz Maßes" der Exponentialfamilie, die von H erzeugt wird.
Alle Mitglieder dieser Exponentialfamilie haben die (kumulative) Verteilungsfunktion
Falls F eine stetige Verteilung mit einer Dichte ist, kann man schreiben dF(x) = f(x) dx.
H(x) ist ein Lebesgue-Stieltjes Integrator für das Referenz Maß. Ist das Referenz Maß endlich, kann es normalisiert werden und H ist dann die (kumulative) Verteilunsfunktion einer Wahrscheinlichkeitsverteilung. Falls F stetig ist mit einer Dichtefunktion, dann gilt das auch für H, was folgendermaßen aufgeschrieben werden kann dH(x) = h(x) dx. Falls F diskret ist, dann ist H eine Treppenfunktion (mit Sprüngen auf dem Träger von F).
Interpretation
[Bearbeiten | Quelltext bearbeiten]Die Funktionen und in den Definitionen oben sind willkürlich gewählt. Sie spielen allerdings in der resultierenden Wahrscheinlichkeitsverteilung eine wichtige Rolle.
- ist eine suffiziente Statistik der Verteilung. Somit existiert für Exponentialfamilien eine suffiziente Statistik, deren Dimension äquivalent der Anzahl zu schätzender Parameter ist. Diese wichtige Eigenschaft wird weiter unten näher betrachtet.
- wird als natürlicher Parameter bezeichnet. Die Menge der Werte von für die die Funktion endlich ist, wird natürlicher Parameterraum genannt. Es kann gezeigt werden, dass der natürliche Parameterraum immer konvex ist.
- ist ein Normalisierungsfaktor ohne den keine Wahrscheinlichkeitsverteilung wäre. Die Funktion A ist selbst wichtig, weil in Fällen in denen das Referenzmaß ein Wahrscheinlichkeitsmaß ist (alternativ: falls eine Wahrscheinlichkeitsdichte ist), ist A die Kumulantenerzeugende Funktion der Wahrscheinlichkeitsverteilung der suffizienten Statistik wenn die Verteilung von ist.
Beispiele
[Bearbeiten | Quelltext bearbeiten]Die Normal-, Exponential-, Gamma-, Chi-Quadrat-, Beta-, Dirichlet-, Bernoulli-, Binomial-, Multinomial-, Poisson-, Negative Binomial-, geometrische und Weibullverteilung sind alle Exponentialfamilien. Die Cauchy-, Laplace- und Gleichverteilung sind keine Exponentialfamilien.
Im Folgenden betrachten wir einige Verteilungen und wie sie in der Repräsentation der Exponentialfamilien geschrieben werden können.
Normalverteilung: Unbekannter Erwartungswert, bekannte Varianz
[Bearbeiten | Quelltext bearbeiten]Im ersten Beispiel nehmen wir an, dass normalverteilt ist, mit unbekanntem Erwartungswert und Varianz 1. Die Dichte ist dann
Man sieht, dass es sich dabei um eine einparametrische Exponentialfamilie in kanonischer Form handelt, wenn man wie folgt definiert:
Normalverteilung: Unbekannter Erwartungswert, unbekannte Varianz
[Bearbeiten | Quelltext bearbeiten]Als nächstes betrachten wir eine Normalverteilung mit unbekanntem Erwartungswert und unbekannter Varianz. Die Dichte ist dann
Dies ist eine Exponentialfamilie, was man sieht, wenn man wie folgt definiert:
Binomialverteilung
[Bearbeiten | Quelltext bearbeiten]Als Beispiel einer diskreten Exponentialfamilie betrachten wir die Binomialverteilung. Die Wahrscheinlichkeitsfunktion dieser Verteilung ist
Dies kann auch geschrieben werden als
was zeigt, dass es sich bei der Binomialverteilung auch um eine Exponentialverteilung handelt. Der natürliche Parameter ist
Rolle in der Statistik
[Bearbeiten | Quelltext bearbeiten]Klassisches Schätzen: Suffizienz
[Bearbeiten | Quelltext bearbeiten]Nach dem Pitman-Koopman-Darmois Theorem gibt es unter Wahrscheinlichkeitsfamilien, deren Träger nicht von den Parametern abhängt nur bei den Exponentialfamilien suffiziente Statistiken, deren Dimension bei wachsender Stichprobengröße beschränkt bleibt. Etwas ausführlicher: Seien Xn, n = 1, 2, 3, ... unabhängig und identisch verteilte Zufallszahlen, deren Wahrscheinlichkeitsverteilungsfamilie bekannt ist. Nur wenn diese Familie eine Exponentialfamilie ist, gibt es eine (möglicherweise vektorielle) suffiziente Statistik T(X1, ..., Xn) deren Anzahl skalarer Komponenten nicht ansteigt, sollte der Stichprobenumfang n erhöht werden.
Bayesianisches Schätzen: konjugierte Verteilungen
[Bearbeiten | Quelltext bearbeiten]Exponential families are also important in Bayesian statistics. In Bayesian statistics a prior distribution is multiplied by a likelihood function and then normalised to produce a posterior distribution. In the case of a likelihood which belongs to the exponential family there exists a conjugate prior, which is often also in the exponential family. A conjugate prior π for the parameter η of an exponential family is given by
where and are hyperparameters (parameters controlling parameters).
A conjugate prior is one which, when combined with the likelihood and normalised, produces a posterior distribution which is of the same type as the prior. For example, if one is estimating the success probability of a binomial distribution, then if one chooses to use a beta distribution as one's prior, the posterior is another beta distribution. This makes the computation of the posterior particularly simple. Similarly, if one is estimating the parameter of a Poisson distribution the use of a gamma prior will lead to another gamma posterior. Conjugate priors are often very flexible and can be very convenient. However, if one's belief about the likely value of the theta parameter of a binomial is represented by (say) a bimodal (two-humped) prior distribution, then this cannot be represented by a beta distribution.
An arbitrary likelihood will not belong to the exponential family, and thus in general no conjugate prior exists. The posterior will then have to be computed by numerical methods.
Hypothesen Tests: gleichmäßig bester Test
[Bearbeiten | Quelltext bearbeiten]Uniformly most powerful test}} The one-parameter exponential family has a monotone non-decreasing likelihood ratio in the sufficient statistic T(x), provided that η(θ) is non-decreasing. As a consequence, there exists a uniformly most powerful test for testing the hypothesis H0: θ ≥ θ0 vs. H1: θ < θ0.
Referenzen
[Bearbeiten | Quelltext bearbeiten]- ↑ Erling Andersen: Sufficiency and Exponential Families for Discrete Sample Spaces. In: Journal of the American Statistical Association. 65. Jahrgang, Nr. 331, September 1970, S. 1248–1255, doi:10.2307/2284291.
- ↑ E. Pitman: Sufficient statistics and intrinsic accuracy. In: Proc. Camb. phil. Soc. 32. Jahrgang, 1936, S. 567–579.
- ↑ G. Darmois: Sur les lois de probabilites a estimation exhaustive. In: C.R. Acad. sci. Paris. 200. Jahrgang, 1935, S. 1265–1266 (französisch).
- ↑ B Koopman: On distribution admitting a sufficient statistic. In: Trans. Amer. math. Soc. 39. Jahrgang, 1936, S. 399–409, doi:10.2307/1989758.
Weiterführende Literatur
[Bearbeiten | Quelltext bearbeiten]- E. L. Lehmann, Casella, G.: Theory of Point Estimation. 1998, S. 2nd ed., sec. 1.5.
- Robert W. Keener: Statistical Theory: Notes for a Course in Theoretical Statistics. Springer, 2006, S. 27–28, 32–33.
Kategorie:Stochastik Kategorie:Statistik Kategorie:Wahrscheinlichkeitsverteilung