Galton-Watson-Prozess
Der Galton-Watson-Prozess, benannt nach dem britischen Naturforscher Francis Galton (1822–1911) und seinem Landsmann, dem Mathematiker Henry William Watson (1827–1903), ist ein spezieller stochastischer Prozess, der benutzt wird, um die zahlenmäßige Entwicklung einer eingeschlechtlichen Population von sich selbst replizierenden Individuen mathematisch zu modellieren. Er wird bisweilen auch als Bienaymé-Galton-Watson-Prozess bezeichnet, zu Ehren des Franzosen Irénée-Jules Bienaymé (1796–1878), der dasselbe Problem bereits längere Zeit vorher bearbeitet hatte.
Geschichte
[Bearbeiten | Quelltext bearbeiten]Im England des viktorianischen Zeitalters war die Aristokratie zunehmend besorgt über den Umstand, dass immer wieder Adelsgeschlechter aus Mangel an männlichen Nachkommen ausstarben und somit immer mehr traditionsreiche Namen aus der adligen Gesellschaft verschwanden. Galton, der selbst kein Mathematiker war, veröffentlichte 1873 in der Wissenschaftszeitschrift Educational Times die Frage nach der Wahrscheinlichkeit einer solchen Auslöschung und erhielt prompt Antwort von Watson. Im darauffolgenden Jahr erschien ihre Gemeinschaftsarbeit On the probability of extinction of families[1], in welcher sie ein stochastisches Konzept vorstellten, das heute als Galton-Watson-Prozess bekannt ist. Das Ergebnis, zu dem sie kamen, war, dass bei konstanter Bevölkerungszahl im Laufe der Zeit alle Namen bis auf einen aussterben würden. Offenbar entstand diese Arbeit im Unwissen über die Ergebnisse von Bienaymé.
Mathematische Modellierung
[Bearbeiten | Quelltext bearbeiten]Der Galton-Watson-Prozess zeichnet sich durch folgende Modellannahmen aus:
- Jedes Individuum lebt exakt einen Zeitschritt lang.
- Das -te Individuum im -ten Zeitschritt hinterlässt unabhängig von allen anderen Individuen eine gewisse Anzahl an Nachkommen gemäß einer Zufallsvariable .
- Alle sind unabhängig identisch verteilt mit Verteilung , die nur Werte in annimmt.
- Die Population startet mit einem Individuum.
Die letzte Annahme ist sinnvoll, da aufgrund der Unabhängigkeit der Fortpflanzung der Start mit Individuen äquivalent ist zu parallel voneinander laufenden Prozessen mit einem Individuum als Startpopulation.
Sei nun die Anzahl der lebenden Individuen zum Zeitpunkt (im ursprünglichen Modell die Anzahl der männlichen Stammhalter). Es gilt
und
Dann folgt aufgrund der unabhängigen Fortpflanzung
Gab es nun in der -ten Generation genau Individuen, so ist die Verteilung von eindeutig bestimmt durch
Hierbei ist die -fache Faltung der Verteilung . Dies folgt direkt aus der Aufsummierung der unabhängigen Zufallsvariablen.
Somit ist der Galton-Watson-Prozess eine zeitlich homogene Markow-Kette in diskreter Zeit und abzählbarem Zustandsraum. Die (abzählbar unendlich große) Übergangsmatrix ist durch
gegeben. Die Wahrscheinlichkeit, Individuen zu erhalten, wenn davor Individuen vorhanden waren, wird durch die Faltung der Verteilung gegeben.
Die Aussterbewahrscheinlichkeit
[Bearbeiten | Quelltext bearbeiten]Die Frage, an der Galton und Watson interessiert waren, war die nach der Wahrscheinlichkeit des Aussterbens einer Population. Die Wahrscheinlichkeit, dass in der -ten Generation kein Individuum mehr lebt, ist
Da aber die 0 ein absorbierender Zustand ist (es gilt ), also beim einmaligen Betreten nie wieder verlassen werden kann, gilt immer: Ist , so ist auch . Daraus folgt direkt, dass die Wahrscheinlichkeiten, sich in der 0 zu befinden, monoton wachsend sind: . Somit ist die Aussterbewahrscheinlichkeit
Die Berechnung der Aussterbewahrscheinlichkeit erfolgt mittels der wahrscheinlichkeitserzeugenden Funktion der . Es gilt und dann folgt induktiv unter Ausnutzung der Tatsache, dass Summen über eine zufällige Anzahl von Summanden als Verkettung von erzeugenden Funktionen dargestellt werden können:
wobei die -fache Komposition (Hintereinanderausführung) einer Funktion bezeichnet. Da gilt, ist . Daraus folgt, dass die Aussterbewahrscheinlichkeit der kleinste nichtnegative Fixpunkt der wahrscheinlichkeitserzeugenden Funktion von ist, also Lösung der Gleichung
- .
Es gilt dann:
- ist , so ist , die Population stirbt also fast sicher aus.
- ist , so liegt die Aussterbewahrscheinlichkeit echt zwischen 0 und 1.
Ausnahme dieser Betrachtungen ist der Fall, das jedes Individuum genau einen Nachkommen erzeugt: . Dies ist dann ein trivialer absorbierender Zustand.
Beispiel
[Bearbeiten | Quelltext bearbeiten]Angenommen, jedes Individuum hat unabhängig von allen anderen Individuen eine gewisse Anzahl Nachkommen, die geometrisch verteilt zum Parameter ist, also die Wahrscheinlichkeitsfunktion
für alle besitzt. Dann ist
Per Induktion lässt sich zeigen, dass
und demnach
gilt, die Population stirbt also fast sicher aus. Das hier verwendete Vorgehen ist die Ausnahme, meistens kann keine direkte Formel für die -fache Verkettung angegeben werden.
Das klassische Vorgehen wäre, den Erwartungswert von zu berechnen und dann gegebenenfalls den Fixpunkt zu bestimmen. Da hier aber schon der Erwartungswert 1 ist, kann auf die Berechnung des Fixpunktes verzichtet werden.
Anwendungen
[Bearbeiten | Quelltext bearbeiten]Zuerst blieb das Problem der aussterbenden Nachnamen das einzige, auf das das Galton-Watson-Konzept angewendet wurde. Doch schon bald begannen Biologen, damit die Ausbreitung von Lebewesen zu modellieren.
Das Galton-Watson-Modell findet ebenfalls Verwendung im Zusammenhang mit der Warteschlangentheorie bis hin zur Ausbreitung von ansteckenden Krankheiten und zur Verbreitung von Computerviren oder Kettenbriefen.
Multiplikative Prozesse (Neutronen)
[Bearbeiten | Quelltext bearbeiten]Der GW-Prozess wurde in den 1940er Jahren durch den Mathematiker Stan Ulam und David Hawkins für das Problem der Multiplikation von Neutronen-Kettenreaktionen „wiederentdeckt“ und für den Anwendungszweck weiterentwickelt (Los Alamos Report LA-171).[2] Weitere Beiträge lieferten auch Frederic de Hoffmann und Richard Feynman.
Modellierung von Epidemien
[Bearbeiten | Quelltext bearbeiten]Der Beginn einer Epidemie in einer großen Bevölkerung kann als Galton-Watson-Prozess aufgefasst werden. Die „Individuen“ sind dann infizierte Personen in der Zeitspanne, in der sie die Infektion auf andere Personen übertragen können. Die Aussterbewahrscheinlichkeit ist die Wahrscheinlichkeit, dass es zu keiner großen Epidemie kommt. Die Zahl E(p) ist die Basisreproduktionszahl der Infektion.[3]
Galton-Watson-Prozess mit mehreren Typen
[Bearbeiten | Quelltext bearbeiten]Die Reproduktion einer heterogenen Bevölkerung kann mit einem Galton-Watson-Prozess mit mehreren Typen (englisch multitype Galton-Watson-process) modelliert werden. Angenommen es gibt Typen von Individuen, die Individuen des gleichen oder eines anderen Typs erzeugen können. Sei die Wahrscheinlichkeit, dass ein Individuum des Typs genau Individuen des Typs erzeugt. Dann ist die Matrix der ersten Momente die Matrix mit den Elementen
- .
Wenn der größte Eigenwert dieser Matrix < 1 oder = 1 ist, dann ist die Aussterbewahrscheinlichkeit gleich 1.[4]
Galton-Watson-Prozesse mit mehreren Typen werden in der mathematischen Theorie der Epidemien angewendet, wenn die von der Epidemie betroffene Bevölkerung hinsichtlich von epidemiologisch relevanten Eigenschaften heterogen ist.[5] Im Fall von Geschlechtskrankheiten in der heterosexuellen Bevölkerung ist es naheliegend, zuerst einen Prozess mit zwei Typen, männlich und weiblich, zu betrachten. Um die Ausbreitung von HIV in einer Bevölkerung von monogamen heterosexuellen Paaren zu modellieren, kann man noch weiter gehen und einen Galton-Watson-Prozess mit mehreren Typen definieren, bei dem das Geschlecht und das Alter oder die Ordinalzahl der Partnerschaft, in der die Infektion stattgefunden hat bzw. stattfinden wird, den Typ bestimmen. Dieser Ansatz kann auch zur Berechnung der Basisreproduktionszahl verwendet werden.[6]
Bisexueller Galton-Watson Prozess
[Bearbeiten | Quelltext bearbeiten]Bei dieser Variante[7][8] eines Galton-Watson-Prozesses besteht die Grundpopulation aus männlichen und weiblichen Teilchen, die Paare bilden müssen, um sich fortzupflanzen. Nun spielt für die Frage der Aussterbewahrscheinlickeit auch die Paarungsfunktion (die bestimmt, wie Teilchen zu heterosexuellen Paaren zusammenfinden) und nicht nur ihre Fruchtbarkeit eine entscheidende Rolle.
Die Beschreibung der Entwicklung eines solchen Prozesses wird damit i. A. wesentlich komplizierter, jedoch spielt für seine Aussterbewahrscheinlichkeit die sogenannte mittlere asymptotische Reproduktionsrate von Paaren eine ähnlich wichtige Rolle wie für den (asexuellen) Galton-Watson-Prozess.
Literatur
[Bearbeiten | Quelltext bearbeiten]- Theodore Edward Harris: The theory of branching processes (= Grundlehren der mathematischen Wissenschaften. Band 119). Springer-Verlag, Berlin 1963, ISBN 978-3-642-51868-3 (englisch, rand.org [PDF]). Harris greift den Original-Prozess in diesem Buch auf. Da er Mitarbeiter bei der RAND Corporation war, wurde das Buch dort als Bericht publiziert.
- Krishna B. Athreya, Peter E. Ney: Branching Processes (= Grundlehren der mathematischen Wissenschaften. Band 196). Springer Berlin Heidelberg, Berlin, Heidelberg 1972, ISBN 978-3-642-65373-5, doi:10.1007/978-3-642-65371-1. Folgebuch zu Harris.
- Søren Asmussen, Heinrich Hering: Branching Processes. Birkhäuser Boston, Boston, MA 1983, ISBN 978-0-8176-3122-2, doi:10.1007/978-1-4615-8155-0 (englisch).
- Ulrich Krengel: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 8. Auflage. Vieweg, 2005, ISBN 978-3-8348-0063-3.
- Achim Klenke: Wahrscheinlichkeitstheorie. 2. Auflage. Springer-Verlag, Berlin/Heidelberg 2008, ISBN 978-3-540-76317-8.
- Hans-Otto Georgii: Stochastik: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. de Gruyter, 2009, ISBN 978-3-11-021526-7.
Einzelnachweise
[Bearbeiten | Quelltext bearbeiten]- ↑ H. W. Watson, Francis Galton: On the Probability of the Extinction of Families. In: The Journal of the Anthropological Institute of Great Britain and Ireland. Band 4, 1875, S. 138, doi:10.2307/2841222, JSTOR:2841222 (englisch).
- ↑ S. M. Ulam: Analogies Between Analogies: The Mathematical Reports of S. M. Ulam and his Los Alamos Collaborators. University of California Press, 1990, ISBN 978-0-520-32292-9, doi:10.1525/9780520322929 (degruyter.com [abgerufen am 4. November 2024]).
- ↑ Niels Becker: Estimation for Discrete Time Branching Processes with Application to Epidemics. In: Biometrics. Band 33, Nr. 3, 1977, ISSN 0006-341X, S. 515–522, doi:10.2307/2529366, JSTOR:2529366 (englisch).
- ↑ K. B. Athreya, P. E. Ney: Branching Processes. Springer-Verlag 1972, S. 186.
- ↑ Niels Becker: The effect of heterogeneity on the spread of disease. In: J. P. Gabriel, C. Lefèvre, P. Picard (Eds.): Stochastic Processes in Epidemic Theory. Lecture Notes in Biomathematics, Vol. 86. Springer-Verlag 1990, S. 90–103.
- ↑ H. Knolle: A discrete branching process model for the spread of HIV via steady sexual partnerships. Journal of Mathematical Biology 48, S. 423–443 (2004) doi:10.1007/s00285-003-0241-7.
- ↑ Shi-xia Ma: Bisexual Galton-Watson Branching Processes in Random Environments. In: Acta Mathematicae Applicatae Sinica, English Series. Band 22, Nr. 3, Juli 2006, ISSN 0168-9673, S. 419–428, doi:10.1007/s10255-006-0317-4 (englisch, springer.com [abgerufen am 4. November 2024] Siehe die Referenzen darin.).
- ↑ F. Thomas Bruss: A note on extinction criteria for bisexual Galton-Watson processes. In: Journal of Applied Probability. Band 21, Nr. 4, Dezember 1984, ISSN 0021-9002, S. 915–919, doi:10.2307/3213707 (englisch, cambridge.org [abgerufen am 4. November 2024] Siehe die Referenzen darin.).