Diskussion:Konfidenzintervall/Archiv/1
Wahrer Parameter und Grundgesamtheit
Hallo, da der wahre Parameter fest ist, die Grenzen des Konfidenzintervalls aber abhängig von der Realisation der Stichprobe sind, ist es sinnvoller davon zu sprechen, dass das Konfidenzintervall den wahren Parameter (mit einer vorgegebenen Wahrscheinlichkeit) überdeckt, statt davon, dass der wahre Parameter im Konfidenzintervall liegt.
--Moritz 12:44, 12. Sep 2005 (CEST)
Praktikeranfrage
habe die Seite mit Interesse gelesen, dabei ist mir aber eines nicht klar. Das errechnete Konfidenzintervall sollte die Stichprobe mit einer Wahrscheinlichkeit von 95 % wiederspiegeln, oder anders ausgedrückt, nur 5 % der Meßwerte werden außerhalb des Konfidenzintervalls erwartet. Nun sind aber im vorliegenden Beispiel nur 6 von 16 Meßwerten (37,5 %) überhaupt innerhalb des Konfidenzintervalls, was viel zu wenig ist. Außerdem sollten 68,3 % der Meßwerte in einem Intervall Mittelwert +-Standardabweichung liegen (das stimmt mit 56,25 % größenordnungsmäßig) und 95 % in einem Intervall von Mittelwert +- 2s (das stimmt mit 100 % auch etwa). Das Konfidenzintervall sollte also nach meinem Dafürhalten in etwa Mittelwert +- 2s groß sein. Excel liefert das gleiche Ergebnis, da bin ich auch schon drüber gestolpert. Da ich kein ausgewiesener Statistiker bin, kann es sein, daß ich einen Denkfehler mache. Kannst Du mir sagen, wo der liegt? Martin
- Es liegen nicht 95% der einzelnen Realisationen des Merkmals in diesem Intervall, sondern 95% aller Mittelwerte, wenn man sehr oft eine Stichprobe mit 16 Elementen nimmt. Das Intervall von Mittelwerten ist immer schmäler, weil ja der Mittelwert ein viel kleinere Varianz hat als der Merkmalswert selber. --Philipendula 17:09, 4. Mai 2006 (CEST)
Ausgewählte Konfidenzintervalle
Die Formeln, die dort angegeben sind, sind Formeln für die Schätzintervalle, die Realisation eines Konfidenzintervalles. Wären es die Konfidenzintervalle, dann müssten die Formeln Zufallsvariablen enthalten. -- Sigbert 19:45, 10. Dez. 2009 (CET)
für Laien unverständlich
Ich bin durchaus kein Laie, aber die Erklärung enthält zu viel Fachchinesisch. Außerdem sollten Beispiele eingefügt werden.
- Ja, so richtig gefällt mir der Artikel selber nicht. Es ist auch etwas schwierig, das Ganze in der gebotenen enzyklopädischen Kürze verständlich darzustellen, denn man muss dann in diesem Zusammenhang auch was von der Verteilung von Stichproben wissen etc. Ein Beispiel wäre auf jeden Fall erhellend. Falls du weitergehende Infos suchst: Im Laufe des Semesters werde ich voraussichtlich in meinem Wikibook Statistik was dazu schreiben. Gruß --Philipendula 12:48, 7. Apr 2005 (CEST)
- Ein Beispiel ist jetzt drin. Vielleicht könnts mal jemand querlesen und -rechnen, weil ich von dem Gezerre mit Tex immer ganz krank werde. --Philipendula 00:54, 8. Apr 2005 (CEST)
Der Text ist doch eigentlich recht verständlich. Allerdings muß man klar zwischen "Konfidenzintervallschätzer" und der "numerischen Ausprägung" von diesem unterscheiden.
Eine Interpretation des numerischen Intervalls [96.08 ; 107.92] mit einer Wahrscheinlichkeitsaussage zu belegen, ist unzulässig, da es sich im weiteren Sinne um eine Realisation einer ZV handelt. Es sind nur rein dichotome Aussagen möglich, will sagen, entweder ist der wahre Parameter der Grundgesamtheit Element des numerischen Intervalls oder nicht. Gruß ION
Diese vorhergehende Aussage ist m. E. nicht richtig. Ob der wahre Parameter durch das Konfidenzintervall überdeckt wird, ist nicht bekannt. Man hat also nicht a posteriori, hier also nach Realisation der Stichprobe, die Möglichkeit, festzustellen, ob dies der Fall ist. Dagegen hat man a priori die Wahrscheinlichkeitsaussage darüber: Man weiß z. B. dass in 95 von 100 Fällen der wahre Parameter durch das Konfidenzintervall überdeckt wird. Nun geht mit der Realisierung der Stichprobe kein Erkenntnisgewinn über den wahren Parameter einher. Das Wissen über den wahren Parameter und das Konfidenzintervall wird daher nicht erweitert, es bleibt beim bereits a priori verfügbaren Wissen über die Wahrscheinlichkeit. Die Wahrscheinlichkeitsaussage ist daher (im Sinne der klassischen Theorie) möglich und sinnvoll. Die Wahrheit der dichotomen Aussage entzieht sich bei unbekanntem Parameter der Erkenntnis.
--Moritz 13:02, 12. Sep 2005 (CEST)
Unpräzise und fehlerhaft formuliert. Überarbeitung dringend nötig!
Nach meiner Ansicht braucht das Lemma (wie auch die meisten anderen Lemmata aus dem Bereich der Mathematischen Statistik in wikipedia.de) dringend eine Generalüberholung; es ist fehlerhaft und auf viel zu niedrigem Niveau geschrieben. Insbesondere die fehlende Darstellung der Parameterabhängigkeit in den Wahrscheinlichkeitsmaßen P macht die Darstellung falsch (oder wenigstens, euphemistisch gesagt, verwirrend). All-Quantifizierungen über die Klasse von Wahrscheinlichkeitsmaßen P (oder den Parameter) fehlen leider völlig. Auch fehlt eine korrekte allgemeine Definition von Konfidenzintervallen. Leider sind selbst in vielen Lehrbüchern der Statistik niedrigen Niveaus ähnlich grobe Fehler zu finden, was zur Verwirrung zahlreicher Anwender der Mathematischen Statistik beiträgt. Die obige Diskussion zur Interpretation dokumentiert dies. Es sollte klarer herausgearbeitet werden, dass nicht nur ein Wahrscheinlichkeitsmaß P betrachtet wird, sondern eine Familie von Wahrscheinlichkeitsmaßen, im parametrischen Fall indiziert mit einem vektorwertigem Parameter. Sprechweisen wie "... mit einer bestimmten Wahrscheinlichkeit..." suggerieren den falschen Eindruck, es gäbe nur ein einziges Wahrscheinlichkeitsmaß im statistischen Modell. Wünschenswert wäre auch eine Darstellung der Dualität zwischen Konfidenzbereichen und statistischen Tests sowie zum Unterschied zwischen frequentistischer und Bayesscher Sichtweise. Daher meine Bitte an alle Mathematischen Statistiker, an einer Verbesserung mitzuarbeiten!
- Na, dann lass dich mal nicht aufhalten. --Philipendula 23:30, 21. Jan 2006 (CET)
F.M. Jan 21 18:11 CET 2006
- Man kann sich da wohl beliebig austoben, ich fürchte aber, dass der Artikel dann für ca. 99% aller Leser unbrauchbar wird. Spezialisten haben ohnehin ihre Handbücher. Adressaten sind IMHO hier die Omas. --Philipendula 15:05, 11. Feb 2006 (CET)
- Der Überarbeitenhinweis stand jetzt seit Januar drin. Es scheint aber niemand das Bedürfnis zu haben, was zu machen. Deshalb habe ich ihn wieder entfernt. --Philipendula 11:23, 6. Apr 2006 (CEST)
Griechische Buchstaben
- ich wollte nur noch anmerken dass an manchen Stellen (z.B. Zweile 2) die griechischen Buchstaben nicht lesbar sind. Es steht zwar dahinter, was die schönen Zeichen bedeuten sollen, aber der Buchstabe ist nicht lesbar. Ich würde dies gerne verändern, aber ich war auch nicht in der Lage! :-) --- Michael
- Das müsste dann an deinem Browser liegen. Ich kann sie lesen. --Philipendula 13:42, 8. Mär 2006 (CET)
- Warum nicht benutzen ? Sieht zwar nicht so schön aus, aber ist gut lesbar -- sigbert 16:10, 22. Mär 2006
- Kann es sein, dass das Beispiel-Konfidenzintervall falsch ist? Anstelle von 5.9... geben mir Excel und oocalc 5.45 aus. --michael.jaeger 13:19, 11. Mär 2006 (CET)
- Falls du 5,92 meinst: Also mein Excel gibt mir 5,92 aus. --Philipendula 13:52, 11. Mär 2006 (CET)
- Okay, jetzt habe ich den Fehler gefunden. Ich habe die Funktionion KONFIDENZ in Excel benutzt. Diese verwendet anscheinend nur eine Naeherungsloesung mit t(0.95,n)=1.96, die aber nur fuer eine grosse Anzahl an Messwerten gut ist. --michael.jaeger Tue Mar 14 16:21:54 CET 2006
Fehlerintervall
Was ist eigentlich ein Fehlerintervall? Ist das ein Synonym für Konfidenzintervall? Stern 14:34, 24. Apr 2006 (CEST)
- Ich weiß nicht, ob es den Ausdruck Fehlerintervall überhaupt gibt. Wenn ja, ist es wohl am ehesten ein Konfidenzintervall. Die Ingenieure verwenden gern solche Ausdrücke. --Philipendula 20:39, 24. Apr 2006 (CEST)
verbesserung
Ich bitte um Verstaendnis fuer mein deutsch. Ich habe versucht eine korrekte und fuer Laien besser liesbare Text zu schreiben. Leider hat eine der ursprunglichen Autoren es wieder rueckgaengig gemacht. In der hiessigen Text sind noch Fehlhafte Auffassungen und Fehlandeutungen anwesend. Daneben ist die benutzte Notation unnoetig kompliziert.Nijdam 11:14, 19. Jun 2006 (CEST)
Nijdam 11:14, 19. Jun 2006 (CEST)
- Ich schau die Änderungen noch mal durch. Ok? Ich weiß allerdings nicht, ob ich es heute schaffe. Vielleicht sollte man doch erst auf der Diskussionsseite drüber diskutieren, bevor man so viele Änderungen durchführt. Gruß --Philipendula 11:41, 19. Jun 2006 (CEST)
- Ich hebe eine ausfuehrliche beispiel hinzugefuegt. Leider wieder in "Rudy"-deutsch. Hoffentlich hilft es doch zum Begreifen was ein Konfidenzintervall ist.Nijdam 13:04, 19. Jun 2006 (CEST)
- Ausgangspunkt soll sein: wie erklaert man fuer einen interessierten Laien den Begriff. Und nicht: wie mathematisch preziese kann man alles notieren. Darum soll man auch versuchen die benutzte Notation leicht zu halten. Was dem Begriff betrifft: es gibt einen grossen unterschied zwischen ein Schaetzfunktion und seine Realisation, der Schaetzung. Es ist immer ein grosses Problem die beiden zu untercheiden. Im Praxis und fuer den Laie ist ein Konfidenzintervall die berechnete wert der Schaetzfunktionen die seinen Grenzen bilden, fuer den Theoretiker sind nur die stochastische Grenzen von Bedeutung. Der Theoretiker kann darum sagen: mit Wahrscheinlichkeit 1-α enthaelt das Intervall den Parameter. Aber auch er kann (und macht es auch nicht) vom Realisation des Intervalls nicht mehr von der Wahrscheinlichkeit sprechen dass den Parameter im Intervall liegt. Darum ist der gegebene Definition Fehlhaft. Im einleitenden Beispiel wird zwar das richtige Intervall berechnet, aber der Systematik der zum Intervall fuehrt ist mangelhaft und darueber unnoetig komplziert notiert. Es handelt sich darum dass man einen Zufallsvariable konstruiert, dessen Verteilung unabhaengig des Parameters ist, aber dann natuerlich selber (und das muss auch sein) davon abhaengt. Schau mein Beispiel mal gut an. Nijdam 12:00, 21. Jun 2006 (CEST)
Fehler in der Formel fürs Konfidenzintervall
Hi,
Laut Artikel lautet die Formel für das Konfidenzintervall:
Laut meinem Mathebuch (LS Stochastik NRW, 1. Auflage, Klett Verlag 2005) jedoch lautet sie:
, wobei h die gemessene Häufigkeit des Ereignisses ist. Dies ergäbe umgeformt (wenn man einsetzt):
Ich glaube, das Mathebuch liegt richtig.
Viele Grüße
--MrMage 18:12, 5. Dez. 2006 (CET)
- Wenn man das KI für den Mittelwert bei einer Normalverteilung berechnet, ist doch die erstere Formel völlig korrekt... Wie kommst du denn drauf?? Mfg --Geisterbanker 18:44, 5. Dez. 2006 (CET)
- Es ergeben sich halt verschiedene Formeln. Wie ich eingesetzt hab ist ja oben beschrieben. Und diese Formel wird in meinem Mathebuch auch immer angewandt... --MrMage 16:56, 6. Dez. 2006 (CET)
- Die Umformung war an sich wohl korrekt, der Fehler dürfte vielmehr in der von dir genannten Formel liegen. Wo hast du die denn her? Insbesondere, wie kann denn das Sigma, also die von vornherein gegebene Standardabweichung der Grundgesamtheit, von der gemessenen (also i.A. stichprobenweisen) Häufigkeit des Ereignisses abhängen? Da muss wohl wirklich ein Missverständnis liegen, sorry. Mfg --Geisterbanker 17:17, 6. Dez. 2006 (CET)
- Hallo Geisterbanker, die Formel ist aus meinem Mathebuch für Laplace-Verteilungen. Ich habe jetzt nochmal nachgeguckt und herausgefunden, dass man die nicht für Normalverteilungen anwenden darf. Viele Grüße--MrMage 17:20, 6. Dez. 2006 (CET)
Beispielrechnung
Ich moechte nur daraufhinweisen, dass bei der Beispielrechnung fuer das Konfidenzintervall mit dem Quantil fuer 0,975 gerrechnet wurde, im Text aber angeben wird das die Werte nun mit 95%iger Wahrscheinlichkeit in diesem intervall liegen. Die definition dieses Satzes ist wie zuvor schon erwaehnt grenzwertig und sollte ueberarbeitet werden. mfg anonym
- Zweiseitig? --Scherben 21:10, 5. Feb. 2009 (CET)
- Mir ist das auch aufgefallen mit den unterschiedlichen Werten für das Quantil. Im Text steht:
- Es ist das (1-α/2)-Quantil...
- IMHO bedeutet 1-α/2, dass es sich, um ein einseitiges Vertrauensniveau handelt. Dann müsste t aber 1,753 ergeben. Was ist jetzt korrekt?
- --94.218.13.41 20:31, 2. Nov. 2009 (CET)
- Wie gesagt: Es ist ein zweiseitiges Intervall, an beiden Seiten werden diejenigen Werte weggenommen, die mit jeweils weniger als 2,5% Wahrscheinlichkeit eintreten. --Scherben 22:22, 2. Nov. 2009 (CET)
- Mir ist das auch aufgefallen mit den unterschiedlichen Werten für das Quantil. Im Text steht:
Konfidenzintervall vs Vertrauensintervall
Für mich als Laien geht leider nicht deutlich hervor was der Unterschied zwischen Vertrauens- und Konfidenzintervall ist. Laut Text
"Ein für ein vorgegebenes Konfidenzniveau zu breites Vertrauensintervall weist auf einen zu geringen Stichprobenumfang hin."
scheint es da aber einen zu geben...könnte den vllt jemand etwas genauer erklären?! Bzw klarstellen was das Vertrauensintervall ist. Danköö-- Rockwurm 20:30, 2. Feb. 2010 (CET)
- Keinen: Vertrauensintervall=Konfidenzintervall, ich ergänze es mal in der ersten Zeile, danke -- Sigbert 20:51, 3. Feb. 2010 (CET)
Falsches n in der Studentschen t-Verteilung?
Im Artikel steht
Da n = 16 ist, müsste hier also n-1 = 15 verwendet werden - laut Studentsche t-Verteilung ist 2,13 aber gerade der Wert für n = 16. Oder hab' ich hier was falsch verstanden? --Hoerni 11:30, 3. Mai 2010 (CEST)
- Ja. 2,13 ist der richtige Wert. Siehe Tabelle. -- Philipendula 12:37, 3. Mai 2010 (CEST)
- Ok, ich hab' die Tabelle in Studentsche t-Verteilung falsch gelesen (Spalte N = #Beobachtungen <> Spalte n = #Freiheitsgrade) - 2,13 ist korrekt. Danke für die prompte Antwort. --Hoerni 09:58, 4. Mai 2010 (CEST)
falsche verteilung
in "beschreibung des verfahrens" wird behauptet dass er erwartungswert einer normalverteilten stichprobe normalverteilt ist, er ist jedoch studtent verteilt. (nicht signierter Beitrag von 80.108.32.133 (Diskussion | Beiträge) 22:11, 10. Mai 2010 (CEST))
- Späte Antwort: Ein Erwartungswert kann überhaupt nicht verteilt sein, denn er ist eine Konstante. Der Schätzer für den Erwartungswert, , ist normalverteilt, wenn die Varianz bekannt ist, und t-verteilt, wenn sie mit s**2 geschätzt werden muss. -- Philipendula 15:44, 19. Mai 2010 (CEST)
Weiterleitung von Konfidenzniveau
Wäre nicht eine Weiterleitung von "Konfidenzniveau" zu "Konfidenzintervall" sinnvoll? In vielen Texten und auch hier in der Einleitung wird es so genannt, bei einer Suche findet man Konfidenzniveau aber nicht bei Wikipedia. --Lizzard 10:44, 22. Aug. 2010 (CEST)
- Gibt es doch schon.Nijdam 10:52, 22. Aug. 2010 (CEST)
Widerspruch bei Interpretation?
Hallo,
ich glaube, die Antwort auf meine Frage ist im oberen Bereich der Diskussion schon angeklungen, vielleicht könnte einer der Experten es mir aber nochmal deutlich erklären. Mir ist nämlich folgendes unklar: angenommen, ich berechne aus zwei unabhängigen Stichproben aus derselben Grundgesamtheit zwei Vertrauensintervalle und diese liegen durch den Zufall nun gerade so, dass sie sich nicht überschneiden. Zum Beispiel liegt eines zwischen 0 und 0.9, das andere zwischen 1 und 2. Wenn ich nun von dem ersten Intervall ausgehe, soll der wahre Wert mit der gewählten Wahrscheinlichkeit zwischen 0 und 0.9 liegen, z.B. mit 95%, entsprechend mit 5% Wahrscheinlichkeit außerhalb. Also auch mit 5% Wahrscheinlichkeit im Bereich von 1 bis 2. Ausgehend von dem zweiten berechneten Intervall soll der wahre Wert aber mit einer Wahrscheinlichkeit von 95% zwischen 1 und 2 liegen (eben waren es noch 5%). Das erscheint mir widersprüchlich. Wo liegt hier der Fehler? --Gustavus 16:54, 17. Mai 2007 (CEST)
- Das ist die falsche Interpretation des Begriffs. Ein 95%-Konfidenzintervall liefert durchschnittlich in 95 von 100 Fällen das "richtige" Ergebnis. Das heißt: Der wahre Parameter ist entweder zwischen 0 und 0.9 oder zwischen 1 und 2 oder außerhalb. Und zwar nicht mit einer beliebigen W'keit, sondern mit W'keit Null oder Eins. --Scherben 22:59, 17. Mai 2007 (CEST)
- Wenn das die falsche Interpretation des Begriffs ist, dann sollten die Passagen des Artikels, in denen dem Konfidenzintervall diese Interpretation gegeben wird, entfernt werden. Zum Beispiel Sätze wie:
- "Das Vertrauensintervall schließt einen Bereich um den geschätzten Wert des Parameters ein, der mit einer zuvor festgelegten Wahrscheinlichkeit die wahre Lage des Parameters trifft. "
- "Wählt man ein 95%-Konfidenzintervall, das heißt 95%ige Wahrscheinlichkeit, dass die errechneten Intervallgrenzen den wahren Wert umgeben..."
- "Mit einer 95%igen Wahrscheinlichkeit beinhaltet also das Intervall des durchschnittlichen täglichen Absatzes an Spülmittelflaschen zwischen ca. 96 und 108 Stück den wahren Mittelwert"
- Es sollte klar gesagt werden, dass ein berechnetes Konfidenzintervall mit zum Beispiel P=0.95 nicht bedeutet, dass dieses Intervall den wahren Wert mit 95% Wahrscheinlichkeit enthält. Wenn ich dich richtig verstehe, ist es vielmehr so zu interpretieren, dass wenn ich viele Stichproben mache und für jede das Konfidenzintervall auf dem 95%-Niveau berechne, dann wird der Anteil der berechneten Intervalle, die den wahren Wert enthalten, gegen 0.95 gehen. --Gustavus 02:58, 18. Mai 2007 (CEST)
- Ja, sollte man. --Scherben 08:19, 18. Mai 2007 (CEST)
- Es sollte klar gesagt werden, dass ein berechnetes Konfidenzintervall mit zum Beispiel P=0.95 nicht bedeutet, dass dieses Intervall den wahren Wert mit 95% Wahrscheinlichkeit enthält. Wenn ich dich richtig verstehe, ist es vielmehr so zu interpretieren, dass wenn ich viele Stichproben mache und für jede das Konfidenzintervall auf dem 95%-Niveau berechne, dann wird der Anteil der berechneten Intervalle, die den wahren Wert enthalten, gegen 0.95 gehen. --Gustavus 02:58, 18. Mai 2007 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Plankton314 (Diskussion) 19:05, 21. Mai 2012 (CEST)
Schlussfolgerung
Die Schlussfolgerung:
- In 95 % aller Fälle beinhaltet also das Intervall des durchschnittlichen täglichen Absatzes an Spülmittelflaschen zwischen ca. 96 und 108 Stück den wahren Mittelwert.
ist nicht korrekt. Es ist gerade diese Redensart die man bekämpfen muss. Es ist gerade nicht so dass [96,108] in 95 % der Fälle den waren Wert des Parameters beinhaltet. Der Parameter ist im Intervall [96,108} oder ist nicht im Intervall, und leider wissen wir nicht was richtig ist. Nur wissen wir das Intervall [96,108] ist eins aus einer Menge von Intervallen von denen 95% den waren Wert des Parameters beinhaltet. Nijdam (Diskussion) 21:21, 20. Mai 2012 (CEST)
- Zugegeben, die Formulierung im Artikel ist etwas schwammig, aber ich verstehe das was da steht so:
- mit einer Wahrscheinlichkeit von 95 % liegt der wahre Mittelwert im Intervall [96, 108].
- Warum sollte das falsch sein? Und es ist auch unerheblich ob der Parameter in einem bestimmten Einzelfall nun darin liegt oder nicht. Mit 95% liegt er drin, mehr wird auch nicht behauptet.
- Du hast natürlich recht, dass das nur eines von vielen Intervallen sein kann.
- Aber so ganz verstehe ich auch nicht, was du mit "Menge von Intervallen von denen 95% den waren Wert des Parameters" enthalten meinst. Wie sollte eine Menge von Intervallen konstruiert werden, von denen 95% mit Sicherheit den wahren Parameterwert enthalten?
- Ich denke, die Betonung liegt hier (oder sollte zumindest liegen) eher auf 95% Wahrscheinlichkeit und nicht auf dem einen Intervall. -- Plankton314 (Diskussion) 00:33, 21. Mai 2012 (CEST)
Es ist gerade nicht so dass in 95% der Fälle der Parameter im Intervall [96,108] liegt und im restlichen 5% ausserhalb. Es ist diese Missverstand das klar gemacht werden soll. Nijdam (Diskussion) 11:25, 21. Mai 2012 (CEST)
- So, hab nochmal nachgelesen und ich stimme dem voll und ganz zu, nehme alles zurück und behaupte das Gegenteil.
- Dieser Unterschied sollte nochmals im Beispiel hervorgehoben werden. Wenn man sich der Unterscheidung bewusst ist, steht das natürlich bereits in der Definition. Mir war das aber beim Durchlesen nicht so ganz klar. M.E. führt es das Beispiel in dieser Form zwar ad absurdum, aber es wird sich schon was finden. -- Plankton314 (Diskussion) 12:34, 21. Mai 2012 (CEST)
- Ist das in deinem Sinn? -- Plankton314 (Diskussion) 18:53, 21. Mai 2012 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Plankton314 (Diskussion) 19:05, 21. Mai 2012 (CEST)
Überschneidung der KI
Habe soeben für eine Studie mit einem Statistiker abgeklärt: Wenn sich die KI Grenzen nicht überschneiden, heisst das nicht automatisch, dass Signifikanz herrscht (so stand es jetzt im Text). Es ist nur eine Faustregel und wir haben hier genau einen Fall, der 100 Prozent stimmt und die Regel nicht zutrifft. Ich habs mal im Text geändert. Weitere Vorschläge willkommen.
- Dafür hätte ich gern eine Quelle. Ein signifikanter Unterschied wirkt in der Statistik immer dann angenommen, wenn sich Konfidenzintervalle nicht überschneiden bzw. wenn die entsprechenden Tests die Nullhypothese keines signifikanten Unterschieds ablehnen. Das ist aber im Prinzip äquivalent. Kann es sein, dass du irgendwas missverstanden hast? --Scherben 12:58, 22. Aug. 2007 (CEST)
Hallo, guck beim englischen Wiki-Eintrag: http://en.wikipedia.org/wiki/Confidence_interval: Frei übersetzt steht dort unter der ersten Graphik: Es ist ein statistischer Irrtum, dass zwei Konfidenzintervalle, die sich nicht überschneiden, auf einem Signifikanzniveau von 5% verschieden sind. Quelle siehe Diskussionsseite: The Journal of the Royal Statistical Society should suffice. "It is a common statistical misconception to suppose that two quantities whose 95% confidence intervals just fail to overlap are significantly different".
- Er hat Recht, das Argument mit der Summe der Standardabweichungen ist korrekt. --Scherben 10:45, 28. Aug. 2007 (CEST)
Eine 95% Signifikanz (bei 2 unabhängigen Stichproben) ist bereits gegeben, wenn sich eine Seite des Konfidenzintervalls zur Hälfte mit dem Konfidenzintervall der 2. Stichprobe überschneidet, siehe Inference by Eye (Cumming, Finch 2005) "For a comparison of two independent means, p<= 0.05 when the overlap of the 95% CIs is no more than about half the average margin of error .... in addition, p<= 0.01 when the two CIs do not overlap..." (nicht signierter Beitrag von 188.22.236.151 (Diskussion) 22:02, 19. Mai 2011 (CEST))
Update zum englischen Wiki-Eintrag http://en.wikipedia.org/wiki/Confidence_interval#Statistical_hypothesis_testing : Mittlerweile wird auch hier klar beschrieben, dass zwei sich nicht überschneidende Konfidenzintervalle einen statistisch signifikanten Unterschied anzeigen. Im Gegenteil, es wird hier darauf hingewiesen, dass auch bei sich überlappenden Konfidenzintervallen statistische Unterschiedlichkeit gegeben sein kann. Das entspricht auch meinen statistischen Kenntnissen. --134.100.99.138 19:11, 7. Mai 2012 (CEST)
Test
Waere es nicht besser zu formulieren:
Beinhalt das Konfidenzintervall die Null nicht, so ist bei einem Signifikanzniveau α der Regressionskoeffizient statistisch signifikant verschieden von 0
damit die Aussage "statistisch signifikant verschieden" gezeigt wird. Nijdam (Diskussion) 10:21, 22. Mai 2012 (CEST)
- Am liebsten wäre mir: Überdeckt das Konfidenzintervall die Null, ist das äquivalent zur Nichtablehnung des Hypothesentests bei einem Signifikanzniveau α, dass der Regressionskoeffizient gleich null ist. Irgendjemand hatte den alten Text mal "niedereditiert". --Philipendula (Diskussion) 11:25, 22. Mai 2012 (CEST)
Definition
Ich verstehe eigentlich nicht warum die formale Definition im Artikel steht. Nur sehr abstrakte Theoretici werde sie benutzen. Deshalb habe ich die "gewohnliche" Definition hinzugefuegt. MMn ist es eher verwirrend zu sprechen von statt . Konkret handelt es sich z.B. um ein 0.95-Konfidenzintervall. Also mit Konfidenzniveau . Nijdam 23:51, 11. Feb. 2010 (CET)
- Das mag für Dich so sein, ich habe in der Uni als Wirtschaftler immer nur und benutzt. Aber auch zeitgleich vom 0.95er Konfidenzintervall gesprochen. War gewissermaßen simultan, auch wenn seltener vorkam. -- P.oppenia (Diskussion) 15:48, 10. Sep. 2012 (CEST)
- +1. Ich benutze auch immer ; scheint mir aus didaktischen Gründen auch sinnvoller. --Sigbert (Diskussion) 18:29, 11. Sep. 2012 (CEST)
Verständnis des Artikels
ich finde den Artikel generell schwer verständlich. Man wird als Statistik-Unkundiger nur sehr schwer schlauer aus diesem Artikel. Es fehlt zb an einer einfacheren, allgemeinen Formel die auch Laien verständlich wäre. ..Nur so als Anregung.. (nicht signierter Beitrag von 91.119.195.220 (Diskussion) 01:57, 19. Sep. 2012 (CEST))
- Es gibt keine «einfachere, allgemeine Formel», weil verschiedene Konfidenzintervalle unterschiedlich berechnet werden. Kängurutatze (Diskussion) 09:08, 19. Sep. 2012 (CEST)
Diskussionsbedarf mit Erzbischof
OK, ich bin jetzt nicht so die gläubige Katholikin, aber was sagste denn zu:
- Newcombe, R. G. (1998). "Two-sided confidence intervals for the single proportion: comparison of seven methods." Stat Med 17 (8): 857-872.
Nur mal beispielsweise. Blättere zu Seite 861 und da werden drei Maße für die Güte von Konfidenzintervallen angegeben: Breite bzw. Kürze (je kürzer, desto besser), Überdeckungswahrscheinlichkeit und Konservativismus. Da Du die Überdeckungswahrscheinlichkeit (coverage probability) halt auch abschätzen musst, ist das in diskreten Fällen (mindestens!) keine triviale Sache. Kängurutatze (Diskussion) 19:51, 28. Sep. 2012 (CEST)
- PS: Und danke im voraus, daß Du mich aus dieser komplett fruchtlosen Diskussion:Arne Hoffmann erlöst. Kängurutatze (Diskussion) 19:59, 28. Sep. 2012 (CEST)
- Ok, jetzt sprichst du aber von Gütemaßen für Konfidenzintervalle und nicht von Konfidenzintervallen als Gütemaße. Beides ist ja richtig, aber nur Eigenschaften, die m.E. nicht zu dem, was ein Konfidenzintervall ist, gemacht werden koennen. Dass es manchmal schwer ist, minimale Konfidenzintervalle zu finden, heisst ja nicht, dass Konfidenzintervalle keine Garantien erfuellen. Wenn du die Definition anschaust, die besteht nur aus und das ist eben die Garantieeigenschaft ueber alle . --Erzbischof 12:29, 29. Sep. 2012 (CEST) PS: Haha, Arne Hoffmann, ich sag' mal lieber nichts. :-)
- Ja, und eben diese Gütemaße sagen ja auf einer Dimension, dem Konservatismus, das obige Ungleichung bei anti-konservativen Intervallen, wie beispielsweise dem vom Edwin Wilson, nicht immer zutrifft, sondern nur meistens. Kängurutatze (Diskussion) 11:05, 30. Sep. 2012 (CEST)
- Ah, der Knoten löst sich. Ich persönlich würde das Begriffspaar "Konfidenzintervall" und "angenähertes Konfidenzintervall" dem Paar "konservatives Konfidenzintervall" und "Konfidenzintervall" vorziehen. Sonst müssen wir die Definitionen im Artikel auswechseln. Vielleicht sollten wir es in einem eigenen Abschnitt unterbringen, um der Sache gerecht zu werden. Also: "Auch in einfachen Fällen ist die Angabe eines minimalen Konfidenzintervalls mit einem vorgegebenen alpha oft schwierig. In diesem Fall betrachtet man auch..." bla bla. --Erzbischof 11:26, 30. Sep. 2012 (CEST)
- Was ist im deutschsprachigen Raum denn das übliche Begriffspaar? Ich gebe ja gerne zu, daß ich aus autobiographischen Gründen und einem Grundvertrauen in Taylorismus cum Skaleneffekt lieber Englisch als Deutsch lese. Kängurutatze (Diskussion) 18:47, 3. Okt. 2012 (CEST)
- Ah, der Knoten löst sich. Ich persönlich würde das Begriffspaar "Konfidenzintervall" und "angenähertes Konfidenzintervall" dem Paar "konservatives Konfidenzintervall" und "Konfidenzintervall" vorziehen. Sonst müssen wir die Definitionen im Artikel auswechseln. Vielleicht sollten wir es in einem eigenen Abschnitt unterbringen, um der Sache gerecht zu werden. Also: "Auch in einfachen Fällen ist die Angabe eines minimalen Konfidenzintervalls mit einem vorgegebenen alpha oft schwierig. In diesem Fall betrachtet man auch..." bla bla. --Erzbischof 11:26, 30. Sep. 2012 (CEST)
- Ja, und eben diese Gütemaße sagen ja auf einer Dimension, dem Konservatismus, das obige Ungleichung bei anti-konservativen Intervallen, wie beispielsweise dem vom Edwin Wilson, nicht immer zutrifft, sondern nur meistens. Kängurutatze (Diskussion) 11:05, 30. Sep. 2012 (CEST)
Danke fuer's warten. Die natuerliche Vorgehensweise ist wohl, es genauso zu machen wie beim parametrischen statistischen Test und das Konfidenzintervall (pur) als (in geeigneten Sinn messbare) Abbildung definieren und dann ein (konservatives) Konfidenzintervall zum Niveau alpha als zusaetzliche Eigenschaft einfuehren. Das liegt ja auch Nahe wegen der Dualitaet von Tests und Konfidenzintervallen. Dann wuerde man in der Einleitung und am Anfang nur von Konfidenzintervallen zum Niveau Alpha sprechen und dann fuer die Approximation auch von Konfidenzintervallen im Allgemeinen. --Erzbischof 20:04, 18. Okt. 2012 (CEST)
"Formulierung streng genommen nicht Korrekt"
Ich bin kein Mathematiker, deswegen stellt sich mir folgende Frage. Wenn Ihr schreibt, dass bei Konfidenzniveau von 95% genau
"95 % aller auf Grundlage der gemessenen Daten berechneten Konfidenzintervalle den wahren Wert der zu untersuchenden Population beinhalten",
dann heisst das für mich gleichzeitig, dass
jedes dieser berechneten Konfidenzintervalle mit einer Wahrscheinlichkeit von 95% den wahren Wert enthält
und damit auch, dass
der wahre Wert mit einer Wahrscheinlichkeit von 95% in einem der berechneten Konfidenzintervalle liegt.
Daher verstehe ich nicht ganz, was an dieser Stelle "streng genommen nicht Korrekt" heissen soll. Ich vermute es sollte eher heissen: Aus mathematischer Sicht nicht korrekt. (nicht signierter Beitrag von 134.28.77.173 (Diskussion) 11:54, 10. Apr. 2013 (CEST))
- Das Problem ist folgendes: In der "klassischen" Sichtweise ist der unbekannte Parameter eine feste, nicht zufällige Zahl, nur eben nicht bekannt. Ein konkretes Intervall, also z.B. ein berechnetes Konfidenzintervall, enthält diesen Parameter oder eben nicht, aber daran ist nichts zufällig, also ergibt es auch keinen Sinn von einer Wahrscheinlichkeit zu sprechen. Das geht erst, wenn man das Konfidenzintervall selbst als zufällig ansieht. -- HilberTraum (Diskussion) 20:30, 11. Apr. 2013 (CEST)
Einleitung
Ich bin kein Experte, glaube aber ein paar Formulierungen in der Einleitung sind missverständlich:
- Würde man denselben Versuch beliebig häufig wiederholen, so ist das Konfidenzintervall der Bereich, der mit einer gewissen Häufigkeit (dem Konfidenzniveau) die wahre Lage des Parameters einschließt.
- Ist Versuch wirklich das beste Wort. Ist Messung nicht allgemeiner und vorzuziehen?
- Beliebig häufig schließt doch auch fünf Mal oder 36-Mal mit ein. Sollte es nicht unendlich heißen?
- So wie das formuliert ist, heißt es doch der Bereich eines KI umfasst mit einer bestimmten Häufigkeit den wahren Wert. Aber ein KI beinhalten entweder den wahren Wert oder nicht und nicht mit einer gewissen Häufigkeit. Gemeint ist wahrscheinlich etwas anderes. Gleiche Aussage macht ja auch der nächste Satz:
- Das meistverwendete Konfidenzniveau ist 95 %, so dass in diesem Fall (mindestens) 95 % aller auf Grundlage der gemessenen Daten berechneten Konfidenzintervalle den wahren Wert der zu untersuchenden Population beinhalten..
- Unglücklich an der Formulierung finde ich: Wenn ich einmal Daten erhoben habe, berechne ich doch nur ein KI?! Und wenn ich ich irgendwelche Daten erhebe, können doch auch immer noch sogar 0% den wahren wert einschließen? Irgendwie fehlt da doch ein Wort wie theoretisch oder bei unendlichen Widerholungen, oder? Könnte man es nicht z. B. so formulieren: Bei unendlich wiederholten Messungen beinhalten 95% aller berechneten 95%-KI den wahren Wert der Population. Eine solche Formulierung ist meiner Meinung nach präziser.
- Warum da dort mindestens steht verstehe ich nicht und hab deshalb Zweifel, dass das korrekt ist (lasse mich aber gerne belehren).
- Die häufig anzutreffende Formulierung, dass der wahre Wert zu 95 % im Konfidenzintervall, d. h. im vorhandenen, berechneten Intervall, liegt, ist streng genommen nicht korrekt. Klar ist es nicht richtig das genau so zu formulieren (da muss man nichtmal streng sein^^). Es ist aber doch korrekt zu sagen (korrigert mich, wenn ich hier falsch liege): Ist der wahre Wert nicht im KI, gab es nur eine 5-% Wahrscheinlichkeit ein solches KI (welches den wahren Wert nicht enthält) in der Stichprobe gezogen zu haben. Oder Angenommen der wahre Wert liegt im KI, ist die Wahrscheinlichkeit ein KI erhalten zu haben, welches den wahren Wert enthält, 95%.
So viel mein Eindrücke von der Einleitung. --Jakob (Diskussion) 16:12, 16. Nov. 2013 (CET)
- Hallo Jakob, ja du hast recht, bei Formulierungen zu Konfidenzintervallen muss man sprachlich echt aufpassen. Mal ein paar Gedanken meinerseits zu deinen Anmerkungen:
-
- "Versuch" finde ich jetzt nicht so schlimm, man spricht ja auch von einem Zufallsversuch, aber "Messung" ist auch ok.
- Mir gefällt weder "beliebig" noch "unendliche". Man kann ja nicht wirklich unendlich oft wiederholen, und selbst wenn, was sollte dann die Häufigkeit sein? Mathematisch handelt es sich ja um einen Grenzwert (Folge), aber was man hier anschaulich schreibt, weiß ich auch nicht
- zu dieser Stelle und der nächsten: Ich habe den Text eigentlich schon so verstanden, dass es weiterhin um den Fall einer "beliebig häufigen" Wiederholung gehen soll und nicht um ein konkretes Konfidenzintervall.
- zu 2.2: Das "mindestens" ist einfach so definiert, das ist das aus der formalen Definition. Das macht man deshalb so, weil es beispielsweise bei diskreten Verteilungen wie der Binomialverteilung nicht möglich ist, exakt auf z. B. 95 % zu kommen, und man deshalb auch größere Wahrscheinlichkeiten zulässt.
- -- HilberTraum (Diskussion) 23:50, 17. Nov. 2013 (CET)
- Vielen Dank für die Antworten!!! Vielleicht finden sich ja noch schlaue Köpfe, die anschaulich, verständliche und korekte Formulierungen finden. Liebe Grüße --Jakob (Diskussion) 22:13, 19. Nov. 2013 (CET)
- Hallo, ich bin auch über den Punkt 2.1 gestolpert und habe mich gewundert, ob man auf Basis der selben Daten mehrere Intervalle berechnet. Dass es sich hier um Intervalle zu wiederholten Messungen handelt, konnte ich mir dann mit den Einzelnachweisen erklären. Insgesamt war das für mich als Laie sehr erhellend. Um dem Missverständnis vorzubeugen, habe ich die Formulierung leicht geändert. Auch die zitierten Sätze aus Punkt 1. und Punkt 3. haben dazu beigetragen. Danke und Grüße. Richard W. Kiefer (Diskussion) 12:37, 10. Feb. 2014 (CET)
Beispiele/Empfehlungen zur Anwendung
Ich bin auch der Meinung dass deutscher und englischer Artikel für Nicht-Experten eher unverständlich sind und kaum Hinweise geben wie ein Konfidenzintervall ermittelt und angewendet werden kann. Z.B. in O./L. Office Calc:
Mittelwert (95% Konfidenzintervall) MITTELWERT(A1:A101) ( KONFIDENZ(0,05;STABW(A1:A101);101-1) )
--ChrisTi (Diskussion) 17:20, 18. Okt. 2014 (CEST)
- Es ist in der deutschen WP (leider) nicht erwünscht Softwarecode einzubetten. Die Begründung kann ich durchaus nachvollziehen: welche Software nimmt man, eine bestimmte? Alle? --Sigbert (Diskussion) 11:49, 19. Okt. 2014 (CEST)
Falsche Formeln in Übersicht für stetige Verteilungen
Mir ist unbekannt, warum bei der Notation einmal \sigma und einmal s im Bruch im Zähler geschrieben wird. Dies sollte identisch sein. Andernfalls bitte herausstellen, warum die hier unterschiedlich ist. Soll das eine die unkorrigierte das andere die korrigierte sein? (nicht signierter Beitrag von 93.129.204.140 (Diskussion) 11:56, 15. Nov. 2015 (CET))
- Links in der Tabelle sind die Unterschiede doch dargestellt. Manchmal kennt man die Varianz, dann benutzt man Sigma, manchmal nicht, dann wird die Varianz über die Stichprobenvarianz s geschätzt. --Jakob (Diskussion) 22:39, 15. Nov. 2015 (CET)
Problem mit Einleitungstext
Folgendes finde ich schwer verständlich:
Die häufig anzutreffende Formulierung, dass der wahre Wert mit 95 % Wahrscheinlichkeit im Konfidenzintervall liegt, d. h. im vorliegenden berechneten Intervall, ist streng genommen nicht korrekt[1][2] – der wahre Wert liegt entweder in diesem Intervall, oder er liegt nicht darin.
Die Erklärung macht nicht klar, warum die häufig anzutreffende Formulierung falsch ist. Die häufig anzutreffende Formulierung lässt zu, dass das der wahre Wert entweder in diesem Intervall liegt oder nicht - sie sagt lediglich aus, dass er beides mit einer bestimmten Wahrscheinlichkeit tut. Elektrolurch Kontakt
- Stimme dir zu. Hast du denn einen Vorschlag wie man es deutlicher formulieren könnte? Wichtig ist ja vielleicht nicht nur die falsche Interpretation darzustellen sondern auch "die richtige" (Wenn ein Test unendlich mal wiederholt wird liegt der wahre Wert in 95% der Fällen im jeweils berechneten Konfidenzintervall). --Jakob (Diskussion) 18:40, 28. Apr. 2017 (CEST)
- Ein Vorschlag zur Inspiration:
- Die Interpretation des Konfidenzintervalls ist nicht einfach und es existieren in Lehrbüchern teilweise unterschiedliche Vorschläge. Häufig ist zu lesen, dass ein 95% Konfidenzintervall bedeutet, dass der wahre Wert mit einer Wahrscheinlichkeit von 95% in dem berechneten Intervall liegt. Diese Interpretation ist jedoch nicht korrekt. Richtig ist, dass wenn ein Test unendlich oft wiederholt werden würde, der wahre Wert in 95% der Tests im jeweils berechneten 95%-Konfidenzintervall liegt. Daraus kann jedoch nicht geschlossen werden, dass in dem einen vorliegenden Test der wahre Wert innerhalb des Konfidenzintervalls liegt. Schließlich liegt der wahre Wert entweder im Konfidenzintervall, womit die Wahrscheinlichkeit, dass der wahre Wert innerhalb des Konfidenzintervalls liegt 100% ist oder der wahre Wert liegt nicht innerhalb des Konfidenzintervalls, womit die Wahrscheinlich, dass der wahre Wert innerhalb des Konfidenzintervalls liegt 0% ist. Diese Unterscheidung ist wichtig, da sonst der Eindruck entstehen könnte, es gäbe ein feststehendes Konfidenzintervall und der wahre Wert unterliege Schwankungen, obwohl tatsächlich der wahre Wert feststeht und das Konfidenzintervall dem Messfehler unterliegt und deshalb von der jeweiligen Messung abhängt. --Jakob (Diskussion) 19:17, 28. Apr. 2017 (CEST)
- Hallo Benutzer:Jakob S., vielen Dank für den Vorschlag, dieser gefällt mir sehr gut und macht die Sache sehr viel klarer als die jetzige Formulierung. Aus meiner Sicht kann der Text so in den Artikel übernommen werden. Ich sehe lediglich noch einen Typo ("womit die Wahrscheinlich" -> "Wahrscheinlichkeit"). Elektrolurch Kontakt 14:27, 10. Mai 2017 (CEST)
- Also ich weiß noch nicht so recht: Ein Test kann nicht „unendlich oft wiederholt“ werden. Und selbst wenn doch, dann würde in unendlichen vielen Fällen der Parameter im Konfidenzintervall und ebenfalls in unendlich vielen Fällen nicht. Das müsste irgendwie anders formuliert werden. Momentan unterscheidet der Artikel ja stellenweise zwischen den Begriffen „Konfidenzintervall“ und „Schätzintervall“, um das Problem zu umgehen, aber nicht durchgehend. Grüße -- HilberTraum (d, m) 14:36, 10. Mai 2017 (CEST)
- @Jakob S.:@HilberTraum: Habe soeben ergänzt warum diese Formulierung falsch ist. Seid ihr einverstanden damit?. Grüße. --JonskiC (Diskussion) 20:45, 11. Mai 2017 (CEST)
- Für mich klingt das in Ordnung. Danke fürs Formulieren! -- HilberTraum (d, m) 12:51, 12. Mai 2017 (CEST)
- @Jakob S.:@HilberTraum: Habe soeben ergänzt warum diese Formulierung falsch ist. Seid ihr einverstanden damit?. Grüße. --JonskiC (Diskussion) 20:45, 11. Mai 2017 (CEST)
- Also ich weiß noch nicht so recht: Ein Test kann nicht „unendlich oft wiederholt“ werden. Und selbst wenn doch, dann würde in unendlichen vielen Fällen der Parameter im Konfidenzintervall und ebenfalls in unendlich vielen Fällen nicht. Das müsste irgendwie anders formuliert werden. Momentan unterscheidet der Artikel ja stellenweise zwischen den Begriffen „Konfidenzintervall“ und „Schätzintervall“, um das Problem zu umgehen, aber nicht durchgehend. Grüße -- HilberTraum (d, m) 14:36, 10. Mai 2017 (CEST)
- @JonskiC: - sicher, dass die Interpretation so korrekt ist? Ich bin nur Psychologe, aber so wie ich es verstehe kann man innerhalb des frequency statistics framework nie Aussagen zu einzelnen Ereignissen treffen. So lese ich es auch in einigen Erklärungen ([1], [2], [3], [4]). Wobei die Sachen auch nicht glasklar ist, bzw. von den darunterliegenden Annahmen/Definitionen von Wahrscheinlichkeiten abhängig sind. Eine Diskussion zwischen Baysian und Frequencist diesbezüglich ist hier zusammen gefasst, bzw. etwas ausführlicher und auf deutsch hier. Deshalb scheint mir die eingefügte richtige Defintion im strengen Sinne nicht korrekt. Es müsste meiner Einschätzung nach stattdessen über "wenn das Experiment ganz oft wiederholt werden würde..." argumentiert werden. Dann macht die Grafik neben der Einleitung auch Sinn. Aber korrigiert mich gerne, wenn ich falsch liege. --Jakob (Diskussion) 08:09, 16. Mai 2017 (CEST)
- @Jakob S.:Ich denke du hast recht. Ich habe wieder eine kleine Umformulierung vorgenommen. Es gibt bei Konfindezintervallen eine Fülle von Fehlerinterpretationen. Einmal diese Sache mit den Intervallgrenzen und zum anderen die Sache die du angemerkt hast. Grüße.--JonskiC (Diskussion) 22:16, 16. Mai 2017 (CEST)
- Klingt so besser, wie ich finde. Danke. --Jakob (Diskussion) 09:59, 21. Mai 2017 (CEST)
- @Jakob S.:Ich denke du hast recht. Ich habe wieder eine kleine Umformulierung vorgenommen. Es gibt bei Konfindezintervallen eine Fülle von Fehlerinterpretationen. Einmal diese Sache mit den Intervallgrenzen und zum anderen die Sache die du angemerkt hast. Grüße.--JonskiC (Diskussion) 22:16, 16. Mai 2017 (CEST)
- @JonskiC: - sicher, dass die Interpretation so korrekt ist? Ich bin nur Psychologe, aber so wie ich es verstehe kann man innerhalb des frequency statistics framework nie Aussagen zu einzelnen Ereignissen treffen. So lese ich es auch in einigen Erklärungen ([1], [2], [3], [4]). Wobei die Sachen auch nicht glasklar ist, bzw. von den darunterliegenden Annahmen/Definitionen von Wahrscheinlichkeiten abhängig sind. Eine Diskussion zwischen Baysian und Frequencist diesbezüglich ist hier zusammen gefasst, bzw. etwas ausführlicher und auf deutsch hier. Deshalb scheint mir die eingefügte richtige Defintion im strengen Sinne nicht korrekt. Es müsste meiner Einschätzung nach stattdessen über "wenn das Experiment ganz oft wiederholt werden würde..." argumentiert werden. Dann macht die Grafik neben der Einleitung auch Sinn. Aber korrigiert mich gerne, wenn ich falsch liege. --Jakob (Diskussion) 08:09, 16. Mai 2017 (CEST)
Mutungsintervall...
... leitet auf diesen Artikel hier weiter. Gibt es die Bezeichnug wirklich? Dann sollte sie am Anfang miterwähnt werfen, Wenn nein, sollte Mutungsintervall gelöscht werfen. --UvM (Diskussion) 16:13, 30. Dez. 2019 (CET)
- Scheint es wirklich zu geben [5]. Ist aber nicht Synonym zu Konfidenzintervall und wird im Artikel auch nicht erläutert.--Jonski (Diskussion) 16:18, 30. Dez. 2019 (CET)
mindestens?
In der Einleitung steht dieser Satz:
Ein häufig verwendetes Konfidenzniveau ist 95 %, so dass in diesem Fall (mindestens) 95 % aller auf Grundlage von gemessenen Daten berechneten Konfidenzintervalle den wahren Wert der zu untersuchenden Population beinhalten.
Stimmt das "mindestens" in diesem Satz? Meiner Intuition nach sollte da eher "im Mittel" stehen. Georg Stillfried (Diskussion) 17:27, 9. Feb. 2018 (CET)
- Hab das mal angepasst.--Jonski (Diskussion) 16:33, 30. Dez. 2019 (CET)
- @HilberTraum: Wodurch ist das mindestens gerechtfertigt?--Jonski (Diskussion) 21:02, 30. Dez. 2019 (CET)
- Oh, ich habe gar nicht gesehen, dass es hier schon einen Abschnitt dazu gibt. Aber „mindestens“ ist doch die übliche Definition, oder? Ich könnte mir vorstellen, dass vor allem im anwendungsorientierten Bereich auch „näherungsweise“ oder wie oben angemerkt „im Mittel“ verwendet wird, aber „genau 95 %“ ist doch nicht sinnvoll: Dann würde ja z. B. gar kein Konfidenzintervall für die Erfolgswahrscheinlichkeit der Binomialverteilung existieren. Grüße -- HilberTraum (d, m) 21:17, 30. Dez. 2019 (CET)
- Hmm im angegebenen Belege von Leonhard Held und Daniel Sabanés und steht nicht mindestens, sondern ohne mindestens. Allerdings schreiben Jürgen Hedderich Lothar Sachs in "Angewandte Statistik" die Definition mit mindestens. Ich traue aber eher Leonhard Held und Daniel Sabanés, da das Buch von Jürgen Hedderich Lothar Sachs eher für "Anfänger" ist. Irritiert mich ein wenig, da es doch eigentlich einheitlich deiniert sein müsste. Grüße.--Jonski (Diskussion) 21:33, 30. Dez. 2019 (CET)
- Ich habe hier im Moment nur sehr wenig Zugang zu Literatur, aber nächste Woche schaue ich mir das gerne genauer an. Spontan hatte ich nur „im Kopf“, dass „mindestens“ die allgemein übliche Definition ist. Grüße -- HilberTraum (d, m) 22:06, 30. Dez. 2019 (CET)
- wenn du nächste woche nach literatur schauen würdest und denn artikel ausbauen würdest, dann würde ich das begrüßen. der artikel wird nämlich vergleichsweise häufig aufgerufen. wenn man diesen artikel noch auf lesenswert bekommen könnte dann wären es bereits einige kern-statistikartikel die lesenswert wären was ein solides fundament für weitere artikelarbeit liefern würde. frohes neues!--Jonski (Diskussion) 01:14, 2. Jan. 2020 (CET)
- Ich habe hier im Moment nur sehr wenig Zugang zu Literatur, aber nächste Woche schaue ich mir das gerne genauer an. Spontan hatte ich nur „im Kopf“, dass „mindestens“ die allgemein übliche Definition ist. Grüße -- HilberTraum (d, m) 22:06, 30. Dez. 2019 (CET)
- Hmm im angegebenen Belege von Leonhard Held und Daniel Sabanés und steht nicht mindestens, sondern ohne mindestens. Allerdings schreiben Jürgen Hedderich Lothar Sachs in "Angewandte Statistik" die Definition mit mindestens. Ich traue aber eher Leonhard Held und Daniel Sabanés, da das Buch von Jürgen Hedderich Lothar Sachs eher für "Anfänger" ist. Irritiert mich ein wenig, da es doch eigentlich einheitlich deiniert sein müsste. Grüße.--Jonski (Diskussion) 21:33, 30. Dez. 2019 (CET)
- Oh, ich habe gar nicht gesehen, dass es hier schon einen Abschnitt dazu gibt. Aber „mindestens“ ist doch die übliche Definition, oder? Ich könnte mir vorstellen, dass vor allem im anwendungsorientierten Bereich auch „näherungsweise“ oder wie oben angemerkt „im Mittel“ verwendet wird, aber „genau 95 %“ ist doch nicht sinnvoll: Dann würde ja z. B. gar kein Konfidenzintervall für die Erfolgswahrscheinlichkeit der Binomialverteilung existieren. Grüße -- HilberTraum (d, m) 21:17, 30. Dez. 2019 (CET)
- @HilberTraum: Wodurch ist das mindestens gerechtfertigt?--Jonski (Diskussion) 21:02, 30. Dez. 2019 (CET)
- Hab das mal angepasst.--Jonski (Diskussion) 16:33, 30. Dez. 2019 (CET)
Parameter Alpha wird nirgends definiert
Zwar wird der Parameter Alpha schon in der Einleitung erwähnt, aber im gesamten Artikel nirgends definiert. Csteinbeck (Diskussion) 14:01, 5. Jan. 2018 (CET)
Vollkommen richtig. Der ganze Artikel ist ein Paradebeispiel, wie man ein relativ einfaches Konzept auf möglichst schlechte Weise erklärt. Dieser Artikel ist von vorne bis hinten eine absolute Katastrophe. (nicht signierter Beitrag von 2A02:2455:1A1:8200:F04F:A9EA:D460:DCCB (Diskussion) 14:11, 3. Mai 2020 (CEST))
Der Kardinal-Fehler, Symbole einzuführen, ohne Ihre Bedeutung zu erklären, der zieht sich durch den ganzen Artikel durch. Deshalb ist der gesamte Artikel in sich widersprüchlich und vollkommen unverständlich. Beispiel:
"Rahmenbedingungen
Gegeben sei ein statistisches Modell {\displaystyle (X,{\mathcal {A}},(P_{\vartheta })_{\vartheta \in \Theta })}
sowie eine zu schätzende Funktion
{\displaystyle g\colon \Theta \to \Gamma } ,
die im parametrischen Fall auch Parameterfunktion genannt wird. Die Menge {\displaystyle \Gamma }
enthält die Werte, die Ergebnis einer Schätzung sein können. Meist ist
{\displaystyle \Gamma \subset \mathbb {R} ^{n}}" (nicht signierter Beitrag von 2A02:2455:1A1:8200:F04F:A9EA:D460:DCCB (Diskussion) 14:17, 3. Mai 2020 (CEST))
Nicht erklärte Variablen in der Definition
Hallo, für folgende Variablen fehlt im Abschnitt Definition jeweils noch eine Erläuterung, was sie bedeuten bzw. wofür sie stehen:
- h_u, h_v
- P
- Theta.
Gruß --Acky69 (Diskussion) 10:12, 2. Jul. 2020 (CEST)
- Statistik ist verlinkt, theta steht für den unbekannten (zu schätzenden) Parameter ist genannt und P() ist absolute Grundlage, dass es für Wahrscheinlichkeit steht das muss man nicht erklären. Gruß.--Jonski (Diskussion) 12:51, 2. Jul. 2020 (CEST)
Einleitung zumindest unklar
Meines Wissens lässt sich das Konfidenzintervall, in dem ein gesuchter Parameter liegen soll, im einfachen Fall für Mathe-Laien so beschreiben:
- Der wahre Wert des gesuchten Parameters existiert de facto, ist aber unbekannt. Man will ihn erfahren.
- Man gibt ein Konfidenzniveau vor, zum Beispiel 95% (in seriösen Medizin- und Pharmakologie-Journals werden Rechnungen mit geringerer Konfidenz als 95% standardmäßig abgelehnt).
- Man führt ein Experiment (vielfach, n-mal) durch, dessen Ausgang von dem gesuchten Parameter abhängt.
- Man zählt die Ausgänge.
- Nun stellt man sich die Frage: Welche möglichen Werte des gesuchten Parameters passen gut (im Sinne einer sozusagen „wahrscheinlichkeits-angeweichten/relaxierten Karl-Popper-Frage“, s. u.) zu den gezählten Häufigkeiten?
- Man berechnet für jeden möglichen/denkbaren Wert des gesuchten Parameters:
- den Erwartungswert der Häufigkeiten der (n-fach-)Experimentausgänge,
- den „Umkreis“ um , innerhalb dessen der n-fach-Ausgang mit Konfidenzwahrscheinlichkeit (95%) liegt,
- ermittelt, ob der gemessene/gezählte Wert innerhalb dieses „Umkreises“ um liegt
- und sagt, wenn der gezählte/gemessene Wert innerhalb von liegt, der denkbare Wert des gesuchten Parameters „passe gut“ zu den gezählten Häufigkeiten – im anderen Fall „passt er nicht gut“. (Die Popper'sche Erkenntnistheorie im üblichen einfachen Fall kennt nur „passt“ mit der Deutung „könnte wahr sein“ und „passt nicht“ mit der Deutung „kann keinesfalls wahr sein, ist falsifiziert“)
- Diejenigen denkbaren Werte des gesuchten Parameters, die „gut passen“, bilden den „Konfidenzbereich“, der in vielen Fällen die Form eines Intervalls hat, das „Konfidenzintervall“.
- Man berechnet für jeden möglichen/denkbaren Wert des gesuchten Parameters:
Ich bin mir ziemlich sicher, dass ich die prinzipielle Denkweise bei der Definition des Begriffs „Konfidenzintervall“ durch diese vorgeschlagene Beschreibung richtig wiedergebe. Bei den Details, insbesondere wie meine Formulierung „Umkreis um “ zu präzisieren oder zu ersetzen ist, bin ich allerdings überfragt. Außerdem ist der Terminus Erwartungswert natürlich auch schon für viele Laien hartes Brot.
Der Terminus gehört jedenfalls zum Standardrepertoire von medizinisch-wissenschaftlichen und pharmakologischen Publikationen und sollte möglichst allgemeinverständlich Basis-erklärt werden. Das obige „Kochrezept“ wäre meines Erachtens ein guter Ansatz. Letztlich ist ja genau das die Denkweise, die der Aufstellung des Begriffs zu Grunde liegt.
Ein mögliches einfaches erstes Beispiel ist die Prüfung, ob eine Münze „fair“ ist in dem Sinne, dass der Münzwurf mit (annähernd) gleicher Wahrscheinlkichkeit „Kopf“ oder „Zahl“ ergibt. Damit könnte man versuchen, es WP:Allgemeinverständlichkeits - konform darzustellen.
!Der Text dieser Diskussions-Äußerung wurde nach dem Start am 9. Mai(?) 2021 noch wesentlich verändert!
Hallo @Biggerj1:, mich interessiert Deine Meinung dazu. --Himbeerbläuling (Diskussion) 16:11, 16. Mai 2021 (CEST)
- Ich stimme dir im Kern zu. Vielleicht könntest du "den Erwartungswert der Häufigkeiten" der (n-fach-)Experimentausgänge" noch anders ausdrücken? Das scheint mir etwas vage. biggerj1 (Diskussion) 17:23, 18. Mai 2021 (CEST)
- Eine reference könnte sein, muss ich aber noch prüfen: https://books.google.de/books?hl=de&lr=&id=1ZEMXC-Xc9gC&oi=fnd&pg=PP7&dq=confidence+interval&ots=hnDeBiFEbt&sig=FYbVfGPK6UQgkQ5kCSKyWf9c6no#v=onepage&q=confidence%20interval&f=false --Himbeerbläuling (Diskussion) 15:57, 12. Jun. 2021 (CEST)
Konfidenz- und Vorhersageband
Hallo @JonskiC: könntest du bitte etwas ausfüren, wie die Bänder definiert sind (eventuell im Kontrast zum Konfidenzintervall, falls das hilfreich ist). Liebe Grüße biggerj1 (Diskussion) 22:20, 28. Aug. 2023 (CEST)
- Moin biggerj1. Ich bin kein Experte für Konfidenz- und Vohersagebänder. Aktuell bin ich auch sehr eingespannt, weshalb ich mich weniger damit beschäftigen kann. Wenn ich Zeit finde, werde ich mich aber erstmal der Verbesserung bzw. der Behebung der Inkonsistenten beim Artikel Prognoseintervall kümmern. Liebe Grüße.--Jonski (Diskussion) 23:27, 28. Aug. 2023 (CEST)