Diskussion:Zweistichproben-t-Test
Vorgeschichte
[Quelltext bearbeiten]Der Inhalt dieses Artikel wurde 2011 aus dem Artikel t-Test ausgelagert, allerdings wurden die betreffenden Diskussionen nicht mitgeführt. Ältere Diskussionen bis 2011 finden sich daher auf der Seite Diskussion:T-Test.--Sigma^2 (Diskussion) 09:31, 24. Aug. 2021 (CEST)
Abhaengige Stichproben
[Quelltext bearbeiten]MMn ist der Titel des Abschnitts "Zweistichproben-t-Test für abhängige Stichproben" falsch, und der Abschnitt gehoert nicht hier, Zwar handelt es sich um zwei Stichproben, aber der Test bezieht sich auf die eine Stichprobe der Differenzen. Nijdam 21:43, 12. Nov. 2011 (CET)
- Was macht denn der Test für "abhängige Stichproben"? In beiden Fällen wird betrachtet; man könnte den Abschnitt für abhängige Stichproben auslagern, aber macht das Sinn? --Sigbert 15:13, 13. Nov. 2011 (CET)
Es handelt prinzipiell um dem T-Test fuer eine Stichprobe, naemlich die Stichprobe der Differenzen. MMn gehoert der Fall dort besprochen zu werden.Nijdam 20:23, 13. Nov. 2011 (CET)
Mir ist ein grober Fehler aufgefallen: Die Formel für die Berechung der Freiheitsgrade ist falsch. Dort wird mit sx und sy gerechnet. Richtig wäre aber jeweils die VARIANZ. (nicht signierter Beitrag von 89.13.15.58 (Diskussion) 13:43, 29. Nov. 2011 (CET))
- Hast recht, habe es korrigiert. Nijdam 17:02, 29. Nov. 2011 (CET)
Ich zeigre noch auf meine Bemerkungen oben: der "Zweistichproben-t-Test für abhängige Stichproben" ist wesentlich nur ein Test für gepaarte Beobachtungen. Nijdam (Diskussion) 14:39, 19. Jun. 2012 (CEST)
- Der Test für so genannte "abhängige Stichproben" muss entweder als t-Differenzentest einen eigenen Artikel bekommen, wie in der englischsprachigen Wikipedia (https://en.wikipedia.org/wiki/Paired_difference_test) oder er muss als Abschnitt in den Artikel Einstichproben-t-Test. Zwar wird in einigen Anwendungsbereichen von "abhängigen Stichproben" gesprochen, es handelt sich aber um e i n e Stichprobe aus e i n e r Grundgesamtheit, bei der z w e i Merkmale an denselben Einheiten beobachtet werden. Nijdam hat grundsätzlich recht, auch wenn in seiner ersten Äußerung falsch konzediert "handelt es sich um zwei Stichproben". Nein es handelt sich eben n i c h t um zwei Stichproben, sondern um e i n e (zweidimensionale) Stichprobe, weswegen die Differenzen gebildet werden können. Die aus dem Anwenderbereich kommende schlechte Begrifflichkeit "abhängige Stichproben" (ähnlich problematisch und üblich für denselben Sachverhalt: "gebundene Stichproben", "gepaarte Stichproben") führt dann dazu, dass der t-Differenzentest unter der Überschrift Zweistichproben-Test landet, wo er nichts zu suchen hat. --Sigma^2 (Diskussion) 18:15, 23. Aug. 2021 (CEST)
Beispiel 2
[Quelltext bearbeiten]MMn soll es im Beispiel 2 um einen einseitigen Test handeln. Nijdam (Diskussion) 14:35, 19. Jun. 2012 (CEST)
- Im Beispiel werden ja beide Varianten (ein- und zweiseitig) erwähnt. Denkst du, dass hier nur der einseitige sinnvoll ist? -- HilberTraum (Diskussion) 17:19, 19. Jun. 2012 (CEST)
Unbedingt, denn um eine neue Therapie zur Senkung des Cholesterinspiegels zu testen, möchte man nur sicher sein ob tatsächlich eine Senkung stattfindet. Also ist die alternative Hypothese einseitig. Nijdam (Diskussion) 12:53, 20. Jun. 2012 (CEST)
- Das würde aber heißen, dass man eine mögliche Erhöhung des Cholesterinspiegels schon vor dem Test völlig ausschließt. Ich denke gerade bei Medikamenten schadet es nicht, wenn man da etwas vorsichtig ist, vgl. Paradoxe Reaktion. -- HilberTraum (Diskussion) 07:33, 21. Jun. 2012 (CEST)
Nein, nein, ich erwarte besseres von dir. Es ist nur die Frage was man "beweisen" möchte. Nijdam (Diskussion) 09:01, 21. Jun. 2012 (CEST)
- Man findet sicher leicht noch bessere Quellen, aber auf die Schnelle mal hier etwas zu Einlesen. -- HilberTraum (Diskussion) 09:20, 21. Jun. 2012 (CEST)
Ich verstehe nicht worauf du deutest. Von einer neuen Therapie zur Senkung des Cholesterinspiegels mochte man doch versuchen zu zeigen das sie tatsächlich das Cholesterinspiegel senkt, oder? Die Nullhypothese ist also sie senkt den Cholesterinspiegel nicht. Sie wird nur abgelehnt wenn eine signifikante Senkung festgestellt wird. Nijdam (Diskussion) 23:28, 21. Jun. 2012 (CEST)
- Man könnte mal im Medizin-Portal nachfragen, wie das in der Praxis gemacht wird, aber nach meinem (theoretischen) Wissen sind zweiseitige Tests bei Medikamenten absolut üblich (oder sogar vorgeschrieben?). Man testet, ob das neue Medikament überhaupt eine Wirkung hat und schaut dann erst auf die Richtung. Begründet wird das damit, dass das Medikament genauso gut auch eine verschlechternde Wirkung haben könnte. Mathematisch könnte man das gleiche natürlich auch mit einem einseitigen Test mit angepasstem machen, aber ich denke man will so mehr "Symmetrie" in die Interpretation bringen. -- HilberTraum (Diskussion) 09:04, 22. Jun. 2012 (CEST)
Notation
[Quelltext bearbeiten]Die Notation in den Formeln finde ich einigermaßen irritierend. Folende Schreibweisen würde ich vorschlagen:
Stichproben
[Quelltext bearbeiten]Fallzahl der ersten Stichprobe | |
Fallzahl der zweiten Stichprobe | |
Mittelwert der ersten Stichprobe | |
Mittelwert der zweiten Stichprobe | |
Standardabweichung der ersten Stichprobe | |
Standardabweichung der zweiten Stichprobe | |
Aus der ersten Stichprobe geschätzte Grundgesamtheitsvarianz | |
Aus der zweiten Stichprobe geschätzte Grundgesamtheitsvarianz | |
Aus beiden Stichproben geschätzte gemeinsame Grundgesamtheitsvarianz |
Grundgesamtheiten
[Quelltext bearbeiten]Mittelwert der Grundgesamtheit der ersten Stichprobe | |
Mittelwert der Grundgesamtheit der zweiten Stichprobe | |
Standardabweichung der Grundgesamtheit der ersten Stichprobe | |
Standardabweichung der Grundgesamtheit der zweiten Stichprobe | |
Varianz der Grundgesamtheit der ersten Stichprobe | |
Varianz der Grundgesamtheit der zweiten Stichprobe | |
Varianz der gemeinsamen Grundgesamtheit beider Stichproben |
Sonstiges
[Quelltext bearbeiten]Mittelwertdifferenz, auf die getestet wird. Normalerweise gleich null gesetzt. Kann deshalb auch weggelassen werden. | |
Freiheitsgrade |
Dann sind:
Testgröße t bei gleichen Varianzen
[Quelltext bearbeiten]bzw., was numerisch identisch ist:
mit Freiheitsgraden
Testgröße t bei ungleichen Varianzen (Welch-Korrektur)
[Quelltext bearbeiten]mit
Freiheitsgraden, wobei
ist. Vergleiche dazu auch Clauß/Ebner (1968), 184-194 und Borz (2005), 140-143 sowie folgende Webseiten:
http://eswf.uni-koeln.de/lehre/stathome/statcalc/v2401.htm
Viele Grüße --Jake2042 (Diskussion) 07:02, 25. Jul. 2012 (CEST)
Literatur
[Quelltext bearbeiten]Borz,Jürgen, (6)2005: Statistik für Human- und Sozialwissenschaftler. Heidelberg: Springer
Clauß, Günter und Heinz Ebner, 1968: Grundlagen der Statistik für Psychologen, Pädagogen und Soziologen. Berlin: Volk und Wissen
Normalverteilungsnotation
[Quelltext bearbeiten]Als Parameter der Normalverteilung werden normalerweise Erwartungswert und Varianz angegeben, also . Im Artikel steht hingegen . Absicht? Gleiches im Artikel Einstichproben-t-Test.--93.131.229.131 19:52, 22. Jun. 2015 (CEST)
- Ja, ich denke auch, dass das überall auf Varianzen vereinheitlicht werden sollte. -- HilberTraum (d, m) 08:26, 24. Jun. 2015 (CEST)
- Gleicher Meinung. Nijdam (Diskussion) 23:01, 25. Jun. 2015 (CEST)
Beispiel 1
[Quelltext bearbeiten]Es wird vom 0.975-Quantil gesucht, aber von einer Konfidenz von 95% gesprochen. Ich vermute, hier ist ein Fehler, aber verfüge selbst nur über Halbwissen. Könnte das ein sachkundiger Benutzer ändern oder im Fall dass ich falsch liege in einem Halbsatz kurz erwähnen, warum die Zahlen verschieden sind? --80.146.228.74 10:23, 10. Aug. 2017 (CEST)
- Das stimmt schon so, wie es im Beispiel steht: Das Signifikanzniveau wird zu gleichen Teilen auf die „zu großen“ und die „zu kleinen“ Werte verteilt. Darum heißt es auch „zweiseitiger“ Test. Grüße -- HilberTraum (d, m) 19:42, 10. Aug. 2017 (CEST)
- Es ist problematisch, den Begriff "Konfidenz" im Zusammenhang mit statistischen Tests zu verwenden, da es ein Begriff aus dem Bereich der Intervallschätzung (Konfidenzintervalle und -bereiche) ist. Im Bereich der statistischen Test wird vom Signifikanzniveau und Signifikanz gesprochen. Das Ergebnis des Tests kann z.B. so zusammengefasst werden: "Die Düngemittel unterscheiden sich in ihrer Wirkung signifikant (bei einem vorgegebenen Signifikanzniveau von 5%)." --Sigma^2 (Diskussion) 09:59, 24. Aug. 2021 (CEST)
Notation "" wird ohne Referenz oder Erklärung verwendet
[Quelltext bearbeiten]Im Abschnitt "Zweistichproben-t-Test für unabhängige Stichproben" wird in einer Formel die Notation t(x, y) verwendet. Diese Funktion wird nicht eingeführt. Offensichtlich ist es was anderes als der weiter oben definierte t-Wert. Es wäre schön, wenn ein/e Wissende/r eine Erklärung ergänzen würde, so dass ich das Schritt für Schritt nachrechnen kann (idealerweise ohne Vorwissen über t-Tests, denn sonst müsste ich diesen Artikel ja nicht aufrufen). Nachdem ich den Wikipedia-Artikel "t-Verteilung" angesehen habe (der in einem anderen Kontext weiter oben verlinkt ist), vermute ich, es handelt sich um das x-Intervall einer t-Verteilung mit der Breite y (oder "Freiheitsgrade"???, was auch immer das ist). Die Notation dort ist aber t(x;y) (mit Semikolon!), daher bin ich verwirrt.
- Der - leider unsignierte - Einwand ist bezogen auf die Notation richtig. Erstens sollte eine Notation bei der ersten Verwendung erklärt werden. Zweitens sollte sie im Artikel einheitlich verwendet werden (t(x,y) versus t(x;y)). Drittens sollte sie möglichst mit der Notation im Artikel t-Verteilung übereinstimmen oder es sollte wenigstens die Entsprechung der abweichenden Notationen erklärt werden, wenn diese Einheitlichkeit nicht möglich ist. --Sigma^2 (Diskussion) 10:41, 24. Aug. 2021 (CEST)
- Erster Punkt ist erledigt. Dritter Punkt ist im Sinne des zweiten Halbsatzes erledigt. Der zweite Punkt ist noch schlimmer, da im Artikel neben und auch noch die dritte Notation verwendet wird. Viele Köche ... --Sigma^2 (Diskussion) 11:25, 24. Aug. 2021 (CEST)