Diskussion:Effektstärke
Hallo, mich stören gerade verschiedene Dinge bezüglich Cohens d:
- warum wird in der ersten Einführung D groß geschrieben, was weder Cohen macht noch zumindest in der mir bekannten Literatur üblich ist?
- Ist die Angabe der Formel für die Standardabweichung wirklich notwendig, oder sollte man die nicht als bekannt voraussetzen, ggf. einen Link setzen auf den Eintrag zur Varianz/Standardabweichung. Ja, man müssten noch das i für die Gruppe beachten, aber macht das hier wirklich Sinn?
- Cohen selbst gibt auf S. 67 in seinem Buch die Artikel "anderen Autoren" zugeschriebene Formel für die gepoolte Standardabweichung für den generellen Fall ungleicher Gruppengröße und gleicher oder ungleicher Gruppengrößen an.
- Im englischen Artikel zum effect size wird zu den Quellen auch die Seitenzahl angegeben, was meiner Ansicht nach auch extrem sinnvoll ist. Soll und kann man das im deutschen Artikel auch ergänzen? --LudgerN (Diskussion) 14:57, 10. Nov. 2022 (CET)
Moin, nur damit sich niemand wundert: Ich habe den Artikel, der die ganzen Qualitäts- und Lösch-Hinweise bekommen hat völlig neu geschrieben, siehe Wikipedia:Löschkandidaten/7._Juni_2006#Effektst.C3.A4rke --Thomas Roessing 08:58, 8. Jun 2006 (CEST)
Was echt gut wäre, wäre eine Einbeziehung möglicher Konversionen und ein Eingehen auf nonparametrische Effektstärken. --91.16.177.199 17:20, 14. Okt. 2007 (CEST)
Schön wäre auch eine Quellenangabe zu Cohen (1992)
Ganz hilfreich ist auch die englische Version; das kommt dem näher, was ich als Effektstärke verstehe. --Sigbert 19:07, 3. Dez. 2008 (CET)
- Habe die Seiten Effektstärke und Effektgrösse zusammengeführt sowie aus Cohens Buch und Teile aus dem englischen Wikipediaeintrag zu effect size übernommen und den Überschneidungsbaustein entfernt. --Sigbert 15:42, 5. Jan. 2009 (CET)
Bei Cohens d wird von der Varianz gesprochen Sigma ist jedoch die Standardabweichung...das verwirrt!
- Korrigiert, es musste natürlich sigma^2 heissen. --Sigbert 22:45, 26. Mär. 2009 (CET)
Wünschenswert wäre auch eine Erweiterung zur Berechnung der Konfidenz-Intervalle oder der statischen Signifikanz von Effekt-Stärken, die dabei optimalerweise auch auf non-centrality-parameter, siehe [1] (ncp) eingehen könnte. (nicht signierter Beitrag von Nocebo (Diskussion | Beiträge) 14:18, 19. Aug. 2010 (CEST))
8:11, 13. Mär. 2012 (CET)
Effektstärke im Verhältnis zur Standardabweichung
[Quelltext bearbeiten]Es geht, vor allem in der Einleitung, unter, dass eine Effektstärke immer ins Verhältnis zum Streuungsparameter gesetzt wird, also ein absolut angegebener relevanter Effekt mit einer hohen oder niedrigen Effektstärke einher geht, je nachdem, wie stark er in der Grundgesamtheit variiert und wie genau er gemessen wird. --Johannes Hüsing 17:31, 13. Feb. 2012 (CET)
- die Grenzen für die Effektstärke f² "small" ab 0,02 "medium" ... werden so wie ich das sehe sehr wohl allgemein akzeptiert. Wäre allerdings interessant zu wissen wer da anderer Meinung ist. Könnte da gut was gebrauchen für meine DA. Außer das der werte Kollege sagt "medium is not a message" finde ich aber nichts. Mehr Quellen an der Stelle wären sehr nett. Bin nämlich im Grunde schon auch der meinung, dass meine kleinen moderatoren erwähnenswert sind ;) (nicht signierter Beitrag von 141.13.248.29 (Diskussion | Beiträge) 00:52, 12. Okt. 2009 (CEST))
- Warum beginnt "klein" bei f² nicht bei 0,01 oder bei 0,03 oder bei 0,05? Ich würde gerne mal die statistische oder theoretische Rechtfertigung sehen, warum "klein" gerade bei 0,02 beginnt :) -- Sigbert 11:34, 20. Okt. 2009 (CEST)
- detektierbare Effektstärke ab der ein statischer Unterschied signifikant wird, ist abhängig von Stichprobengröße, sowie alpha und beta Fehler, i.e. wenn man ein einer dieser Stellschrauben dreht, verändern sich alle anderen. Im Falle der detektierbaren Effektstärke gehen geringe Werte mit größerer Stichprobe und/oder höheren Fehlerwahrscheinlichkeit einher. Der kritischen Wert, ab denen ein Effekt als klein bezeichnet wird, ist daher mehr oder minder eine bloße Daumenregel (was sich auch in divergierenden Meinungen der Autoren niederschlägt) und dient nur als Anhaltspunkt für die praktische Bedeutsamkeit eines Effektes.--schrat 23:17, 21. Dez. 2009 (CET)
Online Berechnung von Cohens d
[Quelltext bearbeiten]Der neu eingesetzte Link zu "soerenwallrodt.de" ist meines Erachtens nicht akzeptabel. Ich erhielt mit fiktiven Daten dort die Auswertung "cohens d = 0.52 bzw. r = 0.24. Cohen bezeichnet einen Effekt von d = 0.2 als klein, d = 0.5 als mittleren Effekt und d = 0,8 als großen Effekt. Nach den Konventionen von Cohen liegt ein kleiner Effekt vor". Es ist kein Impressum bzw. Kontaktadresse angegeben, um solch einen Fehler zurückzumelden. Die Seite erscheint als unzuverlässig und unseriös. Dass die Änderung eingefügt wurde, bevor die vorhergehende Änderung gesichtet wurde, und dass überhaupt eine Begründung fehlt, warum der vorher angegebene link ersetzt wurde, passt ins Bild.--Kjalarr 20:42, 8. Okt. 2011 (CEST)
Was will jemand wissen, der hier nachschlägt?
[Quelltext bearbeiten]Bin auf den Begriff gestoßen in einem Bericht über eine medizinische Studie zu meinem Medikament. Da hieß es bei einer Metastudie: "Der Wirksamkeitsnachweis (effect size) war mit 0.9 statistisch signifikant" Da will ich natürlich wissen, ob das gut oder schlecht ist. Und ich denke, der Artikel sollte genau diese Frage mit als erstes beantworten. Nach dem, was ich hier und unter Korrelationskoeffizient grob gelesen habe, dürfte die Effektstärke ein Wert zur Beurteilung der Wirksamkeit sein, der (theoretisch) zwischen -1 und +1 liegen kann.
0 bedeutet: kein Effekt,
negative Werte sozusagen den umgekehrten Effekt ( z.B. für die Teilnehmer einer Studie: den Placebo-Patienten geht es signifikant besser, als den Pat. mit Wirkstoff) Positive Werte.
Nach dem, was (sehr viel weiter unten) im Text steht, gilt 0,5 schon als starker Effekt. (Somit dürfte der genannte Effekt in meiner Studie mit 0,9 geradezu umwerfend deutlich sein)
Ist das richtig, was ich da verstanden habe? Wenn ja, dann finde ich, dass es sich im ersten Absatz finden lassen müsste. (nicht signierter Beitrag von Maddes8cht (Diskussion | Beiträge) 17:57, 29. Nov. 2012 (CET))
- +1 Im Artikel zur PTBS [[2]] lese ich: " Die PTB-Symptome (subjektive und objektive physiologische Entlastung) werden in einer durchschnittlichen Behandlungsdauer von 16 Sitzungen deutlich reduziert (Effektstärken liegen zwischen 1.0 und 2.5)..."
- Hier jedoch lese ich, dass es sich dabei um einen Wert zwischen 0 und 1 handeln soll. Ich bin verwirrt.. Welcher Artikel gehört überarbeitet? 89.204.155.241 16:42, 11. Mär. 2015 (CET)
- Es gibt viele Maße zur Effektstärke. In welchem Bereich sie liegen, und was als groß oder klein gilt, hängt vom Maß ab. Deshalb sind obenstehende Angaben nicht ausreichend. Strasburger (Diskussion) 15:37, 28. Jan. 2016 (CET)
Abschnitt zu Cohens w überarbeitet
[Quelltext bearbeiten]Hallo alle zusammen,
den Abschnitt »Cramers Phi, Cramers V und Cohens w« habe ich vollständig überarbeitet, weil in der vorherigen Fassung zum einen gar nicht deutlich geworden ist, dass es bei der Berechnung von Cohens um Wahrscheinlichkeiten, nicht umd abslute Häufigkeiten, geht und zum anderen eine eher nebensächliche abgeleitete Formel zur Definitionsformel von Cohens erklärt worden ist. So ist es jwdenfalls richtiger und klarer, denke ich. Allerdings fehlt immer noch ein Beleg für die angegeben konventionellen Grenzen für eine »schwache«, »mittlere« und »starke« Ausprägung von Cohens . Grüße --Jake2042 (Diskussion) 01:53, 5. Aug. 2013 (CEST)
- Letzteres habe ich jetzt auch erledigt. Die Quelle ist die Tabelle 5.12 auf Seite 167 oben rechts in Jürgen Bortz, (6)2005: Statistik für Human- und Sozialwissenschaftler. Heidelberg: Springer Grüße --Jake2042 (Diskussion) 04:07, 6. Aug. 2013 (CEST)
.
Irreführendes zur Interpretation
[Quelltext bearbeiten]Einleitung: "Ein Effekt (oder auch Wirkung) liegt vor, wenn in einem (zugehörigen) statistischen Test die Nullhypothese (=kein Effekt) abgelehnt wird."
Hier wird das Testen anhand von Stichprobendaten mit der Größe von Effekten verschwurbelt. Effekte können aber unabhängig vom Ergebnis der Signifikanztests vorliegen. Bei mangelnder statistischer Trennschärfe werden sie nur vielleicht nicht nachgewiesen. Und bei kleinen Stichproben kann es sogar sein, dass Mittelwertunterschiede, Korrelationskoeffzienten etc. größer sein müssen als sie es tatsächlich (in der Grundgesamtheit) sind.
"Die Effektstärke gibt dann Auskunft über die Größe des Effekts."
Das impliziert, dass man nach einem "signifikanten" Ergebnis das Stichproben-Effektstärkemaß 1:1 als tatsächliche Effektstärke interpretieren darf, ohne den Stichprobenfehler in Betracht ziehen zu müssen.
"Cohens d[1] ist die Effektgröße für Mittelwertunterschiede zwischen zwei Gruppen mit gleichen Gruppengrößen n sowie gleichen Gruppenvarianzen \sigma^2 und hilft bei der Beurteilung der praktischen Relevanz eines signifikanten Mittelwertunterschieds (siehe auch t-Test)"
Erneut die Implikation eines zweistufigen Verfahrens, demzufolge nach einem "signifikanten" t-Test das Stichproben-d ustandslos als größe des "Effekts" interpretiert werden darf. Bei kleinen Stichproben führt dies aber zwangsläufig zu einer massiven Überschätzung von "Effekten" (die in der Grundgesamtheit meist klein bis mittel sein dürften). (nicht signierter Beitrag von Kjalarr (Diskussion | Beiträge) 23:05, 31. Jan. 2014 (CET))
Kleine Änderung
[Quelltext bearbeiten]Moin! ich würde "ihr Wert sollte nahe bei Null liegen, wenn die Nullhypothese des zugehörigen Tests nicht abgelehnt werden konnte." zu "ihr Wert sollte nahe bei Null liegen, wenn die Nullhypothese des zugehörigen Tests nicht abgelehnt wurde." ändern. Die alte Version suggeriert, dass das Ablehnen der Nullhypothese erstrebenswert ist. (nicht signierter Beitrag von 88.152.110.210 (Diskussion) 22:39, 15. Feb. 2016 (CET))
Beispiel
[Quelltext bearbeiten]Für denjenigen, der mit Statistik nicht so gut vertraut ist, wird es etwas schwierig, die Erklärungen hier nachzuvollziehen. In dem Beispiel verwirrt die Tatsache, dass zweimal ein Wert von 0,1 genannt ist, ohne dabei zu erklären, wie das berechnet wurde - also Standardabweichung, Mittelwert oder ähnliches. Somit wird nicht klar, worin der Unterschied besteht. Erst wesentlich später wird im Text erwähnt, dass nach Cohen r = 0,1 einen kleinen Effekt darstellt. Dazwischen stehen langatmige Ausführungen zum p-Wert (ist eine Maßzahl für die Wahrscheinlichkeit ! ), die nicht zum weiteren Verständnis beitragen. Und nochmal: das Thema heißt Effektstärke ! --House1630 (Diskussion) 09:39, 4. Okt. 2016 (CEST)
Kleiner, mittlerer, starker Effekt
[Quelltext bearbeiten]Nach Cohen indiziert einen kleinen Effekt, einen mittleren und einen starken Effekt.
Ich habe das entsprechende Paper nicht vorliegen – gibt Cohen irgendeine Begründung für diese Zahlen oder sind die einfach willkürlich festgelegt? Ich könnte aus dem Bauch heraus nicht einmal sagen, was ich intuitiv unter einem „kleinen“, „mittleren“ oder „starken“ Effekt verstehen würde. --78.50.195.166 14:02, 22. Sep. 2018 (CEST)
Nicht-normierte Effektstärken
[Quelltext bearbeiten]Was mir in diesem Beitrag vor allem völlig fehlt, ist eine Besprechung oder zumindest Erwähnung von Effektstärken, die nicht auf die Varianz normiert sind. Wenn man z.B. wissen will, wie stark der Effekt von Kaffeetrinken auf 100-Meterläufer ist, misst man die Effektgröße sinnvollerweise in Millisekunden, die die Läufer schneller wurden, nicht mit Cohens d. Wenn man wissen will, wie groß der gesundheitsgefährdende Effekt von sogenanntem roten Fleisch ist, könnte man die Anzahl pro Hunderttausend der durch Verzehren von rotem Fleisch krebserkrankten Menschen heranziehen, und die nicht durch irgendeine Streuung teilen.
Man lese z.B. diesen Artikel dazu.
Mir ist bewusst, dass nach Cohen die Effektstärke eine dimensionslose Zahl sein sollte, und wenn man Effektstärken mit unterschiedlichen Dimensionen vergleichen möchte (etwa in einer Metaanalyse), ist das auch nötig. In anderen Bereichen, etwa der Psychophysik, der Biologie, der Physik, leuchtet mir das nicht ein.
Strasburger (Diskussion) 20:42, 4. Mai 2020 (CEST)
Grundlagen
[Quelltext bearbeiten]"Effektstärke (auch Effektgröße) bezeichnet die Größe eines statistischen Effekts." Hat dieser Satz irgendeinen Sinn? Was ist ein "statistischer Effekt"? Ein realer Effekt? Ein Effekt, der nur durch statistische Manipulationen von Daten erzielt wurde, also ein statistisches Artefakt? Ein Effekt der Statistik? So kann man doch einen Enzyklopädie-Artikel nur dann beginnen, wenn klar ist, was ein statistischer Effekt ist. Sucht man in der Wikipedia nach statistischer Effekt so findet man nichts als wieder diesen Artikel. --Sigma^2 (Diskussion) 00:17, 19. Sep. 2021 (CEST)