Diskussion:Lineare Einfachregression

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 1 Jahr von 2003:E5:2725:9B00:D8A3:3AB1:362E:6955 in Abschnitt Bestimmtheitsmaß
Zur Navigation springen Zur Suche springen

Störgrößenvarianz

[Quelltext bearbeiten]

@Rainald62: Ja Störgrößenvarianz hat in der Tat wenig Treffer, das liegt aber daran, dass oft stattdessen der Begriff "Varianz der Störgrößen" benutzt wird. Kann man meinetwegen dahingehend ändern. Den Begriff "Störgrößen" habe ich gewählt, da es so konsistent mit dem Artikel Störgröße und Residuum ist. Diese Varianz wird auch Fehlervarianz, auch Restvarianz, Versuchsfehler, Störgrößenvarianz, Varianz der Störgrößen, nicht erklärte Varianz, oder unerklärte Varianz genannt; wobei Fehlervarianz nicht ganz geeignet ist, da "Fehler" nicht eindeutig ist (allerdings ist das die akkurate Übersetzung von "error variance" und häufigste Bezeichnung [1]). Residualvarianz ist ebenso nicht ganz geeignet, da öfters auch die erwartungstreue Schätzung so genannt wird und "Restvarianz" kommt sehr selten vor. Streubreite ist mE einfach Synonym zu Standardabweichung und daher vollkommen ungeeignet, da so nicht zum Ausdruck gebracht worauf sich sie bezieht und auch falsch, da es sich hier um die Varianz handelt.--Jonski (Diskussion) 23:23, 2. Apr. 2019 (CEST)Beantworten

"Streubreite synonym zu Standardabweichung" – ja, aus genau diesem Grund ist dieses Wort geeignet. Du hast recht, dass "nicht zum Ausdruck gebracht [wird] worauf sich sie bezieht", aber das lässt sich heilen: "Streubreite um die Gerade" oder auch "Streubreite um die Gerade (Standardabweichung der Residuen)."
"da es sich hier um die Varianz handelt", ist kein valides Argument, denn die Wurzel von "es" ist an_schau_licher. Bitte an die Leser denken.--Rainald62 (Diskussion) 00:25, 3. Apr. 2019 (CEST)Beantworten
Ja du hast bzgl. einiger Punkte im Artikel Recht, die kann man allgemeinverständlicher formulieren (fällt mir manchmal schwer). Aber ich denke wir sollten hier schon die Begriffe verwenden, die in der Literatur am häufigsten anzutreffen sind und das sind nun mal die Begriffe "Varianz der Störgrößen", "Fehlervarianz" oder "Varianz der Fehlerterme". Alles andere würde WP:KTF widersprechen.--Jonski (Diskussion) 00:29, 3. Apr. 2019 (CEST)Beantworten
TF? Au weia! "Standardabweichung der Residuen" hat über 1000 Buchtreffer im Vgl. zu weniger als 100 für deine "Varianz der Störgrößen". "Varianz" ist ungeeignet für die Einleitung eines Artikels mit vielen Lesern omA, darf aber gerne im Hauptteil vorkommen, schon weil damit die Formeln einfacher aussehen.
"Fehler" ist dagegen keine Geschmacksfrage, sondern inhaltlich falsch (und nicht normgerecht seit 1983).
"Störgröße" ist ebenfalls oft unzutreffend, denn Quantenrauschen ist keine Größe im physikalischen Sinn: Wenn Du einen Strom von 50 Photoelektronen pro Sekunde misst, blockweise im Sekundentakt, und keine Störgrößen im Spiel sind, dann wirst Du eine Standardabweichung von 10/s erhalten. --Rainald62 (Diskussion) 01:02, 3. Apr. 2019 (CEST)Beantworten
Bezüglich Quantenrauschen kenne ich mich nicht aus. Ich kenne mich aber mit der statistischen Terminologie aus und dort wird am häufigsten Störgröße oder Fehlerterm verwendet. Standardabweichung der Residuen ist aber nicht zutreffend. Damit ist häufig der Standardfehler der Regression, oder die verzerrte Variante gemeint. Nebenbei: Wo kann genau nachlesen, dass Fehler seit 1983 nicht mehr normgerecht ist?--Jonski (Diskussion) 01:07, 3. Apr. 2019 (CEST)Beantworten
Vergleiche die Ausgaben der DIN 1319-3 von Januar 1972 und August 1983. --Rainald62 (Diskussion) 20:57, 4. Apr. 2019 (CEST)Beantworten
Als Standardfehler der Residuen bezeichnet man i.A. diese Größe hier .--Jonski (Diskussion) 01:18, 3. Apr. 2019 (CEST)Beantworten
Damit daraus ein Argument wird, müsstest Du begründen, was diese Größe ungeeignet für die Einleitung des Artikels macht. Der Grund sollte überzeugender sein als der Faktor ~20 zwischen den oben angeführten Trefferzahlen. --Rainald62 (Diskussion) 20:57, 4. Apr. 2019 (CEST)Beantworten

Regressionsdiagnostik

[Quelltext bearbeiten]

Wieso wird die Regressionsdiagnostik hier im Artikel so breit dargelegt? Dies ist ja nicht nur ein Fall der Einfachregression. Ich schlage vor ein neues Lemma Regressionsdiagnostik anzulegen und den Abschnitt auszulagern.--Jonski (Diskussion) 19:42, 22. Mai 2019 (CEST)Beantworten

Bestimmtheitsmaß

[Quelltext bearbeiten]

Es ist üblich, dass in einer Formel verwendete Größen - hier SQR und SQT - in direkten Zusammenhang mit der Formel erklärt werden. Hier erfolgt es erst im Zusammenhang mit dem Beispiel. Dies gilt auch x-Dach und x-Querstrich. In der Summe ist der Artikel zu sehr verkünstelt. --2003:E5:2725:9B00:D8A3:3AB1:362E:6955 22:22, 11. Aug. 2023 (CEST)Beantworten