Diskussion:Regressionsanalyse
zum Abschnitt GESCHICHTE "Galton sprach 1877 noch nicht von Regression, sondern von Reversion" (Zitat Steyer (2003): "Wahrscheinlichkeit und Regression") (nicht signierter Beitrag von 141.35.142.11 (Diskussion) 17:15, 22. Mai 2012 (CEST))
Füge neue Diskussionsthemen unten an:
Klicke auf , um ein neues Diskussionsthema zu beginnen.Archiv |
Wie wird ein Archiv angelegt? |
Kritik
[Quelltext bearbeiten]Ein ganz mieser Artikel. Kann den mal ein Mathematiker überarbeiten? Ich wollte was wissen über Regression; es scheint aber so zu sein, daß sich hier hauptsächlich Unwissende austoben: "Im eindimensionalen Fall spricht man von einer einfachen linearen Regressionsanalyse, in Dimensionen größer gleich zwei von einer multiplen Regressionsanalyse." Dimension = Anzahl der Variablen, das berührt nicht die Frage, ob ein Problem einer linearen (oder bei echten Problem i.d.R.) einer nichtlinearen Dynamik folgt. Leider ist mein Wissen nicht ausreichend, um den Artikel zu überarbeiten, es sollte aber nicht schon in den ersten Zeilen grober Unfug stehen... (nicht signierter Beitrag von 85.181.147.34 (Diskussion | Beiträge) 13:12, 15. Nov. 2009 (CET))
eigener Text JBO 2003
[Quelltext bearbeiten]warum wurde
- +
-
zwischen erstem und zweitem Absatz gelöscht? Juergen Bode 18:05, 9. Mär 2004 (CET)
Zwischenparken des alten Inhalts von Regressionsanalyse
[Quelltext bearbeiten]Regressionsanalysen sind Techniken, mit denen für eine Gleichung y = f(x) die Parameter so angeglichen werden, dass minimale Abweichungen zwischen experimentellen und kalkulierten Werten entstehen. Für diesen Fall wird die gewichtete Summe der Fehlerquadrate (SSQ oder chi-Quadrat genannt) minimiert. Zur Wichtung dient die Varianz (sigma) des Datenpunktes; je größer diese ausfällt, desto weniger trägt der betreffende Punkt zur Analyse bei. Mit dem Aufkommen leistungsfähiger Rechner gewinnt insbesondere die nichtlineare Regression an Bedeutung, die im Mittelpunkt dieses Artikels steht.
Die Regressionsanalyse ist eine sehr leistungsfähige Methode zur Datenanalyse. Am Beispiel der Enzymkinetik, setzt sie allerdings voraus, dass nur y (Reaktionsgeschwindigkeit) und nicht x (Substratkonzentration) einem Fehler unterliegt. Die Regressionsanalyse stellt generell hohe Anforderungen an die zugrundeliegende Datenbasis. Dazu zählen u.a.:
- Voneinander unabhängige Zufallseinflüsse (Unkorreliertheit)
- Gleichförmige Streuung (Homoskedastizität)
- Keine Strukturbrüche
- Für Zeitreihenanalysen muß außerdem eine eindeutige Zuordnung von Sachverhalten zu Zeitpunkten gegeben sein (nicht signierter Beitrag von Philipendula (Diskussion | Beiträge) 00:20, 29. Aug. 2004 (CEST))
Lineare Regression
[Quelltext bearbeiten]Lineare Regression lässt sich nur auf lineare oder linearisierbare Funktionen anwenden. Um bei der Enzymkinetik zu bleiben: die vertraute Lineweaver-Burk-Beziehung ist zwar eine algebraisch korrekte Umformung der Michaelis-Menten-Gleichung v = Vmax x [S] / (Km + [S]), ihre Anwendung liefert aber nur korrekte Ergebnisse, wenn die Messwerte fehlerfrei sind. Dies ergibt sich aus der Tatsache, dass sich die Realität nur mit einer erweiterten Michaelis-Menten-Beziehung
mit ei als Fehlerparameter, beschreiben lässt. Diese Gleichung lässt sich nicht mehr linearisieren, woraus sich die Forderung nach nichtlinearer Regressionsanalyse ergibt. (nicht signierter Beitrag von Philipendula (Diskussion | Beiträge) 00:20, 29. Aug. 2004 (CEST))
Nichtlineare Regression
[Quelltext bearbeiten]Nichtlineare Regression ermöglicht die Anpassung von Daten an jede Gleichung der Form y = f(x). Da diese Gleichungen Kurven definieren, werden die Begriffe nichtlineare Regression und "curve fitting" zumeist synonym gebraucht. Bei nichtlinearen Gesetzmäßigkeiten ergibt sich eine Komplikation dadurch, dass die zu optimierenden Parameter nicht direkt ermittelt werden können: alle Kalkulationen gehen zwangsläufig von Schätzwerten aus, so dass jede nichtlineare Regressionsanalyse ein iteratives Verfahren darstellt. Ob diese Schätzwerte vernünftig waren, zeigt sich im nachhinein dadurch, dass verschiedene Anfangsschätzungen zum gleichen Endergebnis führen.
Das Verfahren geht ursprünglich auf Gauß zurück. Aktuelle Programme arbeiten häufig mit dem Algorithmus nach Marquart, der sich bei größerer Abweichung der Schätzwerte als toleranter erweist.
Standardanalysen setzen normalerweise voraus, dass Fehler einer Normalverteilung folgen. Ausreißer lassen sich allerdings aufgrund eines Algorithmus nach Mosteller und Tukey (1977) unterdrücken. Dies wird durch Anwendung eines weiteren Wichtungsfaktors (1 für Punkte geringer Abweichung, 0 für extreme Ausreißer) erreicht und als "bisquare weighting" bezeichnet. (nicht signierter Beitrag von Philipendula (Diskussion | Beiträge) 00:20, 29. Aug. 2004 (CEST))
Siehe auch
[Quelltext bearbeiten]Konfidenzintervall, Bestimmtheitsmaß, Korrelationskoeffizient, Signifikanztest (nicht signierter Beitrag von Philipendula (Diskussion | Beiträge) 00:20, 29. Aug. 2004 (CEST))
Weblinks
[Quelltext bearbeiten]Kategorie:Statistik (nicht signierter Beitrag von Philipendula (Diskussion | Beiträge) 00:20, 29. Aug. 2004 (CEST))
gehört das hierher?
[Quelltext bearbeiten]und ist damit ein wichtiges Werkzeug der Systemidentifikation (nicht signierter Beitrag von Chrisqwq (Diskussion | Beiträge) 20:56, 12. Jul. 2006 (CEST))
Exakt
[Quelltext bearbeiten]"Ein lineares Regressionsmodell hat den Vorteil, dass es exakt berechnet werden kann," ????Kann man das Modell exakt berechnen??Nijdam 23:39, 12. Jul 2006 (CEST)
Weitere Arbeit an dem Artikel
[Quelltext bearbeiten]Hallo, vielleicht sollte wir uns mal darüber Gedanken machen, wie der Artikel in Zukunft aussehen soll.
Den Abschnitt Deskriptive und wahrscheinlichkeitstheoretische Regression sollte man meiner Meinung nach entfernen bzw. in verkürzter Version in die Einleitung miteinbauen, da er wie er jetzt geschrieben ist nur verwirrt.
Schätzung und dergleichen habe ich in den Abschnitt multiple Regression eingebaut, da man von der einfachen Linearen Regression leicht auf die multiple Verallgemeinern kann, dort aber noch anmerken, dass man mit n=1 von der multiplen auf die einfache Regression kommt. Allerdings ist es für die Verständlichkeit auch denkbar, dass man bereits einen Unterabschnitt zur Schätzung und zum Testen einbaut. Dann könnte man im Gegenzug sicherlich auch wieder Schätzung und Testen bei der multiplen Regression kürzen.
Das Beispiel im Abschnitt multiple Regression sollte noch genauer und verständlicher erklärt werden. Ich habe mir hier auch vorgestellt, dass man ein wenig R code angeben könnte, dann erfährt man als Leser auch, wie man sein Modell in einer Statistik-Software umsetzen kann. An diesem Beispiel bin ich derzeit jedoch eh am arbeiten.
Des Weiteren sollte man vielleicht auch 4 Einfaches lineares Regressionsmodell mit Beispiel einer Preis-Absatz-Funktion in den Abschnitt 2 Einfache Lineare Regression miteinbauen. Allerdings müssen dann die theoretischen Werkzeuge, die man benötigt, um das Beispiel zu verstehen auch in diesem Abschnitt ausgearbeitet werden. Nach meinen obigen Ausführungen ist dies jedoch aufjedenfall denkbar.
Vielleicht sollte man auch erstmal den Abschnitt Spezielle Anwendungen der Regressionsanalyse auch erstmal wieder entfernen oder auskommentieren, wann da nämlich alle Links rot sind, dann ist der Abschnitt wohl auch fast wenig hilfreich?
Gruß --Pi666 20:00, 28. Aug 2006 (CEST)
Grundidee
[Quelltext bearbeiten]Zur Zeit wird die Sache mit Störgröße und Residuum hier nur unter der linearen Einfachregression erklärt, wobei sie für die Multiple Regression genau so wichtig ist. Deshalb würde ich sie gerne am Anfang unter "Grundidee" behandeln. Anderes Thema: Der von mir geschaffene Artikel Störgröße und Residuum enthält dazu nun einige Redundanzen. --Chrisqwq 10:48, 1. Okt 2006 (CEST)
Aulagerung
[Quelltext bearbeiten]Auf Grund der Besonderheiten der Multiplen Regression und der vereinfachten Linearen Einfachregression halte ich es für ziemlich sinnvoll eingenständige Artikel daraus zu machen, und den Artikel Regressionsanalyse als Überblicksartikel zu lassen. Auch der Umfang sprengte den Rahmen. --Chrisqwq 17:57, 24. Nov. 2006 (CET)
Response nicht eingeführt
[Quelltext bearbeiten]Im Text taucht der Begriff "Response" unverlinkt und damit unerklärt auf. Erst später gibt es einen Link, dort landet man aber auf einer Seite zu einem anderen Thema, wo man aus dem Text nur schliessen kann, was einen "Response" ist. Ich würde es ändern, wenn ich was davon verstünde :-) --Steinbeck 22:17, 5. Dez. 2006 (CET)
Was zum Teufel ist eine KOVARIABLE?
[Quelltext bearbeiten]Was sind Kovariablen? Synonym mit Störvariable? oder sind das Moderator/Mediator-variablen? Kann man Kovariablen nur durch statistisches Rausrechnen kontrollieren? (nicht signierter Beitrag von 141.30.206.172 (Diskussion | Beiträge) 13:12, 31. Jul. 2007 (CEST))
Regression
[Quelltext bearbeiten]Und was ist nun Regression? Das ist wird mir aus dem Artikel irgendwie nicht klar. Sollte IMHO ganz oben stehen. (nicht signierter Beitrag von 89.245.118.78 (Diskussion | Beiträge) 20:26, 10. Dez. 2007 (CET))
Fehler im Beispiel der linearen Regression
[Quelltext bearbeiten]Die Beispielformel lautet hier
Berechnet wird allerdings nachher
(nicht signierter Beitrag von Dotxp (Diskussion | Beiträge) 10:26, 25. Sep. 2008 (CEST))
Ursprungsgerade
[Quelltext bearbeiten]Als Beispiel für einen einfachen funktionalen Zusammenhang wurde die Ursprungsgerade genannt. Diese ist in der Regression aber ein schlechtes (irreführendes) Beispiel. Das hieße ja, dass man von vornherein beta_0 = 0 setzt, und nur noch die Steigung anzupassen hätte, eine eher anwendungsfremde Situation. Daher habe ich Ursprungsgerade durch Gerade ersetzt.--FerdiBf 14:32, 30. Jan. 2009 (CET)
Was ist der unterschied zwischen schrittweiser und hierarchischer Regression?
[Quelltext bearbeiten]Dieser Google-Treffer legt nahe, das es das selbe ist, allerdings wird hier die hierarchische Vorgehensweise offenbar als Untertyp dargestellt. Der engl. Wikipediaartikel hilft mir da auch nicht weiter. --source 09:58, 20. Mai 2009 (CEST)
Vorschläge zur weiteren Bearbeitung
[Quelltext bearbeiten]Ich finde der Artikel würde an Qualität gewinnen, wenn jemand noch etwas zu einzelnen Verfahren hinzufügt, Hinweise auf Software gibt und Beispiele einfügt. -- KW 19:35, 10. Mär. 2010 (CET)
Literatur
[Quelltext bearbeiten]Bei der Literatur handelt es sich fast ausschließlich um allgemeine Einführungen in multivariate Verfahren etc - was nicht weiter schlecht ist. Allerdings sollten dann die betreffenden Kapitel und Seitenzahlen angegeben werden. --Zulu55 17:04, 19. Okt. 2010 (CEST)
Statistik
[Quelltext bearbeiten]Im Artikel heiist es Regression sei ein statistisch Verfahren. Jedoch erweisst sich dies kaum im Artikel. Es wird von Variablen gesprochen, sogar unabhaengige, aber nirgens von Zufallvariablen, was man doch erwarten wuerde, Nijdam 16:23, 6. Feb. 2011 (CET)
Regressionsanalyse vs. Regressionstest
[Quelltext bearbeiten]Die Begriffe klingen ähnlich und meinen doch Verschiedenes. M.E. besteht Verwechslungsgefahr, zumal Regressionsanalysen oft mit Testergebnissen durchgeführt werden. Daher mein Ergänzungsvorschlag, der leider revertiert wurde. Macht damit was Ihr wollt, für Formaldiskussionen und Haarspaltereien ist mir die Zeit zu schade. --Anti ad utrumque paratus 12:41, 14. Apr. 2014 (CEST)
Modell vs. (Schätz-)Verfahren
[Quelltext bearbeiten]mE sollte in den Überschriften in Kap 5 jeweils statt "Verfahren" "Modell" stehen. Bei Verfahren denkt man wohl schnell an Schätzverfahren, wie etwa die Methode der Kleinsten Quadrate (OLS) oder das Maximum-Likelihood-Verfahren. Schätzverfahren dort anzusprechen (wie es teilweise auch geschieht) finde ich kein Problem, aber was dort hauptsächlch beschrieben wird, sind Modelle und keine Schätzverfahren. (nicht signierter Beitrag von 2A02:8070:7C5:DF00:B118:867F:AF5A:7A88 (Diskussion | Beiträge) 22:34, 20. Aug. 2014 (CEST))
Fehler
[Quelltext bearbeiten]Meines Erachtens gibt es bei der mathem. Formulierung einen Fehler: "Hierbei bezeichnet f die gesuchte oder angenommene Funktion und e den Fehler bzw. das Residuum des Modells". Mann muss aber beachten, dass Fehler und Residuen nicht das selbe sind. In der englischen Wikipedia heißt es: "errors and residuals are two closely related and easily confused measures of the deviation of an observed value..." Residuen sind die geschätzen Fehler und nicht mit den wahren Fehlern zu verwechseln. --JonskiC (Diskussion) 03:23, 5. Okt. 2016 (CEST)
Verständlichkeit
[Quelltext bearbeiten]Dieser Artikel ist (für Nicht-Statistiker) unverständlich. Nicht mal die Einleitung ist verständlich. Ein Kapitel mit erklärten Alltagsbeispielen wäre ein hilfreicher Anfang zur besseren Verständlichkeit. Gruss, --Markus (Diskussion) 14:42, 28. Jun. 2024 (CEST)
Einleitung
[Quelltext bearbeiten]Die einleitung ist viel zu lang und erklärt dennoch nicht das Lemma... Gruss, --Markus (Diskussion) 14:42, 28. Jun. 2024 (CEST)