Diskussion:Methode der kleinsten Quadrate/Archiv/2011

Overkill

Letzter Kommentar: vor 13 Jahren14 Kommentare5 Personen sind an der Diskussion beteiligt

Dieser Artikel ist zwar enzyklopädisch und wurde mal als lesenswert erachtet (finde ich nicht), aber für Normalsterbliche unverständlich, vgl. hier. --Der Faltenwolf 23:32, 13. Jan. 2011 (CET)

Als Overkill würde ich das nicht bezeichnen. Die Wikipedia hat sich als sehr tiefgehendes Mathematiklexikon entwickelt und diesem Trend sollte man nicht entgegenwirken, stattdessen einfache Spezialfälle und mathematische allgemeine Fälle gut sichtbar trennen. So wie man in der Speisekarte deutlich zwischen Kinderprtionen und mehrgängigen Schlemmermenüs wählen kann, sollte der Überschriftenbaum klar erkennen lassen, welcher Abschnitt die passende Information enthält.

Mein erster Verbesserungsvorlschlag wäre zuerst mal die Variablen wieder umzubennen, so wie es schon mal war, nämlich t

\rightarrow

x und x

\rightarrow

c,

\alpha

oder

\beta

. Es ist einfach gängige Konvention, dass x eine Ordinate bezeichnet und Koeffizienten mit etwas griechischem oder mit c (von coefficient) bezeichnet werden. Das würde Neueinsteigern schon mal helfen. Als einziger Grund für diese seltsame Namensgebung wird oben (im Jahr 2004) genannt, dass man dann Ax=b schreiben könne und so die Unbekannte x leichter erkennt. Was allerdings mit dieser Gleichung gemeint ist, verstehen eh nur Fortgeschrittene und die verstehen z.B. auch, dass in Ac=b das c die Unbekannte ist. --Chris☂ 23:39, 14. Jan. 2011 (CET)

Volles Kontra zum letzten Absatz. So wird es in meinen Augen deutlich weniger verständlich. Der Nichtfachmann hat schon mal was von der Unbekannten x gehört, c kennt er aber am ehesten noch aus E=m*c², und das passt ja nun gar nicht. Nein, da laufen die Herren Mathematiker anscheinend mit ein paar Scheuklappen durch die Gegend, und dabei fallen die Nichtmathematiker hoffnungslos hinten runter. Siehe parallel dazu auch die aktuelle Diskussion in WP:Auskunft#Mathematische Artikel sind zu schwierig. --PeterFrankfurt 03:34, 15. Jan. 2011 (CET)

Verstehst du denn mein Argument nicht? x hat sowohl die Bedeutung einer Unbekannten Größe, als auch die Bedeutung der x-Achse. Da y als y-Achse im Spiel ist, müsste x als x-Achse auftauchen. Das kennt doch jeder so aus der Schule von den Koordinatenachsen der Schaubilder von typischen Funktionen y(x). Ich sehe schon, dass es einen Konflikt gibt und man sich für eine der beiden Bedeutungen entscheiden muss. Aber ich habe gut argumentiert, warum die Bedeutung einer x-Achse den wesentlich besseren Kompromiss darstellen würde. Das x taucht im Artikel nur in Herleitungen auf, die den reinen Anwender nicht notwendigerweise zu interessieren braucht. Der Koeffizient wird im Lehrbuch Schwarz-Köckler übrigens mit

\alpha

bezeichnet, womit ich voll einverstanden wäre. --Chris☂ 13:20, 15. Jan. 2011 (CET)

In der Tat verstehe ich das Argument nicht: Wo in aller Welt soll in der Matrixgleichung Ax=b eine x-Achse sich zur Verwechslung anbieten? Keine in Sicht. Ob man die Koeffizienten in der Matrix mit aij (einfach, lateinische Schrift) oder αij (komplizierter, griechischer Font) schreibt, macht keinen großen Unterschied aus, da kann man ohne sachliche Probleme die einfachere Variante wählen. --PeterFrankfurt 01:11, 16. Jan. 2011 (CET)

Drücke ich mich so unklar aus? x kann nur eine Sache im Artikel bezeichen. Wenn x anstatt t zur Bezeichnung der Koordinaten der Messdaten und der Ausgleichsfunktion verwendet werden würde, dann muss selbstverständlich aus allen derzeitigen x ein

\alpha

(oder sonstwas) werden. Das sähe dann z.B. so aus:

Modellfunktion:

y(x)=f(x;\alpha _{1},\dots ,\alpha _{m})

Minimierungsforderung:

\min _{\alpha }\|A\alpha -b\|_{2}

Das hätte zwar den Nachteil, dass hier

\alpha

die Unbekannte ist (was vieleicht unüblicher ist, wie du richtig festgestellt hast), aber den noch größeren Vorteil, dass die Modellfunktion mit y(x) bezeichnet werden könnte, was viel wichtiger wäre, weil Schüler x als x-Achse kennen. Comprende? --Chris☂ 10:45, 16. Jan. 2011 (CET)

Ich werde das demnächst mal umbenennen, sobald ich neue Grafiken erzeugt habe, dabei gleich im svg-Format. Das

\min _{\alpha }\|Ax-b\|_{2}

kann man eh zum Teil rauswerfen, da die ganze Erklärung eh nur heiße Luft ist. Die eigentlichen Knackpunkte fehlen. Es heißt z.B. "Der kleinste-Quadrate-Ansatz führt dann auf ein lineares Ausgleichsproblem der Form", aber warum, wird nicht erklärt. Wäre ja schon mal erwähnenswert warum da kein Quadrat in der Formel ist, obwohl es doch kleinste Quadrate heißt. Später unter "Lösung des Minimierungsproblems" heißt es dann: "Die partiellen Ableitungen [...] ergeben dann ein lineares Gleichungssystem". Ja und wie? Und warum? Das wäre eigentlich das zentrale Problem der Lösung des Minimierungsproblems. Der Abschnitt ist doch nur blabla, mal übertrieben gesagt. Mit tollen Begriffen wie "Rang" usw. wird dagegen nicht gespart. Die vollständige Lösung des Minimierungsproblems, sogar des allgemeinenen linearen Falls, ist aber inzwischen oben gezeigt. Ich verstehe auch nicht ganz was überhaupt dieses überbestimmte Gleichungssystem soll, das normalerweise gar keine Lösung hat. Hier fehlt die Erwähnung der Residuen als Korrekturgrößen, deren Quadratesumme dann minimiert wird.--Chris☂ 07:33, 17. Jan. 2011 (CET)

Overkill ist z.B. das, was im Abschnitt zur einfachen Ausgleichsgerade steht, hier heißt es:

... Man erhält in Matrixschreibweise

\min _{x_{0},x_{1}}\left\|{\begin{pmatrix}1&t_{1}\\\vdots &\vdots \\1&t_{n}\end{pmatrix}}{\begin{pmatrix}x_{0}\\x_{1}\end{pmatrix}}-{\begin{pmatrix}y_{1}\\\vdots \\y_{n}\end{pmatrix}}\right\|_{2}=\min _{x}\|Ax-b\|_{2}.

Das ist didaktisch völlig überflüssig und unverständlich. Der totale Kinderschreck. Der Schüler oder Nebenfach-Student, der einfach nur nachschauen möchte, wie man eine Ausgleichsgerade ausrechnet – ich würde mal behaupten, dass sind 95% der Leser des Artikels – wird hier ersmal mit einer Matrix konfrontiert. Wozu? --Chris☂ 13:37, 15. Jan. 2011 (CET)

Also mal was Grundsätzliches zur Einleitung: Könnte man nicht ein einfacheres Beispiel nehmen, z.B. wiederholte Messung des Körpergewichtes zum Ausgleich der Messungenauigkeit einer Waage? Und wenn man schon eine Regressionsbeispiel nimmt, warum nicht eine lineare Regression statt einer Anpassung an eine logistischen Funktion? --Sigbert 17:21, 15. Jan. 2011 (CET)

Ich vermute (ich war's nicht), dass da das Risiko gesehen wurde, dass der Eindruck aufkommen könnte, das könne man nur auf rein lineare Probleme anwenden. Es ist aber in viel allgemeinerer Form anwendbar, weshalb dann früh so ein nichtlineares Beispiel angeführt wird. --PeterFrankfurt 01:14, 16. Jan. 2011 (CET)

Ich habe die Matrix entfernt. --Chris☂ 13:19, 16. Jan. 2011 (CET)

Hmm, hast Du Dir eigentlich schon mal die Mühe gemacht, die Diskussionen oben mal durchzugehen? Siehe z. B. bei #Zu kompliziert oder bei diversen Abschnitten über die Einleitung. Es ist wahrlich nicht so, dass Du der erste auf der Welt bist, der alles anders machen möchte... --PeterFrankfurt 02:07, 18. Jan. 2011 (CET)

Insbesondere, da der Hauptautor noch für zwei Monate in Übersee ist und möglicherweise im Augenblick nicht auf die Einwände reagieren kann. --Erzbischof 07:15, 18. Jan. 2011 (CET)

Zugegeben, diesen Abschnitt habe ich bisher nicht gelesen. Aber ich finde dort auch keine Antwort auf deine dort angesprochenen Mängel bezüglich der Formeln, die vom Himmel fallen. Jetzt ist das Problem jedenfalls gelöst.

Beweise oder Herleitungen können vor allem dann hilfreich sein, wenn man eine Gleichung nicht versteht, oder ein Detail nicht versteht. Aber der Text sollte so geschrieben sein, das die Herleitung erstmal keine Voraussetzung dafür ist, ihn zu verstehen. Eine Herleitung sollte eine Zusatzinformation sein für Interessierte. Der Abschnitt "Lösung des Minimierungsproblems" ist nichts Halbes und nichts Ganzes und sollte irgendwie vervollständigt oder mit der Herleitung des allgemeinene Falls vereinigt oder gekürzt werden. In den meisten Lehrbüchern werden zumindest die Residuen als Korrekturgröße eingeführt und im Fehlerquadrat minimiert. Ohne das kann ich mir beim besten Willen nicht vorstellen, dass das so jemand versteht.

In Übersee hammse übrigens auch Internet und nach Übersee gibts Unterseekabel. Und wenn der Hauptautor verstorben wäre, würde ich jetzt auch nicht auf seine Widergeburt warten. Wird aber eh noch dauern, bis ich Zeit für die Grafiken habe.--Chris☂ 19:52, 18. Jan. 2011 (CET)

Beispielabschnitt

Letzter Kommentar: vor 13 Jahren10 Kommentare3 Personen sind an der Diskussion beteiligt

Der Satz "es werden etwa 92 Prozent der Information in Breite mit Hilfe des Merkmals Länge erklärt" erschließt sich mir aus dem darüberstehenden Text nicht. Woher kommt diese Aussage? 93.241.238.254 08:06, 27. Jan. 2011 (CET)

Vermutlich ist gemeint, dass die Gerade die Breite im Mittel auf 8% genau vorhersagt. Also ist der Wert sozusagen nur 92% korrekt. Allerdings komme ich beim Nachrechnen auf den Wert 90.4%.--Chris☂ 14:46, 27. Jan. 2011 (CET)

Ich habe es ersetzt durch die mittlere Abweichung.--Chris☂ 23:17, 2. Feb. 2011 (CET)

Sorry, aber der Satz Die Anpassung der Punkte ist recht gut, im Mittel lässt sich die Breite mit Hilfe des Merkmals Länge auf 2,11 m genau vorhersagen. ist mir unverständlich. Wie kommt man auf den Wert von 2,11m? Und warum ist die Anpassung dann gut? Das war der Grund für die 92,216998% (Excel). --Sigbert 14:39, 3. Feb. 2011 (CET)

Hä? Dann erklär doch mal, was die 92% bedeuten und wie du sie berechnet hast. Das ist mir wiederum unverständlich und es war auch dem Benutzer der hier gefragt hat unklar. Der Wert 2,11m ist die Standardabweichung der Differenz. Also die Wurzel aus der Summe der Fehlerquadrate, um die es hier geht. Eine Größe mit der Einheit Meter ist hier doch das, wo sich die meisten etwas darunter vorstellen können.--Chris☂ 07:36, 4. Feb. 2011 (CET)

Da es sich um eine Regressionsgerade handelt, wurde das Bestimmtheitsmaß berechnet, d.h. durch die Gerade/Modell konnte ca. 92% der Varianz (Streuung, Variation) der Breite erklärt werden. Berechnung: Bestimmtheitsmaß=3287,82^2/(20391,60*574,8490)=0,92...

Mein Problem mit den 2,11m ist, dass

dies eine absolute Grösse ist und man nur bei Kenntnis des Problems einschätzen kann, ob dies eine gute oder schlechte Anpassung ist. Bei normierten Größen ist es jedem sofort klar, ob die Anpassung gut ist oder nicht.
sie auftauchen ohne irgendwelche Berechnungen.

Grüsse --Sigbert 16:17, 4. Feb. 2011 (CET)

Da in diesem Satz das Wort Bestimmtheitsmaß nicht erwähnt war, ist der Satz so auf jeden Fall eine Verbesserung. Aber fühle dich frei das wieder abzuändern, wenn du den Begriff erwähnst. Und bitte verwende nicht den Ausdruck die Breite kann "erklärt" werden. Sehr unpassender Ausdruck. Erinnert mich spontan an die Piraten-bedingte Klimaveränderung [1]. Siehe auch Cum_hoc_ergo_propter_hoc.--Chris☂ 23:57, 4. Feb. 2011 (CET)

Ja, ich habe auch schon überlegt das vielleicht beides notwendig ist, der absolute Wert und der Prozentwert. Das mit dem "erklärt" werden lässt sich nicht vermeiden, dass wird in der Statistik so gesagt und bezieht sich auf die Streuung der Breite und nicht auf die Breite selbst. --Sigbert 06:59, 5. Feb. 2011 (CET)

So, ich habe den Satz etwas korrigiert, das Bestimmtheitsmaß nur erwähnt und das Beispiel auch dort fortgesetzt. Es schien mir zu lang für den Artikel hier und eigentlich gehört es hier auch nicht hin. --Sigbert 08:35, 5. Feb. 2011 (CET)

Ok das Auslagern war eine gute Idee. So besonders wichtig für den Artikel sind diese beiden Zahlen auch nicht. Jeder sieht ja mit blosem Auge, wie gut die Anpassung ist. Das Bestimmtheismaß hat auch gewisse Schwächen, wie im Artikel Bestimmtheismaß erwähnt ist. Eine spiegelsymmetrische Verteilung von Messpunkten hat immer ein Bestimmtheitsmaß von Null, egal wie groß oder klein Abweichung zur Modellfunktion ist.--Chris☂ 16:20, 5. Feb. 2011 (CET)

Variablen ausgetauscht

Letzter Kommentar: vor 13 Jahren7 Kommentare2 Personen sind an der Diskussion beteiligt

Da hier in der Diskussion kein überzeugendes Argument für die Wahl der Variablen zu finden ist, habe ich die Variablen umbenannt. Ich denke, dass es so für Neulinge leichter verständlich ist. --Chris☂ 23:07, 2. Feb. 2011 (CET)

Das hier ist doch wohl der Witz der Monats. Ein konkreter Kommentar: Nein, es ist nicht für Neulinge verständlicher. Doch, es wurden überzeugende Argumente genannt. Deine gesamten Umbauten verwandeln den Artikel immer weiter in eine Richtung, die nicht zu mehr Verständlichkeit führt, sondern in das genaue Gegenteil. Der didaktische Aufbau ist schlechter, der Zugang komplizierter, etc.

Leider scheint es Dir egal zu sein, was andere sagen, denn bisher wurde von Deinen Umbauideen keine einzige positiv aufgenommen wurde (bis eben gerade die zu dem einen Beispielabschnitt), trotzdem führst Du massive Umbauarbeiten durch. Es ficht Dich überhaupt nicht an, dass ganz konkret kommt, dass Deine Variante als schlechter empfunden wird, Du baust sie einfach ein.

Auf den Hinweis, dass es unhöflich ist, an anderer Leute Artikel derart größere Umbauten vorzunehmen, ohne dass diese Stellung nehmen können kommt der unfassbare Satz "Und wenn der Hauptautor verstorben wäre, würde ich jetzt auch nicht auf seine Widergeburt warten." Ich weiß gar nicht, was ich dazu sagen soll?

Was wäre denn jetzt Dein Argument, wenn ich jetzt auf den Stand vom Oktober zurücksetze? Ich frage das nicht einfach so: Derzeit habe ich keine Zeit dazu, aber ab Ende März habe ich die und dann werde ich das vermutlich einfach tun und dann selber schauen, was an Änderungen seitdem noch übernommen werden sollte (das neue Bild in der Einleitung gefällt mir beispielsweise gut). Dich wird das bestimmt nicht stören: wenn meinst, Artikel gegen den erklärten Willen der Autoren umbauen zu können, wirst Du einen Umbau gegen Deinen Willen hoffentlich begrüßen... Dann bis Ende März/Anfang April. --P. Birken 21:14, 5. Feb. 2011 (CET)

Also jetzt nimms mal locker. Ich tue hier in der Wikipedia sicher nichts, von dem ich denke, dass es der Mehrheit der Leser missfällt. Der Artikel hatte einfach ganz massive Mängel. Ich zähle nochmal die Schwächen am Artikel auf, die er zuvor hatte:

Wann von Funktionskoordinaten und wann von den Parametern der Modellfunktionen die Rede war, war oft unklar und verwirrend. Z.B. war in der alten Version [2] die eindimensionale Ausgleichsgerade unter der Überschrift "der zweidimensionale Fall" zu finden. Wer soll das verstehen? Das Hin- und Herspringen zwischen der Vorstellung eines Koordinatenraumes (z.B. die Ebene der Grafiken) und eines abstrakten Parameterraums verwirrt den Leser sehr und ist unnötig. Die ungünstige Namenswahl von t und x trug zur Verwirrung bei, da man verführt war, sich x als eine räumliche Koordinate vorzustellen. (Auf dieses Argument wurde hier übrigens nie eingegangen)
Es war vom allgemeinen linearen Fall die Rede, der jedoch nicht allgemein war. Er hat z.B. den mehrdinmensionalen Fall, der weiter unten kam, nicht beinhaltet. Ich habe den echten allgemeinen linearen Fall nachgeliefert.
Was den Artikel besonders unverständlich gemacht hat (und zum Teil noch macht) ist dieser Ausdruck Ax=b, der häufig aufgetaucht ist. Es wird weder erklärt, wie man darauf kommt (außer zum Teil im Abschnitt des mehrdimensionalen Falls, jedoch über ein unlösbares Gleichungsystem, das irgendwie unsinnig ist) noch wird erklärt, warum die Minimierungsforderung der linken Seite der Gleichung genau der kleinsten Fehlerquadratsumme entspricht.

Das Kommentar mit der Wiedergeburt war vielleicht etwas hart. Aber was mich allgemein nervt, ist wenn jemandem keine Argumente einfallen und er stattdessen auf eine abwesende Person verweist, die angeblich ganz gründlich nachgedacht hätte und bestimmt tolle kluge Argumente hätte. Auf solche Spielchen lasse ich mich nicht mehr ein, da habe ich zuviel Erfahrung.--Chris☂ 01:27, 6. Feb. 2011 (CET)

Wie Du ja siehst, nehme ich es nicht locker und das hat auch guten Grund: Ich als der abwesende Hauptautor habe sehr viel Zeit und Arbeit in diesen Artikel investiert. Was Du tust, ist von mir geleistet Arbeit offensichtlich geringschätzen und zu zerstören. Natürlich stinkt mir das. Dass das nicht die feine englische Art ist, wurden Dir ja nahegelegt, aber das interpretierst Du auch noch als Strohmannargument...

Ansonsten hat der Artikel ganz bestimmt keine "massiven Mängel". Im Gegenteil ist er als lesenswert ausgezeichnet. Das alleine sollte Dir schon zeigen, dass andere Leute sich hier ein paar Gedanken gemacht haben und nichts was im Artikel steht, ist einfach gedankenlos hingerotzt ist.

Was den allgemeinen linearen Fall angeht, habe ich ja geschrieben, dass ich den Abschnitt für verbesserungswürdig halte. Da bist Du leider nicht drauf eingegangen, sondern bist bei Deine raberwitzigen Formulierung mit den Skalarprodukten geblieben, die dann wirklich garantiert, dass sich jeder potenzielle Leser (sagen wir mal ein Ingenieur), sofort abwendet. Und dass, obwohl genau dieser Ansatz als unverständlich und keine Verbesserung des Artikels kritisiert wurde und keinesfalls nur von mir... Genauso wie Du die Kritik an Deiner Änderung des didaktischen Aufbaus einfach vom Tisch gewischt hast, weil das vorherige ja Zitat, "didaktisch wertlos" war...

Was Deine sonstige Argumentation anbelangt, so läuft es darauf hinaus, dass Du eine bestimmte Notation nicht eingängig findest und dann einfach mal die Mehrheit der Leser, von denen keiner gefragt wurde, für Dich vereinnahmst. Wenn das mal kein Strohmannargument ist... Es mag sein, dass Deine Notation für genau Dich besser ist, das hängt davon ab, was Du genau machen willst. Dieser Artikel beschreibt vor allem die numerische Seite und da gehts eben ums Lösen. Unbekannte sollten x heißen und wenns ans Lösen linearer oder nichtlineare Gleichungssysteme geht, ist man direkt wo man hinwill, nämlich Ax=b, wo man direkt sieht, was zu lösen ist. All das wurde geschrieben, Du, tja, nennst das "hat halt keiner gute Argumente gebracht". Doppelmoral, anyone? --P. Birken 08:20, 6. Feb. 2011 (CET)

Das Zauberwort in der Wikipedia heißt Argumente und Abwägen von Argumenten. Wenn auf meine Argumente nicht eingegangen wird, werte ich das so, dass es keine Gegenargumente gibt. Was die Variablennamen angeht, habe ich beide Sichtweisen gegenübergestellt und kam zu den Schluss, dass die Variablennamen, wie sie in Lehrbüchern zu finden sind und auch ganz am Anfang mal im Artikel bezeichnt wurden, mehr Vor- als Nachteile haben. Darauf wurde nicht eingegangen. Solange hier nur immer nur das Kontra-Argument "x symbolisiert eine Unbekannte" wiederholt wird und das Pro-Argument ignoriert wird, ist das nicht besonders überzeugend.

Was die sonstigen Änderungen betrifft, versuche ich hier dem gesamten Spektrum an Lesern zu helfen, einerseits Schülern, die nur nach einer Ausgleichsgerade suchen, und andererseits Wissenschaftlern, die den allgemeinen Fall brauchen. Bisher nützte der Artikel hauptsächlich Leuten mit einem ganz bestimmten mittleren Niveau. Ich denke nicht, dass ich deine Arbeit irgendwie zerstöre, sondern nur weiterentwickele.--Chris☂ 10:11, 6. Feb. 2011 (CET)

Nachdem ich nochmal etwas in der früheren Diskussion gelesen habe, wo du dich DaTroll genannt hast, muss ich leider noch hinzufügen, dass du hier der einzige Vertreter dieser Schreibweise bist und mehrere sich dagegen geäußert haben. PeterFrankfurt hat sich zwar auch kürzlich dafür ausgesprochen, allerdings hat er mich erst irgendwie falsch verstanden und dann nicht mehr geantwortet. Ganz oben (2004, Diskussion:Methode_der_kleinsten_Quadrate#Neuer MQK-Artikel), setzt du dich mit dem Argument durch "Was x und t angeht: ich komme halt aus der numerischen linearen Algebra, wo man in diesem Kontext einfach ein ueberbestimmtes lineares Gleichungssystem betrachtet...". Das klingt leider auch nicht danach, das du "die Mehrheit der Leser" vertrittst. Wenn du Anfang April, wie angedroht, meine Änderungen rückgängig machen willst, dann denke bitte über meine Punkte nach. Ich werde auf Anfrage jedes Detail meiner Änderungen erklären. --Chris☂ 10:19, 13. Feb. 2011 (CET)

Nochmal als Argument für die derzeitige Variablen-Bezeichnung: Wenn man sich die ersten zwei Seiten der Google-Treffer zur Methode der kleinsten Quadrate anschaut, wird die Messwert-Koordinate mit einer Ausnahme immer mit x bezeichnet. Schaut man in Lehrbücher, bestätigt sich das: der bekannte Bronstein Taschenbuch der Mathematik macht es so, das Mathematik-Lehrbuch Fischer-Kaul, das Numerik-Lehrbuch Schwarz-Köckler und diverse Vorlesungsskripte aus dem Internet. Auch die englische Wikipedia, die frazösische, die spanische machen es so. Warum sollte die deutsche Wikipedia aus der Reihe fallen? Didaktik lebt von einheitlichen Standards, vom Wiedererkennungseffekt. Wenn sich zwei solche Standards widersprechen, wie hier, muss man eben abwägen, welcher der am meisten verbreitete ist.--Chris☂ 12:28, 6. Feb. 2011 (CET)

Quell-Code der Grafiken

Letzter Kommentar: vor 13 Jahren3 Kommentare2 Personen sind an der Diskussion beteiligt

Wer solche Grafiken wie im Artikel erstellen möchte, findet auf den Bildbeschreibungsseiten der ersten vier Bilder jeweils den Quellcode zu den Grafiken als Python-Skript. Links zur Open-Source-Software Python sind dort auch zu finden. Die Berechnung der Koeffizienten ist vollständig enthalten und kann nachvollzogen oder verändert werden.--Chris☂ 23:15, 3. Feb. 2011 (CET)

Falls es von Interesse ist: ich mache meine Grafiken immer mit R (Programmiersprache). --Sigbert 06:47, 4. Feb. 2011 (CET)

R habe ich bisher noch nicht benutzt, aber R ist für die Ausgleichsrechnung bestimmt eine sehr spezialisierte Sprache mit interessanten Funktionen.--Chris☂ 07:53, 4. Feb. 2011 (CET)

Umordnung

Letzter Kommentar: vor 13 Jahren4 Kommentare2 Personen sind an der Diskussion beteiligt

Da meine Ergänzungen hier auf keine positive Resonanz stießen, habe ich den Artikel zumindest so umgeordnet, dass er wieder der ursprünglichen Reihenfolge entspricht. Außerdem habe ich die zweifach vorkommende Lösung des Minimierungsproblems unter eine gemeinsame Überschrift gestellt, wenn auch nicht vereinigt. Die Matrix-Schreibweise beim linearen mehrdimensionalen Fall habe ich herausgenommen und im Lösungsteil auf geeignete Weise wieder eingesetzt, wo sie eigentlich besser passt, da an dieser Stelle damit weitergerechnet wird. Das hat auch den Vorteil, dass die Matrix-Schreibweise an keiner Stelle kommentarlos eingeführt wird. Die einfache Ausgleichsgerade ist jetzt wieder ganz oben, wie früher, und sie ist jetzt wahrscheinlich noch laienverständlicher. Der allgemeine Fall unten ist dann etwas komplizierter, auch mit Matrix, aber hier landen eh nur die Spezialisten, die damit klar kommen sollten. Die Residuen, die in der Einleitung erwähnt sind, habe ich auch in die Gleichungen eingesetzt, wie häufig in Lehrbüchern. Dann versteht man es besser und es stehen keine überbestimmten und im Allgemeinen unlösbaren Gleichungen mehr da. --Chris☂ 22:41, 7. Feb. 2011 (CET)

Danke, dass Du das wieder umgestellt hast. Den Teil mit der Lösung scheinst Du nicht verstanden zu haben, die Überschrift sind falsch, im ersten Teil wird nichts gelöst, sondern nur verschiedene Formulierungen diskutiert, im zweiten Teil wird nur am Anfang das lineare Gleichungssystem gelöst, der Großteil beschäftigt sich mit ganz anderem. Ich persönlich halte die Einführung von Residuen nur für zusätzliche Notation, dass das Hinschreiben des nicht lösbaren Gleichungssystems zwangsläufig zur Verwirrung führt, im Gegenteil kann es hilfreich sein, das eigentliche Problem zu motivieren, nämlich dass man eben ein unlösbares Gleichungssystem hat und deswegen was anderes machen muss. --P. Birken 00:51, 19. Feb. 2011 (CET)

Ich will nicht behaupten, dass die Residuen der einzig mögliche Weg einer Erklärung sind. Aber da war oft keine Erklärung. Das Wort "überbestimmt" kam im gesamten Artikel nicht einmal vor. So lässt man den Leser in eine Falle laufen. Die Residuen machen das Problem irgendwie greifbar und sichtbar.

Überschriften im Lösungsteil: stimmt, kann man noch besser machen. Mit ist erstmal die Information über die allgemeine Lösung sehr wertvoll. Insbesondere wäre sie mir vor einigen Jahren sehr wertvoll gewesen, als ich noch nicht wusste, dass sie in dieser allgemeinen Form existiert und numerisch relativ einfach zu behandeln ist. Du ahnst nicht, wieviel mir das Zeit erspart hätte und auf was für Ideen mich das inzwischen gebracht hat. Dass der allgemeine Fall hier noch immer etwas als Fremdkörper im Artikel sitzt, kann ich auch nicht so leicht ändern. Dazu müsste ich noch intensiver in den Text eingreifen. Aber dabei handele ich mir hier nur Ärger ein. Ich versuche die Überschriften nochmal zu verbessern.--Chris☂ 21:39, 19. Feb. 2011 (CET)

Noch eine ergänzende Erläuterung zu meiner Einführung der Residuen. Im Mehrdimensionalen Fall hieß es bisher:

...kann man das lineare Gleichungssystem in Matrixform darstellen.

...

Ax=b~

.

Der kleinste-Quadrate-Ansatz führt dann wieder wie oben auf ein lineares Ausgleichsproblem der Form

\min _{x}\|Ax-b\|_{2}.

Da steckt allerdings ein grundlegendes Problem drin, wenn das so kommentarlos da steht. Das Gleichungsystem ist äquivalent zu $Ax-b=0$ . Setzt man das in die Minimierungsbedingung ein, ergäbe sich:

$\min _{x}\|0\|_{2}.$

Es macht aber keinen Sinn, Null zu minimieren. Daher ist es für das Verständnis und die mathematische Korrektheit zwingend, die Residuen $r_{i}$ einzuführen.

Nebenbei war das "...führt dann wieder wie oben..." auch nicht korrekt. Oben "führte" nämlich nichts, da fiel vom Himmel (siehe alte Version [3], "...Man erhält...").

--Chris☂ 19:26, 12. Feb. 2011 (CET)

Größe der Varianz

Letzter Kommentar: vor 13 Jahren15 Kommentare7 Personen sind an der Diskussion beteiligt

"...jeder Messfehler sollte die gleiche Varianz haben" → "... eine gleichbleibende Varianz haben..."

Klingt mir aber auch so noch nach einer nicht notwendigen Einschränkung, eine Bedingung an die Größe der Varianz zu stellen.--Chris☂ 18:48, 18. Feb. 2011 (CET)

Doch, es macht Sinn Bedingungen an die Größe der Varianz zu stellen. Ist die Fehlervarianz unterschiedlich von Beobachtungen, dann sollten die Beobachtungen gewichtet in die Schätzung eingegehen: Je größer die Fehlervarianz desto geringer sollte der Einfluß bei der Schätzung sein. --Sigbert 19:46, 17. Feb. 2011 (CET)

Gemeint waere: die Fehler kommen alle aus derselbe Verteilung. Nijdam 11:54, 18. Feb. 2011 (CET)

Danke für die Antworten. Unter der Überschrift "Vorraussetzungen" klingt das jedoch so, als sei die Methode der kleinsten Quadrate nicht für solche Daten anwendbar. Ich arbeite zur Zeit mit Messkurven, die sehr unterschiedliche Varianz-Bereiche haben. Ich kann es mir aber nicht erlauben, in den Bereichen, die ohnehin stark verrauscht sind, durch eine Untergewichtung noch eine zusätzliche Ungenauigkeit reinzubringen. Die Anwendung gibt hier die Gewichtung vor, nicht die Varianz. Dort, wo es mehr rauscht, ist die Genauigkeit nicht automatisch weniger wichtig.

Es mag Fälle geben, wo die Varianz proportional zur Genauigkeitsanforderung ist. Bei den Kriegsschiffen z.B. erwarte ich in der Modellfunktion bei kleinen Schiffen eine höhere absolute Genauigkeit der Breite, als bei großen. Aber das ist nicht immer so.

Dieselbe Verteilung? Das ist im Prinzip das gleiche, da ja eine Normalverteilung verlangt wird. --Chris☂ 18:48, 18. Feb. 2011 (CET)

Derartiges wird nicht verlangt, und dennoch: normal verteilt bedeutet nicht unbedingt dieselbe Verteilung! Nijdam 22:16, 18. Feb. 2011 (CET)

Normalverteilt und gleiche Varianz bedeutet aber dieselbe Verteilung. Die Normalverteilung wird hier genauso empfohlen ("sollte"), wie die anderen Bedingungen.--Chris☂ 23:32, 18. Feb. 2011 (CET)

Auch das leider nicht. Normalverteilt und gleiche Erwartungswert und gleiche Varianz, dann ja. Nijdam 01:15, 21. Feb. 2011 (CET)

Auch das ist erfüllt. Der Erwartungswert des Fehlers soll Null sein.--Chris☂ 07:31, 21. Feb. 2011 (CET)

Ich empfehle die Lektüre von Methode_der_kleinsten_Quadrate#Verallgemeinerte_Kleinste-Quadrate-Modelle. Oder eben von Björck resp. Hanson/Lawson. Ansonsten kann man die Vorgehensweise auch auf andere Verteilungen erweitern, nur führt das irgendwann zu weit und ist in Regressionsanalyse besser aufgehoben. --P. Birken 00:45, 19. Feb. 2011 (CET)

Man muss auch hier wieder den Unterschied zwischen Methode der kleinsten Quadrate und Regressionsanalyse beachten. Die Methode der kleinsten Quadrate ist lediglich das mathematische Verfahren, was im Prinzip auch ohne Verteilungsannahmen funktioniert. Das Problem ist dann , dass die Ergebnisse unbrauchbar werden können. In diesem Zusammenhang heißt "Empfehlung der Normalverteilung" vor allem, dass dadurch Ausreißer in den Daten vermieden werden." In der Regressionsanalyse kommen dann die Verteilungsannahmen dazu, die vor allem für die Schätzeigenschaften relevant werden. --Philipendula 09:28, 19. Feb. 2011 (CET)

Die Normalverteilung ist auch keine große Einschränkung. Es gibt ja gute Gründe, warum die meisten Störungen normalverteilt sind. Eine ungleichmäßige Varianz tritt in der Praxis vermutlich viel häufiger auf. Aber groß was machen, außer damit zu leben, kann man meist eh nicht. Im Artikel Satz von Gauß-Markow wird die gleichmäßige Varianz übrigens auch vorausgesetzt.--Chris☂ 22:07, 19. Feb. 2011 (CET)

Zu dem obigen Kommentar: "Ich arbeite zur Zeit mit Messkurven, die sehr unterschiedliche Varianz-Bereiche haben. Ich kann es mir aber nicht erlauben, in den Bereichen, die ohnehin stark verrauscht sind, durch eine Untergewichtung noch eine zusätzliche Ungenauigkeit reinzubringen. Die Anwendung gibt hier die Gewichtung vor, nicht die Varianz. Dort, wo es mehr rauscht, ist die Genauigkeit nicht automatisch weniger wichtig."

Durch die Untergewichtung bringst Du keine zusätzliche Ungenauigkeit hinein, sondern berücksichtigst tatsächlich vorhandene unterschiedliche Varianzen, wählst also ein zu den Daten passenderes Modell aus. Wenn man das nicht macht, haben ungenaue Daten das gleiche Gewicht wie genaue und können damit das Schätzergebnis verfälschen. Man kann nicht einfach sagen, weil mir die Genauigkeit an einer Stelle wichtig ist, wähle ich an dieser Stelle eine kleinere Varianz der Beobachtungen. Diese führt zwar zu kleineren Residuen in diesem Bereich (und damit zu einer scheinbar höheren Genauigkeit), geht aber auf Kosten der genaueren Beobachtungen. Grundsätzlich sollte die Modellierung (funktionaler Zusammenhang und Gewichtung) in der Methode der kleinsten Quadrate dem Beobachtungsplan entsprechen. Wenn bestimmte Beobachtungen ungenauer sind, ist das in der Modellbildung zu berücksichtigen. Ein anderer Weg wäre, diese Beobachtungen zu verbessern (z.B. durch Wiederholen mit größerer Genauigkeit). Vielleicht kann man auch durch Berücksichtigung weiterer Einflüsse die Residuen verringern. 93.195.179.248 10:32, 4. Apr. 2011 (CEST)

Danke für die Kommentare. Mehr Punkte kann ich nicht messen, da die einzelnen Messpunkte sehr teuer sind. Inzwischen habe ich jedoch die Messpunkte umverteilt und dort dichter gelegt, wo die Genauigkeit verbessert werden muss. Effektiv erhält diese Region dadurch jedoch auch ein höheres Gewicht und wird stärker berücksichtigt, so als würde ich dort die Gewichtung erhöhen. Das mache ich in erster Linie nicht aus mathematischen Gründen, sondern weil die Anwendung an bestimmten Regionen eine kleinere Abweichung verlangt. Die Methode der kleinsten Quadrate kann nicht "wissen", welche Region wichtig ist, sie minimiert immer nur stur und gnadenlos die Summe der Fehlerquadrate, ob es sinnvoll ist oder nicht. Eine Formel kann das nicht wissen, so wie eine Gurkenraspel nicht weiß, was der Finger und was die Gurke ist. Man muss daher über bestimmte Parameter das äußere Wissen einfließen lassen. Eine speziellere Modellfunktion schien mir zu aufwendig und auch zu unflexibel. Ich verwende ein 3D-Polynom mit einer zusätzlichen Exponentialfunktion. Außerdem gewichte ich lokal mit einer Gaussfunktion ("lokale Regression mit gaußschem Glättkern"), was eigentlich die perfekte Glättmethode ergibt. Nur einzelne Stellen benötigen gewisse Sonderbehandlungen. --Chris☂ 19:41, 4. Apr. 2011 (CEST)

Du schreibst es ja sehr anschaulich: "Die Methode der kleinsten Quadrate kann nicht wissen ...". Eigentlich weiß die Methode gar nichts, alles hängt von den Eingabewerten (Meßwerte, Wahl der Parameter, Modellierung des funktionalen Zusammenhangs, Gewichtung der Beobachtungen) ab. Durch Umverteilung der Meßpunkte kann man natürlich die Genauigkeit in Teilbereichen verbessern. Bringt aber eine reine Vorabglättung etwas? Angenommen, es soll der unbekannte Erwartungswert

\mu

aus Meßwerten gebildet werden. Ein Teil der Meßwerte besitzt die Standardabweichung

\sigma

(Verteilung:

{\mathcal {N}}(\mu ,\sigma )

), ein anderer Teil die Standardabweichung

2\sigma

(Verteilung:

{\mathcal {N}}(\mu ,2\sigma )

). Man könnte hier die Gewichte 1 für den ersten Teil und 1/4 für den zweiten Teil einführen. Glättet man den ungenaueren zweiten Teil, so reduzieren sich zwar die Residuen, die einzelnen Meßwerte liegen näher am Erwartungswert, die Gesamtheit der Meßwerte wird jedoch nicht genauer. Richtig wäre es beispielsweise, 4 Meßwerte zu mitteln und diesen Mittelwert als neuen Meßwert (statt den 4 ursprünglichen) zur Mittelbildung zu benutzen. Dieser Mittelwert hat die gleiche Genauigkeit wie die Meßwerte der ersten Gruppe, erhält also das Gewicht 1. Das führt zum gleichen Schätzwert für

\mu

wie das gewogene Mittel. Sollen beide Teilgruppen den gleichen Einfluß auf das Ergebnis haben, muß die zweite viermal so viele Meßwerte wie die erste enthalten, soll sie aus irgendeinem Grund einen größeren Einfluß als die erste haben, sind die Meßwerte so anzulegen, daß noch mehr Werte in der zweiten Gruppe liegen. Bei allem ist immer auf die korrekte Gewichtung zu achten, dann passen die Ergebnisse aus unterschiedlichen Rechenwegen wunderbar zusammen. Sind die Genauigkeiten einzelner Meßwertgruppen nicht bekannt, gibt es eine Methode, sie zu schätzen: die Varianzkomponentenschätzung (es gibt noch keinen Artikel). 93.195.183.159 09:53, 5. Apr. 2011 (CEST)

Bei unregelmäßig angeordneten Punkten in einem dreidimensionalen Volumen lassen sich nicht jeweils 4 auswählen, das gäbe Unstetigkeiten. Die von mir realisierte Gewichtung mit Gaussglocke wählt dagegen lokale Punkte aus, ohne dass Unstetigkeiten entstehen. So ist das Ergebnis relativ unabhängig von unterschiedlichen Punktedichten. Die Gaussbreite lässt sich bei Bedarf von Ort zu Ort variieren, um zwischen Genauigkeit oder Glattheit frei zu wählen. Diese Methode ist die beste Glätt- und Interpolationsmethode die es gibt, fast völlig Artefaktfrei. Ich habe sehr viele Glättverfahren verglichen. Vielleicht schreibe ich über die lokale Regression mal noch einen Wikipedia-Artikel. --Chris☂ 19:21, 5. Apr. 2011 (CEST)

Überarbeitungen

Letzter Kommentar: vor 13 Jahren20 Kommentare7 Personen sind an der Diskussion beteiligt

Ich habe den Artikel nun nochmal überarbeitet. Insbesondere habe ich den Begriff der Lösung eines linearen Gleichungssystems präzisiert und dabei berücksichtigigt, dass eine Gleichung $r=A\alpha -y$ kein lineares Gleichungssystem ist, was mit der Lösung des Problems zu tun hat, sondern nur die Definition des Residuums ist.
Darüberhinaus habe ich den allgemeinen linearen Teil überarbeitet. Vorher war es so: i) Normalgleichungen werden mit diesen Skalarprodukten hingeschrieben ii) Normalgleichungen werden hergeleitet, ohne dass der Bezug zu weiter oben erwähnt wird iii) die Form A\alpha-b wird hingeschrieben. Nun ist es: i) Die Form A\alpha -b wird hingeschrieben. ii) Daraus werden die Normalgleichungen hergeleitet und iii) Die Form mit den Skalarprodukten steht da. Letztere ist weiterhin problematisch, da überhaupt nicht erklärt wird, wie man phi als Vektor aufzufassen hat und somit die Skalarprodukte gar nicht wohldefiniert sind. Weiterhin ist unklar, welchen Erkenntnisgewinn diese Form überhaupt liefert. Ich schlage nochmal vor, sie ersatzlos zu streichen.
Schließlich habe ich den "Lösungsteil" überarbeitet, in dem ziemlich viel durcheinander ging. Jetzt steht dort, wann und warum die Lösung des linearen Ausgleichsproblems existiert und eindeutig ist, dann werden verschiedene Wege aufgezeigt, das Problem zu lösen, nämlich einmal über die Normalgleichungen und dann über das Minimierungsproblem direkt. --P. Birken 15:16, 3. Apr. 2011 (CEST)

So, zurück aus Übersee? Einigen deiner Änderungen stimme ich zu. Das "SFQ" war mir auch sehr ein Dorn im Auge. Die Herleitung zu entfernen, gefällt mir dagegen nicht. Nicht weil Herleitungen unbedingt in der Wikipedia auftauchen müssen, sondern weil sie für das Verständnis von Nutzen ist. Herleitungen sind so eine Art Quellenoffenlegung. Im Zweifellsfall bringt ein Blick auf die Herleitung Eindeutigkeit.

Die Vereinigung der Schreibweisen mit den

A^{T}

und mit den Skalarprodukten unter "Lösung des Minimierungsproblems" ist dir ganz gut gelungen. Ich gewinne zwar aus den

A^{T}

eigentlich keine wirkliche Erkenntnis, aber so ist auf jeden Fall nachvolziehbar, wie es zu den Transponierten Matrizen kommt. Leider fehlt eben der Schritt fehlt, wie es zur Gleichung

A^{T}A\alpha =A^{T}b

kommt.

Eine Sache ist jetzt allerdings inakzeptabel. Unter der Überschrift "Der allgemeine Lineare Fall" wurde auch der mehrdimensionale Fall mit abgedeckt (N-dimensionale Koordinaten

x_{1},x_{2},\dots ,x_{N}

). Jetzt wird hier allerdings im selben Abschnitt ein eindimensionales x mit dem Index des Messwertes verwendet (n Messpunkte, jeweils eindimensional

x_{1},x_{2},\dots ,x_{n}

). Es war von mir vielleicht ursprünglich unsauber unter der Überschrift "Lösung in Matrix-Schreibweise" nur den Eindimensionalen Fall zu beschreiben. Ich wollte damit die Doppelindizes vermeiden, die alles sehr unübersichtlich machen würden. Aber hier geht das auf keinen Fall. Vielleicht mit Vektorpfeilen über den x?--Chris☂ 22:14, 3. Apr. 2011 (CEST)

Noch ein paar Erwiederungen:

"dass eine Gleichung $r=A\alpha -y$ kein lineares Gleichungssystem ist". Also in deiner Sprechweise ist es ein "unterbestimmtes" Gleichungssystem.

"...da überhaupt nicht erklärt wird, wie man phi als Vektor aufzufassen hat". Doch, das steht dort, wo die Skalarprodukte erklärt werden. Der Vektor bildet sich aus den Funktionswerten von phi an den Stützstellen der Messpunkte. Das ist genaugenommen schon eine Einschränkung, die ich eingegangen bin, da der Begriff Faltung nicht erwünscht wurde. Wenn du die Methode der kleinsten Quadrate zur Approximation einer analytischen Funktion verwendest, ist phi_i eventuell überhaupt kein Vektor mehr (höchtens ein unendlichdimensionaler Hilbertraumvektor).

"Weiterhin ist unklar, welchen Erkenntnisgewinn diese Form überhaupt liefert.". Der Vorteil ist, das die Herleitung dieser Schreibweise in der allgemeinen Form relativ leicht verständlich ist und in der anderen Schreibweise gar keine Herleitung existiert. Und es ist einfach ein ganzes Stück expliziter. Hinter der Schreibweise mit der transponierten Matrix verbergen sich die selben Summen. Momentan ist die Matrix A nur für den eindimensionalen Fall definiert. Die Schreibweise mit Skalarprodukten ist von sich aus allgemein. Zusammen mit der Herleitung sah man, dass beliebiege Skalarprodukte verwendet werden können, unabhängig davon, ob mehrdimensionale, komplexe oder tensorwertige Basis-Funktionen verwendet werden.

"Nun ist es:"..."ii) Daraus werden die Normalgleichungen hergeleitet". Äh, wo bitte?

--Chris☂ 23:28, 3. Apr. 2011 (CEST)

Irgendwie bin ich mit dieser Mischlösung nicht zufrieden. Ich habe mal als Vorschlag eine Entwurfsversion erstellt, die ganz ohne die Matrizen-Darstellung auskommt. Da P. Birken, den Vorschlag gemacht hat, die Skalarprodukt-Darstellung ganz zu streichen, möchte ich mal einen Gegenvorschlag machen, wenn konsequent nur die Skalarprodukt-Darstellung verwendet werden würde. Ich denke, dass diese Darstellung keine Fragen mehr offen lässt. In der anderen Darstellung wird die Gleichung $A^{T}A\alpha =A^{T}b$ verwendet, die weder dem reinen Anwender nützt, noch zum Verständnis beiträgt, da nicht erklärt ist, wie man darauf kommt. Und man muss sich außerdem an anderer Stelle zusammensuchen, wie sie sich zusammensetzt. Meine Lösungsformel gibt dem Anwender dagegen kompakt alles, was er braucht. Fast Kochrezeptartig sieht man der Gleichung alle Zutaten an: die Basisfunktionen, ausgewertet an den x-Werten der Messwerte und die y-Werte der Messwerte. Außerdem ist die Vorgehensweise auf einen Blick klar, nämlich das direkte Lösen eines Gleichungssystems, ohne vorausgehende Matrixmultiplikationen. Ich werde es nur als Entwurfsversion speichern, dass sich niemand überrollt vorkommt, außerdem ist im Numerik-Abschnitt noch was unklar.--Chris☂ 23:21, 8. Apr. 2011 (CEST)

Dieser Vorschlag, Matrizen ganz zu vermeiden, gefällt mir nicht. In Marizenschreibweise können die linearen Gleichungen zwischen Meßwerten und den Funktionen der Unbekannten übersichtlich dargestellt werden. Und die Matrizenrechnung bietet Verfahren, um die Normalgleichungen aus dem Minimierungsproblem herzuleiten und zu lösen. Daher wird die Matrizenrechnung auch in der Fachliteratur benutzt, zumindest wenn es über einfache Spezialfälle wie die Geradenausgleichung hinausgeht (jedenfalls kenne ich das so). Die Verwendung in der Fachlitertur spricht auch dafür, in dem Artikel Matrizen zu verwenden. Die einzelnen Skalarprodukte machen das Ganze unübersichtlicher. Daß das für Anwender besser geeignet ist, wage ich auch zu bezweifeln, denn er muß ja viele Vektoren aufstellen, Skalarprodukte berechnen, das Gleichungssystem lösen, ... Dabei geht es so einfach: Matrix A, Vektoren b und y aufstellen, den Rest erledigt man mit Matrizenrechnung, für die Programme vorhanden sind.

Außerdem ist die Aussage "Als Lösung des Minimierungsproblems ... existiert genau ein Minimum" falsch. Das war vorher korrekt formuliert, wobei der Matrix-Begriff allerdings benötigt wurde.

Dieser Artikel hat ein großes Problem: Die Methode der kleinsten Quadrate wird in vielen Bereichen angewendet und es scheint viele Herangehensweisen und Notationen zu geben, so daß es manchmal schwierig ist, sich in andere Herangehensweisen und Notationen hineinzudenken. Das erkennt man am Artikel und den Diskussionen. Und ich glaube nicht, daß sich das zur Zufriedenheit aller lösen läßt. Man könnte auch den hier beschriebenen allgemeinen Fall noch verallgemeinern (nichtlinearer Zusammenhang zwischen Meßwerten und Parametern, wobei A dann die Jacobimatrix ist: da greift die Methode mit Vektoren und Skalarpodukten nicht mehr; oder auf den Fall, daß die Beobachtungen nur implizit zusammen mit den Unbekannten in Bedingungsgleichungen vorkommen). Aber das ist für manche zu allgemein, die den Ansatz der Linearkombinationen aus Basisfunktionen breit erläutert sehen wollen. 93.195.175.169 15:54, 9. Apr. 2011 (CEST)

Hast du meinen Artikel denn gelesen? Du schreibst: "Und die Matrizenrechnung bietet Verfahren, um die Normalgleichungen aus dem Minimierungsproblem herzuleiten und zu lösen." Aber das ist doch genau der Hauptgrund für meine Variante, da eben in der Matrix-Schreibweise keine Herleitung vorhanden war und jetzt mit den Skalarprodukten eine vorhanden ist. Das ist doch ein klares, unschlagbares Argument. Ich habe auch nicht alle Matrizen eliminiert, sondern nur die unsymmetrische n×m-Matrix A. Die m×m-Matrix der Normalengleichung steht ja weiterhin da und die ist auch praktisch und sinnvoll. In Sachen Allgemeinheit schlägt meine Variante die andere ganz klar. Oder wie willst du mit Matrizen die Approximation von kontinuierlichen Funktionen durchführen? Bei den Skalarprodukten muss nur der Übergang zur Falltung vollzogen werden, die auch ein Skalarprodukt im allgemeinen Sinn ist. --Chris☂ 20:52, 9. Apr. 2011 (CEST)

Letztenendes ist doch eh beides das Gleiche. Wenn man

\sum _{i=1}^{m}\sum _{j=1}^{m}\alpha _{i}\alpha _{j}\left\langle {\vec {\varphi _{i}}},{\vec {\varphi _{j}}}\right\rangle -2\sum _{i=1}^{m}\alpha _{i}\left\langle {\vec {y}},{\vec {\varphi _{i}}}\right\rangle +\left\langle {\vec {y}},{\vec {y}}\right\rangle

ganz als Summen ausschreibt oder

\alpha ^{T}A^{T}A\alpha -2y^{T}A\alpha +y^{T}y

als Summen ausschreibt, kommt man auf den exakt gleichen Ausdruck. Der Unterschied ist nur, dass ersteres auch Schüler verstehen, letzteres wohl kaum.

y^{T}y

ist auch nur ein Skalarprodukt, nur als Matrixprodukt geschrieben. Wenn man die untere Gleichung ableiten möchte, wird man nicht umhin kommen sie genauso als Summen auszuschreiben. Ich empfinde das nur als verschleiernd. Aber das tun Mathematiker ja gerne, etwas möglichst kompliziert auszudrücken und nennen es dann "elegant". Und die Stellen, die dadurch kompliziert werden, fehlen und es heißt stattdessen "der triviale Schritt sei dem Leser als Übungsaufgabe überlassen". Na danke. --Chris☂ 08:45, 10. Apr. 2011 (CEST)

Ja, die Ableitungen waren als Schritt von der zu minimierenden Zielfunktion zu den Normalgleichungen nicht angegeben. Aber das heißt doch nicht, daß man alles umstellen muß, man kann auch einfach die Ableitungen ergänzen. Für einen Vektor

\mathbf {c}

und eine symmetrische Matrix

\mathbf {M}

sind die Ableitungen der Funktionen

\mathbf {c} ^{\text{T}}\mathbf {x}

und

\mathbf {x} ^{\text{T}}\mathbf {M} \mathbf {x}

nach

\mathbf {x}

(s. [4], Sätze 172.1 und 172.2):

{\frac {\partial \mathbf {c} ^{\text{T}}\mathbf {x} }{\partial \mathbf {x} }}=\mathbf {c}

und

{\frac {\partial \mathbf {x} ^{\text{T}}\mathbf {M} \mathbf {x} }{\partial \mathbf {x} }}=2\mathbf {M} \mathbf {x}

.

Damit kann man die Zielfunktion ableiten und zu den Normalgleichungen kommen. Man kann hier auf bekannte Sätze zurückgreifen und muß nicht jeden Schritt selbst noch einmal beweisen. Nutzt Du nicht z.B. bei der Ableitung der Tangensfunktion die in Mathematikbüchern angebene Formel, anstatt sie selbst aus der Quotientenregel herzuleiten? Dieses Zurückgreifen auf bereits Bewiesenes halte ich schon für sehr praktisch und elegant und nicht für verschleiernd.

In Deiner Antwort zeigt sich auch wieder das, was ich zuletzt geschrieben habe: Du möchtest gern den Schritt zur Faltung machen, anderen geht es um diskrete Meßwerte. Sie finden die ihnen bekannte Matrix

\mathbf {A}

nach Deinen Änderungen nicht mehr wieder. Ist diese Matrix die Jacobimatrix, ist es sogar sehr umständlich, die Funktionen

\varphi _{i}

einzuführen. Schülern ist vielleicht beides zu schwer, sie wollen nur eine Gerade approximieren. Ich glaube nicht, daß es allen recht gemacht werden kann.

Und noch etwas: Hätte ich Deine Änderungen nicht gelesen, wäre mir nicht aufgefallen, daß Du schreibst, die Normalgleichungen seien eindeutig lösbar. Das stimmt nicht in allen Fällen. Die Normalgleichungsmatrix kann positiv semidefinit (und damit singulär) sein, so daß auch die Eigenwerte 0 vorkommen können. 93.195.180.136 09:56, 12. Apr. 2011 (CEST)

Das ist exakt gegen meine Bemühungen die ich mir hier mache, um den Artikel so zu gestalten, dass man sich eben nicht tausend Dinge von überall zusammensuchen muss, um ihn zu verstehn. Genau das ist das Probelem! Ich denke, wir haben es hier wahrscheinlich mit einem ganz klassischen Konflikt zwischen Physikern und Mathematikern zu tun. Ich bin Physiker und sehe die Mathematik als Werzeug. Ich benutze die Methode der kleinsten Quadrate zur Zeit häufig, um damit Realweltprobleme zu lösen. Dieses Werkzeug sollte in keinem "Werzeugkasten" eines Physikers fehlen (oder eines Ökonoms usw.). So wie man echte Werzeuge braucht, beginnt ab der Zahl im Display eines Messgerätes für den Physiker die Mathematik, wo man genauso Werzeuge benötigt. Und ein Werkzeug sollte so schlicht wie möglich sein und nur so kompliziert wie nötig, sonst wird es unhandlich. Wenn ich mit Summen und Skalarprodukten auskomme, brauche ich keine Matrizen oder Matrixableitungen.

Für Mathematiker ist die Mathematik dagegen Selbszweck. Ein einfaches Niveau ist bei Mathematikern verpönt. Es ist dort Sitte, ob es notwendig ist oder nicht, auf Teufel komm raus so abstrakt wie möglich zu bleiben. Nur, um sich nicht "die Finger schmutzig zu rechnen", wie ein Matheprof immer sagte. Und so richtige Zahlen, also echte Zahlen mit Komma, wie 9,347 oder so, die sind für Mathematiker regelrecht igitt oder pfui. Irgendwie haben Mathematiker den Drang, sich möglichst weit von greifbaren Zahlen zu entfernen und so abstrakt wie möglich zu werden. Entweder, weil es sich besonders toll anfühlt, auf hohem Niveau zu wandeln, oder um Physiker abhängig von ihnen zu machen, um ihre Daseinsberechtigung nicht zu verlieren oder was weiß ich.

Wie auch immer, als ich diese Methode vor einiger Zeit dringend gebraucht hätte, wusste ich noch nicht, dass sie in dieser allgemeinen Form überhaupt existiert. Im Studium wurde sie nicht erwähnt und aus der Wikipedia war sie auch nicht herauszulesen. Ich habe über Monate nach einer geeigneten Methode gesucht, um meine komplizierten Messdaten zu analysieren. Erst beim Blick auf die unverselle Lösungsformel im Schwarz-Köckler (die mit den Skalarprodukten) war mir schlagartig klar, welche Allgemeinheit sie besitzt. Das war so ein Blick in den Werzeugkasten, wo man denkt "genau so eine Zange habe ich gesucht". Und wenn ein Werkzeug sowohl schlicht, als auch allgemein ist, ist es perfekt.

Und genau das passt zu einem Lexikon, wie der Wikipedia. Die Wikipedia ist kein Lehrbuch, dass man von vorn bis hinten durchlesen muss, um etwas zu vestehen. Sondern die Wikipedia ist ein Nachschlagewerk, aus der man geziehlt Informationen herausgreifen kann, die von anderen unabhängig sind und die möglichst sofort praktisch verwendbar sind. Genau dafür versuche ich mich hier einzusetzen. Nicht alle Welt beschäftigt sich täglich mit Matrizentransformationen. Ich finde die Methode der kleinsten Quadrate zu fundamental wichtig, um sie mathematisch zu verschleiern. Mathematiker haben die Zeit, sich in alles einzulesen und hinter den Schleier zu blicken. Und für Mathematiker ist scheinbar eh alles trivial, sie sehen daher nicht, welche Hürden sie für andere aufbauen und wieviel Zeit sie anderen damit rauben. --Chris☂ 21:29, 12. Apr. 2011 (CEST)

Ich sagte ja, daß es zu konträre Herangehensweisen gibt, die einen für alle akzeptablen Artikel so schwierig machen. Ich gebe Dir recht, wenn Du die Methode der kleinsten Quadrate als wichtiges Werkzeug bezeichnest. Auch ich bin Anwender und nutze die Methode. Ich werte diskrete Meßwerte unterschiedlicher Art und mit unterschiedlicher Genauigkeit aus. Für mich ist die Beschreibung des funktionalen Zusammenhangs mit den Funktionen

\varphi _{i}

sehr umständlich. Man müßte sie schon als Vektoren (die den Spalten von A entsprechen) auffassen, von denen jedes Element nach einer anderen Funktion berechnet wird.

Die Auswertung hört aber nicht mit der Berechnung der Schätzwerte der unbekannten Parameter auf. Denn danach werden noch Residuen berechnet, die Varianz der Beobachtungen geschätzt, die Varianzen und Kovarianzen der Schätzwerte berechnet und Beurteilungsmaße ermittelt. Dazu und zur Einführung von Gewichten eignet sich die Matrizenrechnung (mit der Matrix A) wunderbar, mit der sich dieses Werkzeug schlicht und einfach beschreiben läßt.

Wikipedia kann Themen nicht umfassend (mit allen Herleitungen, Erklärungen und Sonderfällen) beschreiben. Wer sich näher mit einem Thema beschäftigen will, muß auf Fachliterur zurückgreifen. 93.195.182.124 09:48, 13. Apr. 2011 (CEST)

Genau, und in der Fachliteratur findet er dann auch Varianzen, Kovarianzen und die exotischsten Beurteilungsmaße, insbesondere aber ganz abstrakte Darstellungsarten – Dinge, die normale Anwender nicht braucht.

Die

{\vec {\varphi _{i}}}

sind doch Vektoren und entsprechen den Spalten von A.--Chris☂ 19:36, 13. Apr. 2011 (CEST)

Die Matrix-Schreibweise ist jetzt in einem Satz am Ende des Lösungsabschnittes klar erwähnt und ich würde behaupten, dass damit alle Information über die Matrix-Darstellung gesagt ist, die auch in der anderen (im Moment gesichteten) Version des Artikels zu finden ist. Sie ist jetzt nur nicht mehr über den Artikel verteilt.--Chris☂ 08:04, 15. Apr. 2011 (CEST)

Tut mir leid, wollte mich eigentlich schon letzte Woche melden, habs jetzt erst dieses Wochenende geschafft. Zunaechst: Die Standardform, lineare Ausgleichsprobleme zu schreiben ist nunmal ueber die Matrix, also als

\min _{x}\|Ax-b\|_{2}

oder von mir aus

\min _{\alpha }\|A\alpha -b\|_{2}

. Dazu einfach in die Literatur schauen, ich habe mal in Opfer, Numerische Mathematik, Golub/Van Loan, Matrix Computations, den Bjoerck und Schwarz/Koeckler geschaut, in diverse Vorlesungsskripte und diverse Fachartikel. Das ist ja auch sinnvoll, denn dann kann man prima das eigentlich Problem vom numerischen Loesungsverfahren trennen. Und, um das nochmal deutlich zu sagen: Die Loesung ueber die Normalgleichungen ist nur eines von zwei Standardverfahren, das andere ist die mittels QR-Zerlegung.

Die Annahme, dass Schueler nicht mit Matrizen umgehen koennte, aber dafuer mit partiellen Ableitungen, und das sogar noch von Skalarprodukten, halte ich fuer ungerechtfertigt. Tatsaechlich werden Schueler in der Regel mit keinem der beiden Begriffe umgehen koennen. Von Ingenieuren und Physikern kann man dagegen erwarten, dass sie beide Begriffe kennen, das ist in beiden Studiengaengen Stoff der Eingangssemester.

Eine Anmerkung noch zum Schwarz/Koeckler. Ich habe nur die 5. Auflage, aber dort wird das ganze wirklich nicht vorbildlich behandelt. Und zwar hat er einen Abschnitt, den er Gauss-Approximation nennt, wo er das Minimierungsproblem herleitet. Dann hat er ein ganzes Kapitel "Ausgleichsprobleme, Methode der kleinsten Quadrate", wo er die Loesung solcher Probleme behandelt, und zwar die beiden von mir genannten Varianten. Keiner der beiden Abschnitte verweist auf den anderen. Die von mir A genannte Matrix nennt er C, die von mir A^TA nennt er A.

Da die IP das ganze genauso sieht wie ich wuerde ich folgendes vorschlagen: Revert auf Deine letzte gesichtete Version (8. April, 17:26). Dann ist der allgemeine lineare Fall mit den \phi's unter der allgemeine lineare Fall abgehandelt und die kanonische Form

\min _{\alpha }\|A\alpha -b\|_{2}

wird hergeleitet. In "Loesung des Minimierungsproblems" wird der theoretische Hintergrund zu Existenz und Eindeutigkeit der Loesungen und der Singulaerwertzerlegung diskutiert. Im naechsten Abschnitt werden die beiden Standardverfahren zur numerischen Loesung der Normalgleichungen beschrieben. Beide Abschnitte sollten noch etwas klarer gegeneinander abgegrenzt werden. Und, auch wenn in Deiner jetzigen Vorschlagsversion die Schreibweise mit den Skalarprodukten mit den \phi's verstaendlicher geworden ist muss ich weiterhin sagen:

A^{T}A=A^{T}b

ist um Laengen klarer, ich sehe das genauso wie die IP und wuerde den Abschnitt ersatzlos streichen (konkret in der genannten Version von "Alternativ lassen sich die Normalgleichungen" bis "Messwerte vorgegeben sind"). -P. Birken 15:24, 17. Apr. 2011 (CEST)

Wie kann denn eine Gleichung um Längen klarer sein, die ohne Erklärung vom Himmel fällt? Kannst du dich denn kein Bisschen in Leute hineinversetzen, die nicht dein Hintergrundwissen haben, es aber auch gerne verstehen möchten?

P.S.: Ich fahre gleich für eine Woche weg und bin so lange offline. --Chris☂ 16:12, 17. Apr. 2011 (CEST)

Bist du in Übersee, wo sie keine Kabel haben ;-), alles Gute, --Erzbischof 16:18, 17. Apr. 2011 (CEST)

Nein, mein Zelt hatte keinen Internetanschluss.--Chris☂ 19:41, 27. Apr. 2011 (CEST)

Ach Christian, weder gibt es eine Mathematikerweltverschwörung, noch bist Du derjenige, der hier dadurch glänzt, sich in andere hinzuversetzen.

Bei Deiner eigentlichen Frage: Natürlich ist

A^{T}A\alpha =A^{T}b

einfacher als die Skalarprodukt-Schreibweise, die extra diese Phi-Vektoren einführt, um Matrix-Matrix-Multiplikationen zu umgehen. Ja, es nimmt in Kauf, dass man Matrix-Matrix- und Matrix-Vektor-Multiplikationen als bekannt voraussetzt und ist damit für Leute die das nicht können, unverständlich. Ich behaupte aber, dass die Variante mit den Phi-Vektoren sowieso unverständlich ist, insbesondere für die Schüler, die Du so gerne vereinnahmst. Der Preis Deiner Variante ist dagegen, es für die Leute die mit Matrizen umgehen können, unnötig wesentlich schwerer zu machen.

Die Frage, wie ausführlich man eine Herleitung schreibt, ist nochmal eine andere. Wie die IP schon sagt: Hier gehts um die Methode der kleinsten Quadrate. Dann zu schreiben: "Das ist die Funktion, die leiten wir ab, setzen die Ableitung Null und erhalten die Normalgleichungen" und nicht nochmal zu erklären, wie die partielle Ableitung von linearen Abbildungen und quadratischen Formen gebildet wird ist für mich einfach nur selbstverständlich. Sich auf das wesentliche zu beschränken und den Leser bei Wissenslücken auf weiterführende Artikel zu verweisen ist nämlich der Punkt bei Enzyklopädietexten. --P. Birken 19:11, 17. Apr. 2011 (CEST)

Mathematikerweltverschwörung haha! Schau dir mal an wie Einstein gerechnet hat. Weder mit Matritzen, noch mit Skalarprodukten, sondern nur explizit mit skalaren Summen in der Einsteinschen Summenkonvention. Das zeigt doch seinen absoluten Blick auf das Wesentliche.

Klar sollten in Enzyklopädien durch Verweise Redundanzen vermieden werden, um den Artikel nicht unnötig lang werden zu lassen. Aber eine gesuchte Information sollte auch schnell zu finden sein und nicht nur "im Prinzip irgendwo" vorhanden sein. Das ist ja gerade der Vorteil gegenüber einem Lehrbuch.

Ok, "ohne Erklärung" war übertrieben, nehme ich zurück. Aber so wird sicher keiner ein solches Aha-Erlebnis bekommen, wie ich es hatte. Ich werde meinen Entwurf wieder weitgehend rückgängig machen.--Chris☂ 19:41, 27. Apr. 2011 (CEST)

Hallo, äh, für "Mathematikerweltverschwörung" wäre eher ich zuständig, aber ernsthaft: Das ist der gleiche Punkt, auf dem ich auch drüben bei der Konvergenzgeschwindigkeit rumreite: Bitte schreibt nicht nur für Mathematiker. Zumindest Artikel aus diesem Gebiet hier sind für wesentlich mehr anwendende Fachgebiete aus dem Ingenieurs- und Naturwissenschaftssektor interessant, wenn sie denn für diese Leute lesbar bleiben. Dazu ist aber der Hang von Mathematikern zur Minimierung der Texte zwecks Beseitigung aller Redundanzen und Ungenauigkeitsfallen eher von Nachteil. Aus meiner Sicht sollte für den nicht ganz so Fach-sattelfesten Leser eingangs oder zusätzlich eine Formulierung angestrebt werden, die alles ein bisschen "populärwissenschaftlich"/allgemeinverständlich/WP:OmA-erfüllend darstellt. Das ist wie im anderen Artikel keine dramatische Kritik an Mathematikern, und die sind deshalb auch keine schlechten Menschen, aber sie könnten sich noch etwas mehr bemühen, es dem Rest der Menschheit etwas weniger schwierig zu machen. Erst später im Artikel sollte dann die Schraube angezogen und eine stringente Darstellung durchgezogen werden, da dürfen sich dann die Fachfremden langsam ausklinken, aber eben nicht, bevor sie nicht ihren Aha-Effekt bekommen haben. --PeterFrankfurt 02:23, 30. Apr. 2011 (CEST)

Da kommst du etwas spät. Meine Bemühungen in diese Richtung haben hier nicht eine einzige Zustimmung gefunden, so dass ich das inzwischen aufgegeben habe.--Chris☂ 18:18, 3. Mai 2011 (CEST)

Vorgezogene Erklärung

Letzter Kommentar: vor 13 Jahren10 Kommentare2 Personen sind an der Diskussion beteiligt

@PeterFrankfurt: Indem ich die Vorgeschlagenen Version wieder größtenteils rückgängig habe, bin ich nicht so sicher, ob deine eingeschobene Ergänzung noch aktuell ist, da unten wieder eine verbale Erklärung unter "Lösung des Minimierungsproblems" zu finden ist und sie sonst doppelt vorhanden wäre. Ich habe sie daher nicht wieder eingesetzt, stattdessen in zwei Stichworten erwähnt, wie die Herleitung funktioniert. Ich fand hier auch den Begriff "Gerade" unpassend für ein Gleichungsystem aus zwei Gleichungen mit zwei Unbekannten. Erstens kann man das mit der Geraden verwechseln, um die es in dem Abschnitt geht. Außerdem ist es eher eine Ebene, oder? Auf den "großen Vorteil" würde ich auch nicht hier, eher weiter oben hinweisen z.B. direkt unter "Lineare Modellfunktionen", da der Vorteil ja nicht nur speziell bei der Ausgleichsgerade gilt. --Chris☂ 23:53, 27. Apr. 2011 (CEST)

Nee, das reicht in meinen Augen eben nicht. In der Matrixschreibweise erkennt man diesen einfachen Ableitungsmechanismus eben nur, wenn man die Lineare Algebra mit Löffeln gefressen hat, was arg wenige Leser unter den Anwendern (Ings?) mitbringen werden. Und es kommt sehr spät im Artikel. - Dein Vorschlag zu "Lineare Modellfunktionen" ist diskutierbar, aber ich fand, dass das Beispiel am konkreten Fall der zwei linearen Funktionen noch am lehrreichsten und am einfachsten nachvollziehbar ist. - Ich versuche mal, die Sätze unter Berücksichtigung Deiner Anmerkungen wieder reinzubringen. Besser so? --PeterFrankfurt 02:12, 30. Apr. 2011 (CEST)

Also mein Hauptproblem damit ist, dass ich genau diesen einen Abschnitt gerne auf einem niedrigen Niveau für den reinen Anwender gehalten hätte. Ein Mathemuffel tut sich vielleicht schon schwer genug zu verstehen, wie man die Formel anwendet. Und daher finde ich genau dies den allerungünstigsten Ort im ganzen Artikel, um die Herleitung in Worten zu beschreiben. Das sollte eigentlich unter "Lösung", wo es zur Zeit nur "von Mathematiker Mund zu Mathematiker Ohr" erklärt wird. Daran kann man noch was verbessern. Oder schreibe es, wie gesagt, unter die Hauptüberschrift, da es ja eine generelle Aussage ist. Aber bitte nicht ausgerechnet hier. Ich vergleiche Wikipedia-Artikel gerne mit einer Speisekarte, wo man je nach Geschmack wählen können sollte, was man an Information lesen möchte. Die Ausgleichsgerade ist der "Kinderteller" ohne Alkohol und ohne extra scharf. Gerade hier sollte keine Beschreibungen der Herleitung stehen. Die gehört wo anders hin. Ich finde das Einhalten dieser Grundordnung sehr wichtig. --Chris☂ 19:01, 3. Mai 2011 (CEST)

Huch, aus meiner Sicht ist der aktuelle Platz aber doch der beste: Weiter vorne geht nicht, weil man da noch nicht die konkreten Rechenformeln sieht und man deshalb noch viel allgemeiner formulieren müsste, so dass das niemand mehr versteht; weiter hinten ist auch nicht sinnvoll, da bis dorthin kaum jemand vordringt. Hier ist der Platz, wo es mal konkret um diesen Teil der Rechnerei geht, und da kann man das Prinzip mal zumindest etwas ausführlicher erwähnen. Es mit allen Rechenschritten in Form einer Herleitung komplett aufzudröseln wäre auch schon wieder kontraproduktiv, denke ich, deshalb habe ich das gleich außer Betracht gelassen. --PeterFrankfurt 02:35, 4. Mai 2011 (CEST)

Was ist das für ein Argument, dass bis dahin niemand vordringen würde? Wer sich für eine Herleitung interessiert, wird bis dahin vordringen oder dort hinspringen (warum glauben immer alle, die Leser würden brav oben anfangen und nach Reihenfolge lesen?). Und wer sich nicht dafür interessiert, will das Wissen nicht aufgezwängt bekommen. Jeder Autor will immer seine Information immer dort unterbringen, wo jeder Leser garantiert vorbei muss. Mit dem Argument würde der Abschnitt so lange zugemüllt werden, bis nicht mal jemand bis zum Ende des Abschnitts vordringt. Warum machen wir dann überhaupt eine Gliederung mit Überschriften?--Chris☂ 08:17, 4. Mai 2011 (CEST)

Doch, ich gehe schon davon aus, dass Artikel meistens von vorn nach hinten gelesen werden, ohne große Springerei, höchstens mal ein Überspringen eines gerade nicht interessierenden Teils. Ich sehe es ja auch als ideale Form eines Artikels an, dass er vom Allgemeinen/Allgemeinverständlichen ganz graduell zum immer Spezielleren übergeht, wo sich dann jeder Leser je nach seiner Fachkompetenz an der einen oder anderen Stelle ausklinkt, bis dorthin aber hoffentlich schon genügend wertvolle Informationen aufgesogen hat. Hier übrigens noch eine zufällig genau passende Stelle in SPON. --PeterFrankfurt 02:20, 5. Mai 2011 (CEST)

Der Artikel bringt manches auf den Punkt, was ich hier vergeblich zu vermitteln versuche. Allerdings hat das nichts mit Gliederung und Sortierung von Information zu tun. Jede Information im Artikel ist für irgendeinen Leser sehr wertvoll. Die Kunst ist, den Artikel so zu gestallten, dass ein "Überspringen eines gerade nicht interessierenden Teils" eben möglich ist. Warum willst du dem Leser, der nur die Ausgleichsgerade anwenden will, unbedingt die Beschreibung der Herleitung unterjubeln? Das kann ich nicht nachvollziehen. Wer hat schon etwas von dieser stichwortartigen lückenhaften Information? Verbessere lieber unten die vorhandene, etwas hochtrabende Beschreibung. Ich würde mitmachen.--Chris☂ 00:08, 9. Mai 2011 (CEST)

Nach meiner Einschätzung ziehe ich halt die Grenze für einen Leser, der sich für die Anwendung auch des einfachsten Falls interessiert, so, dass der schon was von Differenzieren und Minimumwertfindung im Nullpunkt der Ableitung weiß. Insofern kann und darf man das erwähnen. Und aus o. g. genannten Gründen finde ich diesen Platz unverändert am besten dafür. --PeterFrankfurt 02:00, 9. Mai 2011 (CEST)

Ich glaube nicht, dass irgend jemand etwas damit anfangen kann, außer er weiß schon vorher, um was es geht. Aber ich will mich nicht wegen den paar Sätzen streiten. Wenn du sie schon für so wichtig hältst, dann überarbeite sie wenigstens nochmal etwas. Mal ein paar Tipps zur Formulierung: Man beginnt keinen Gedanken mit "Man muss...". Bei einem vernünftigen Schreibstil lässt der Satzbau wenigstens irgendeinen Zweck des Satzes erkennen. Der Satz "die eingehenden Messwerte sind zum Zeitpunkt dieser Auswertung numerische Konstanten" suggeriert, dass zu einem anderen Zeitpunkt die eingehenden Messwerte keine Konstanten wären, was Unsinn ist. Gemessene Werte sind immer konstant. Das in Klammern also besser ganz weglassen. Wenn du den Absatz mit "Der große Vorteil wird sichtbar..." beginnst, dann lass den Leser nicht selber raten, was denn nun genau der große Vorteil ist. Entweder du nimmst am Ende Bezug auf den einleitenden Satz oder du erwähnst den Vorteil im gleichen Satz. Etwas durchdacht sollten die Sätze schon geschrieben sein, wenn sie schon unbedingt in diesem wichtigen Absatz stehen müssen.

Übrigens geht der Artikel nicht vom "Allgemeinen zum immer Spezielleren", sondern umgekehrt. Der allgemeine Fall steht ganz unten und der Spezialfall der Ausgleichsgeraden ganz oben, wie du es schon im Oktober 2010 haben wolltest. --Chris☂ 19:22, 9. Mai 2011 (CEST)

So, ich habe dann mal umformuliert und den Teufel ("man kann/muss") mit dem Beelzebub (Passiv- und Nominalstil) ausgetrieben, wenn's denn der Wahrheitsfindung dient. - Mit dem "vom Allgemeinen zum immer Spezielleren" hast Du recht, ich sollte wohl besser "von der einfacheren Darstellung/Szenerie zur komplexeren" oder so sagen. --PeterFrankfurt 03:16, 10. Mai 2011 (CEST)

Anforderungen an die Daten

Letzter Kommentar: vor 13 Jahren2 Kommentare2 Personen sind an der Diskussion beteiligt

Dieser Abschnitt ist merkwürdig. Er geht sofort auf Fälle ein, die eigentlich ausgeschlossen sind. Gleich am Anfang dieses Abschnittes würde man erwarten eine saubere Auflistung von Bedingungen für das Verfahren zu finden. Hier bei muss man Unterscheiden, zwischen dem was notwendig ist, um das Verfahren zu nutzen (wenig), und dem was notwendig ist, damit das Verfahren bewiesener Weise optimal ist (mehr). Wenn an anderer Stelle steht, das der Fehler: 1. Gauß-Verteilt, 2. Erwartungswert=0, 3. stochastisch unabhängig; sein müsste, so wird hier ohne dies ausreichend deutlich zu machen, auf Fälle eingegangen die eigentlich eine Untersuchung der Eignung dieses Bewertungsverfahrens nötig machen. Wie wäre es mit der Überschrift: "Wie man seine Messdaten schönt um ein evt. ungeeignetes, aber populäres Verfahren einzusetzen."? Eine Annahme ist nicht zwingend Notwendig? Hä? Es geht wohl um die Erfülltheit einer Voraussetzung? Die Idee hinter diesem Abschnitt ist doch wohl die "Konditionierung" der Statistik der Daten. Es könnte diese Aussage gemeint gewesen sein: "Unter der Annahme xyz ist das Verfahren optimal, die Erfülltheit ist aber keine notwendige Voraussetzung." --Moritzgedig 15:27, 21. Nov. 2011 (CET)

Stimmt. Ich habe mal versucht, die Punkte zu verbessern. Die Überschrift heißt jetzt: "Fehlverhalten bei Nichterfüllung der Voraussetzungen".--Chris☂ 20:07, 22. Nov. 2011 (CET)

Diskussion:Methode der kleinsten Quadrate/Archiv/2011

Inhaltsverzeichnis

Overkill

Beispielabschnitt

Variablen ausgetauscht

Quell-Code der Grafiken

Umordnung

Größe der Varianz

Überarbeitungen

Vorgezogene Erklärung

Anforderungen an die Daten

Navigationsmenü

Diskussion:Methode der kleinsten Quadrate/Archiv/2011

Overkill

Beispielabschnitt

Variablen ausgetauscht

Quell-Code der Grafiken

Umordnung

Größe der Varianz

Überarbeitungen

Vorgezogene Erklärung

Anforderungen an die Daten

Navigationsmenü

Suche