Diskussion:Mahalanobis-Abstand
Siehe beispielsweise: Fahrmeir, Ludwig, Hamerle, Alfred, Tutz, Gerhard (Hrsg): Multivariate statistische Verfahren, New York 1996 --Philipendula 13:37, 28. Jul 2004 (CEST)
Also, ich habe das noch nie irgendwo gelesen. Eher, dass es sich um die quadrierte Euklidische Distanz handelt. Alles andere ist wissenschaftlich unseriös. --Philipendula 01:19, 29. Jul 2004 (CEST)
Was das mit der angeblich quadrierten MD anbelangt: Da möchte ich schon gern einen Hinweis, wo das steht. --Philipendula 21:55, 1. Aug 2004 (CEST)
- Prof. Dr. Christhard Schmid, Universität Ulm Statistische Datenanalyse (Vorlesung im SS 00). Besser ist natürlich, den Artikel so auszubauen, dass das Verhältnis zu anderen Abstandsmaßen und damit auch die Sache mit der Wurzel genauer erklärt wird. -- Nichtich 20:31, 2. Aug 2004 (CEST)
- Na ja, der hat halt auch Freiheit der Lehre. ;-) --Philipendula 21:57, 2. Aug 2004 (CEST)
Check ich nicht, kenn das so daß S NxL dimensional ist, mit L>N weil wie schätzt man sonst die Kovarianz ab?
- Könntest du dich bitte etwas verständlicher ausdrücken? --Philipendula 23:13, 12. Apr 2005 (CEST)
Quadrat oder nicht Quadrat?
[Quelltext bearbeiten]Bisher ist mir auch nur untergekommen, dass es sich bei der angegebenen Formel um das Quadrat der Mahalanobis-Distanz handelt. U.a. nachzulesen bei 'Pattern Classification', Duda et. al 2003 (Wiley & Sons), Seite 626. Im übrigen lohnt mal ein Blick auf das englische Wikipedia. ;-)
- Also ich könnte dir auf Anhieb 5 seriöse Monografien nennen, in denen die MD wie im WP-Artikel beschrieben definiert ist. Eine andere Definition habe ich noch nicht entdeckt. In der englischen WP war es auch zuerst so beschrieben, wurde dann aber von jemand geändert. Was beweist, dass auch die englische WP vor Usern mit gesunder Halbbildung nicht gefeit ist. Gruß --Philipendula 14:18, 4. Mai 2005 (CEST)
- Ich habe zwar keine Ahnung, worum es hier geht, aber: Spricht irgendetwas dagegen, in den Artikel einen neutralen Warnhinweis aufzunehmen, dass manchmal auch die Wurzel als MD und der andere Term als quadrierte MD bezeichnet wird? In welchem Sinne ist das denn überhaupt "fälschlicherweise"? Ist das nicht in etwa so wie die Frage, ob die Null eine natürliche Zahl ist?--Gunther 15:02, 4. Mai 2005 (CEST)
- Es ist schon ein Warnhinweis drin.
- Man verwendet die MD zur Distanzberechnung zwischen zwei hyperdimensionalen Punkten. Von daher sollte man sich schon einig sein, was man verwendet, weil sonst was Anderes rauskommt.
- Da ja die Wurzel aus der MD lediglich einen weiteren Rechenschritt bedeutet, der aber ansonsten keinen zusätzlichen Benefit bringt, weil die Transformation eineindeutig ist, hat es eigentlich auch keinen Sinn, die Wurzel zu ziehen.
- Es kommt ja auch keiner auf die Idee, das Quadrat der Euklidischen Distanz als Euklidische Distanz zu bezeichnen. Gruß --Philipendula 15:25, 4. Mai 2005 (CEST)
- All das trifft sinngemäß auch auf die natürlichen Zahlen zu, aber trotzdem gibt es zwei verschiedene Definitionen. Man sollte gute Gründe haben, wenn man die andere Bezeichnungsweise "falsch" (und nicht nur "anders" oder "weniger gebräuchlich" oder whatever) nennt. Die kann ich nicht erkennen. Aber wie gesagt, das ist nicht meine Baustelle hier, ich weiß gar nicht, wieso der Artikel überhaupt auf meiner Beobachtungsliste steht.--Gunther 15:46, 4. Mai 2005 (CEST)
- Meine Argumente sind gesagt. Macht, was ihr wollt. Meine Zeit ist zu wertvoll, hier weiter rumzustreiten. Es scheint sich auch sonst kein kompetenter Statistiker für dieses Thema zu interessieren. Ich wende mich lieber meinem Wikibook zu. --Philipendula 12:20, 5. Mai 2005 (CEST)
Hat jemand Zugriff auf diesen Artikel: [1], um die Streitigkeiten zu beenden?! Und auch in 'R' wird d² berechnet (siehe R-Dokumentation [2])
Bei Bedarf kann ich das Paper [1] zur Verfügung stellen. Hat jemand Interesse? --domibel 23:56, 31. Januar 2006 (CEST)
- In Fahrmeir et. al., eigentlich das anspruchsvollste deutsche Handbuch über Multivariate Verfahren heißt es
- ... und der Mahalanobis-Distanz
- Ebenso ist sie bei Mardia et. al., definiert, einem ähnlich bedeutenden Handbuch, bei [3], [4], [5], [6] und noch vielen anderen. Sie ist auch häufig als Wurzel definiert, wobei ich den Verdacht hege, dass das nur deshalb gemacht wurde, weils dann dimensionsmäßig besser zu den anderen Distanzmaßen passt. Allerdings ist die MD Chiquadrat-verteilt. Man müsste dann immer, wenn man die Wurzel berechnet, als kritischen Wert für den Test die Wurzel des Quantils nehmen. Was eigentlich hirnrissig ist. Es gibt ja auch die Hotelling-T-Prüfgröße in der multivariaten Verteilung, die auch als Quadrat konzipiert und Chiquadrat-verteilt ist. Ich gebe zu bedenken, dass sich einige Artikel hier auf die MD beziehen, und wenn hier planlos rumrevertiert wird, passen die Hinweise nicht mehr. Gruß --Philipendula 10:16, 1. Feb 2006 (CET)
- So wie du die MD hier definierst ist es richtig!! Aus
folgt . Im Artikel allerdings steht . Dies widerspricht Deiner hier angegebenen Definition weil das Quadrat fehlt.--domibel 13:56, 1. Feb 2006 (CEST)
- Ob ich dem Ding links nu ein hoch 2 voransetze oder nicht, ist doch egal. Ich könnte es auch xyz nennen. Entscheidend ist, dass die Formel rechts die Mahalanobis-Distanz darstellt. Und d dann die Wurzel aus der Mahalanobisdistanz ist. Manche bezeichnen auch das Bestimmheitsmaß in der Regressionsanalyse mit R, andere mit R**2. Trotzdem bleibt es das Quadrat des Korrelationskoeffizienten. --Philipendula 14:16, 1. Feb 2006 (CET)
- Du interpretierst das leider falsch. In der Mathematik trifft man häufig auf Definitionen wie Beispielsweise kann man die durch ein Skalarprodukt induzierte Norm folgendermaßen definieren:
Dies bedeutet lange noch nicht, dass eine Norm ist. Aber genau diesen Denkfehler begehst Du hier. Frage Dich mal selber warum nirgends die Definition (also ohne das Quadrat) zu finden ist. Für ein weiteres, tieferes Verständnis empfehle ich Dir das Studium der Bilinearformen auf denen die Quadriken aufbauen. Verstehe dies bitte als konstruktive Kritik. Niemand hat etwas davon wenn hier etwas Falsches veröffentlicht wird. --domibel 14:56, 1. Feb 2006 (CEST)
- Mir musst du über Bilinearformen nichts erklären. Schau mal, das Symbol d(x,y) ist doch nicht in Erz gegossen. Und es ist nicht DIN-mäßig vorgeschrieben. Es ist halt irgend ein Maß für eine Distanz. Dieses Maß kann auch mal quadratisch sein. Sein Zweck ist, zu messen. Sonst nix. Dann solls halt in Gottes Namen noch die Zwei kriegen. Aber ich hätte halt gern dieses d**2 als Mahalanobisdistanz und nicht die Wurzel daraus. Weil das mindestens so oft als MD definiert ist wie die Wurzel. --Philipendula 16:14, 1. Feb 2006 (CET)
- Mit dem Vorschlag kann ich sehr gut Leben.domibel 15:56, 2. Feb 2006 (CEST)
- Mir musst du über Bilinearformen nichts erklären. Schau mal, das Symbol d(x,y) ist doch nicht in Erz gegossen. Und es ist nicht DIN-mäßig vorgeschrieben. Es ist halt irgend ein Maß für eine Distanz. Dieses Maß kann auch mal quadratisch sein. Sein Zweck ist, zu messen. Sonst nix. Dann solls halt in Gottes Namen noch die Zwei kriegen. Aber ich hätte halt gern dieses d**2 als Mahalanobisdistanz und nicht die Wurzel daraus. Weil das mindestens so oft als MD definiert ist wie die Wurzel. --Philipendula 16:14, 1. Feb 2006 (CET)
Gaussabstand
[Quelltext bearbeiten]Was bitte ist ein Gaussabstand? Über Google komme ich mit diesem Begriff nur auf Wikipediaseiten. ich vermute somit, dass dieser Begriff vom Autor erfunden ist.
Beschränkung?
[Quelltext bearbeiten]Die Mahalanobis-Distanz ist nach meinem Verständnis ein allgemeines Distanzmaß und nicht auf eine mehrdimensionale Normalverteilung beschränkt. Vielleicht kann das jemand ja be- oder widerlegen. Grüße --Qaswed 21:08, 17. Jun. 2010 (CEST)
- Prinzipiell ja. biggerj1 (Diskussion) 14:07, 11. Mär. 2021 (CET)