Diskussion:Kosinus-Ähnlichkeit
Letzter Kommentar: vor 4 Jahren von Bicycle Tourer in Abschnitt ‖ a ‖ 2 ‖ b ‖ 2 {\displaystyle \|\mathbf {a} \|_{2}\|\mathbf {b} \|_{2}}
Notation
[Quelltext bearbeiten]sollten die Vektoren nicht besser mit kleinen Buchstaben dargestellt werden? (nicht signierter Beitrag von 128.9.184.213 (Diskussion) 21:39, 3. Aug. 2012 (CEST))
- Stets zu Diensten. --Pp.paul.4 (Diskussion) 00:38, 4. Aug. 2012 (CEST)
Formel
[Quelltext bearbeiten]In der Formel taucht Kreuzproduktzeichen im Zähler auf. Dieser soll eigentlich durch ein Malzeichen ersetzt werden. (nicht signierter Beitrag von 130.149.246.2 (Diskussion) 18:07, 14. Jan. 2013 (CET))
- Danke für den Hinweis! Hab's geändert
Dieser Abschnitt kann archiviert werden. HilberTraum (Diskussion) 21:08, 14. Jan. 2013 (CET)
Was bedeuten die tiefgestellten Zweien? TiHa (Diskussion) 14:29, 5. Nov. 2020 (CET)
- Siehe Norm_(Mathematik)#p-Normen. Die 2-Norm ist der "gewöhnliche" Vektorbetrag, Wurzel aus der Summe der Quadrate der Komponenten. --Wrongfilter ... 14:47, 5. Nov. 2020 (CET)
- Aha. Ist das wirklich erfordlich? Es erschwert m.E. unnötig den Zugang zu einem sehr einfachen Sachverhalt. Der engl. Artikel verzichtet auf diese Verallgemeinerung. Wenn, dann müssten, wie üblich, alle Symbole erklärt werden. TiHa (Diskussion) 17:27, 5. Nov. 2020 (CET)
- Ob es erforderlich ist, weiß ich nicht (ich erinner mich nicht mal, warum ich den Artikel auf der Beobachtungsliste habe). Aber die Erklärung steht eigentlich da, die letzte Form in der Gleichungskette macht die Norm explizit. --Wrongfilter ... 17:46, 5. Nov. 2020 (CET)
- "Eigentlich" nicht. Wenn z.B. und ist, dann besagt die linke Seite ja jeweils nicht dasselbe, auch wenn auf der rechten Seite dasselbe Ergebnis rauskommt. Ein Normalsterblicher (wie ich) weiß eben nicht, was bedeutet, und wird damit leider in die Wüste geschickt. Der Artikel, obwohl er nichts Kompliziertes zum Gegenstand hat, wird nahezu unbrauchbar. Überspitzt ausgedrückt, sieht das nach Formel-Mumbo-Jumbo aus. Darf ich es rausnehmen? TiHa (Diskussion) 18:36, 5. Nov. 2020 (CET)
- Ob es erforderlich ist, weiß ich nicht (ich erinner mich nicht mal, warum ich den Artikel auf der Beobachtungsliste habe). Aber die Erklärung steht eigentlich da, die letzte Form in der Gleichungskette macht die Norm explizit. --Wrongfilter ... 17:46, 5. Nov. 2020 (CET)
- Aha. Ist das wirklich erfordlich? Es erschwert m.E. unnötig den Zugang zu einem sehr einfachen Sachverhalt. Der engl. Artikel verzichtet auf diese Verallgemeinerung. Wenn, dann müssten, wie üblich, alle Symbole erklärt werden. TiHa (Diskussion) 17:27, 5. Nov. 2020 (CET)
- Bitte nicht rausnehmen, denn in den Formeln ist generell ein Fehler: Das Skalarprodukt wird ohne die tiefgestellte "2" geschrieben, während anschl. diese "aus dem nichts" auftaucht. Ich hab noch nicht 100% sicher raus, was jetzt richtig ist, sonst hätte ich es schon korrigiert. Generell ist zu sagen, dass der derzeitige Artikel nur für Mathematiker und Physiker lesbar ist. Das wäre aber nur behebbar, wenn es so ausführlich wie in en:wp gemacht würde: en:Cosine similarity. Dort ist es eben ein Artikel "für Dummies", aber die Amerikaner sind ja auch bekannt dafür, so etwas gut hinzubekommen (übrigens scheint auch dort ein Fehler rund um die tiefgestellte 2 zu sein). Ein Rausnehmen von wäre meines Erachtens auch im jetzigen Zustand eine Verschlechterung. VG --Bicycle Tourer 00:15, 6. Nov. 2020 (CET)
- Ich wollte bloß die Zweien rausnehmen. Oder jemand erklärt, was genau den Unterschied dieser Schreibweise zu einem gewöhnlichen Betrag ausmacht. Oder man verlinkt ein Erklärung. TiHa (Diskussion) 05:15, 6. Nov. 2020 (CET)
- Bitte nicht rausnehmen, denn in den Formeln ist generell ein Fehler: Das Skalarprodukt wird ohne die tiefgestellte "2" geschrieben, während anschl. diese "aus dem nichts" auftaucht. Ich hab noch nicht 100% sicher raus, was jetzt richtig ist, sonst hätte ich es schon korrigiert. Generell ist zu sagen, dass der derzeitige Artikel nur für Mathematiker und Physiker lesbar ist. Das wäre aber nur behebbar, wenn es so ausführlich wie in en:wp gemacht würde: en:Cosine similarity. Dort ist es eben ein Artikel "für Dummies", aber die Amerikaner sind ja auch bekannt dafür, so etwas gut hinzubekommen (übrigens scheint auch dort ein Fehler rund um die tiefgestellte 2 zu sein). Ein Rausnehmen von wäre meines Erachtens auch im jetzigen Zustand eine Verschlechterung. VG --Bicycle Tourer 00:15, 6. Nov. 2020 (CET)
- Also, man kann die Rechte Seite ja auch so schreiben: , dann sieht man, dass es sich um nichtsweiter handelt, als die Vektoren zu normieren und dann zu multiplizieren, was bekanntlich den Kosinus ergibt - oder? TiHa (Diskussion) 05:34, 6. Nov. 2020 (CET)
- Die 2 steht vermutlich da, weil es sich nicht um gewöhnliche Ortsvektoren (oder verwandte Vektoren, die im dreidimensionalen euklidischen Raum leben) handelt, sondern um Vektoren in einem hochdimensionalen abstrakten Vektorraum (wenn man überhaupt streng von Vektorräumen sprechen kann). Die Ähnlichkeit ist in Analogie zu räumlichen Winkeln definiert, und die Verwendung der euklidischen Norm dürfte eher Konvention als Notwendigkeit sein. Ich pinge mal @HilberTraum: an, der den Index 2 eingebaut hat. --Wrongfilter ... 09:32, 6. Nov. 2020 (CET)
- Link zur Erklärung der "2" bzw. des ganzen Konstrukts: p-Norm. Dort wird auch klar, warum die "2" wichtig ist; Mit oder ohne "2" sind es zwei verschiedene Normen. VG --Bicycle Tourer 14:46, 6. Nov. 2020 (CET)
- Ok, aber genau wie beim Wurzelsymbol, was ohne weitere Angaben immer die Quadratwurzel bedeutet, meint man beim Betragsymbol doch normalerweise die euklidischen Norm, oder? Der Betrag eines Vektors wird in der linearen Algebra jedenfalls immer so definiert. Ich halte die Einbeziehung dieser P-Norm hier für eine unnötige, uninformative Überfrachtung, nach dem Motto "so viel Formel, wie möglich". Aber wer weiß - man muss das dann aber auch im Artikel irgendwie aufklären, wenn es geht so, dass man nicht rauslinken muss. Ich meine, den Kosinus als Ähnlichkeitsmaß her zu nehmen, ist ja keine Raketentechnik... TiHa (Diskussion) 15:44, 6. Nov. 2020 (CET)
- Hier steht aber nicht die Betragsfunktion, sondern die p-Norm. Die Betragsfunktion wird mit jeweils einem senkrechten Strich geschrieben, vgl. Betragsfunktion. Allerdings habe ich gerade in einem uralten Bronstein auch die Schreibweise mit zwei Strichen (ohne Nummer) für den Betrag eines Vektors gefunden. In einem uralten Lineare Algebra Buch (Jänich) läuft dieser mathematische Term unter dem Begriff "Norm". Ich denke, dass wir um eine explizite Erläuterung, was gemeint ist, nicht drum rum kommen. Dann kann man es auch ohne die tiefgestellte "2" schreiben. VG --Bicycle Tourer 14:57, 7. Nov. 2020 (CET)
- Ok, aber genau wie beim Wurzelsymbol, was ohne weitere Angaben immer die Quadratwurzel bedeutet, meint man beim Betragsymbol doch normalerweise die euklidischen Norm, oder? Der Betrag eines Vektors wird in der linearen Algebra jedenfalls immer so definiert. Ich halte die Einbeziehung dieser P-Norm hier für eine unnötige, uninformative Überfrachtung, nach dem Motto "so viel Formel, wie möglich". Aber wer weiß - man muss das dann aber auch im Artikel irgendwie aufklären, wenn es geht so, dass man nicht rauslinken muss. Ich meine, den Kosinus als Ähnlichkeitsmaß her zu nehmen, ist ja keine Raketentechnik... TiHa (Diskussion) 15:44, 6. Nov. 2020 (CET)
- Link zur Erklärung der "2" bzw. des ganzen Konstrukts: p-Norm. Dort wird auch klar, warum die "2" wichtig ist; Mit oder ohne "2" sind es zwei verschiedene Normen. VG --Bicycle Tourer 14:46, 6. Nov. 2020 (CET)
- Nachtrag: Hab mal eine Präzisierung eingebaut, bei Nichtgefallen einfach ändern oder herausnehmen.VG --Bicycle Tourer 15:58, 7. Nov. 2020 (CET)
- Danke für Eure Bemühungen! Ich bohre aber noch mal nach: Da steht jetzt "Unter Verwendung der verkürzten Schreibweise ...". Die Frage, die sich jetzt dem Leser stellen muss, ist doch "Kann ich das Folgende verstehen, ohne zu verstehen, was "p-Norm" bedeutet?" Oder, überspitzt ausgedrückt, wenn ich jemanden erkläre, dass "" ist, ist es dann notwenig, ihn darüber aufzuklären, dass ist? Wenn die P-Norm irgendeine Relvanz hat - ich kann es nicht beurteilen -, dann ok, aber ansonsten würde ich da Ockhams Rasiermesser ansetzen ;-) TiHa (Diskussion) 07:05, 13. Nov. 2020 (CET)
- Ich denke, dass wir hier an den Grenzen dessen sind, was eine allgemeinverständliche Enzyklopädie in Sachen Mathematik leisten soll und kann.
- Die Anwendung der Kosinusähnlichkeit erfolgt nicht in 2- oder 3-dimensionalen Vektorräumen, sondern in n-dimensionalen mit sehr großem n. Bsp.: Im Textmining ordnet man in einem Dokument jedem Wort eine eigene Dimension (sic! Dimension) zu. 1.000 Worte bedeutet 1.000 Dimensionen. Ohne diese Anwendungsfälle wäre es wohl nie zu der Begrifflichkeit "Kosinusähnlichkeit" gekommen (für diese Vermutung habe ich keinen Beleg). Die Anwendungsfälle stammen aus der Informatik, und zwar nicht aus der Frühzeit, in der Sortieralgorithmen als hohe Kunst galten (1950er und 60er), ich vermute eher 1990er, als Rechner mit genug Speicherkapazität und Rechenleistung in größerer Breite verfügbar wurden. Für den ganz überwiegenden Teil der Leser genügt die Einleitung, sie werden sowohl vor der p-Norm-Schreibweise als auch vor der Summenschreibweise kapitulieren und damit die Herleitung nicht lesen. Für Personen, die mit angewandter Mathematik zu tun haben (z.B. Ingenieure), kommt es darauf an, ob sie die Doppelstrich-Schreibweise kennen. Mit der Summenschreibweise können sie sicher noch ein wenig anfangen. Ob sie dabei nur den 2- oder 3-dimensionalen Vektorraum vor Augen haben oder sich darüber im klaren sind, dass dies n-dimensional ist und erst dadurch eine Wirkung entsteht? Hmmm, außerhalb ihrer gewohnten Anwendungsbereiche ist das jedenfalls. Und dann bleiben eben die Mathematiker, Physiker und abstrakt orientierten Informatiker (die sehr nahe bei den Mathematikern sind). Für die ist die p-Norm Schreibweise (Doppelstrich) das richtige: Kurz, knapp, präzise.
- Ein bisschen erinnert mich das an Tensoranalysis und ihre Entstehung und die Darstellung im WP-Artikel zur allgemeinen Relativitätstheorie (ART): Ein wesentlicher Treiber war Einstein mit der ART. Einstein hat Tensoranalysis nicht selber erfunden, sondern ein Freund aus der Mathematik (Marcel Grossmann) hat ihm hier Zugang zu den mathematischen Grundlagen (Tensorrechnung aus der Differentialgeometrie) verschafft. Einstein hat aber über den Anwendungsfall ART den Begriff Tensoranalysis als Teilgebiet der Tensorrechnung geprägt. Wir wissen alle, dass die ART nicht für Otto Normalverbraucher erklärbar ist. Selbst Mathematiker und Physiker haben ihre lieben Probleme, wenn sie nicht darauf spezialisiert sind. Für Otto Normalverbraucher begnügt man sich damit, anschauliche Effekte darzustellen. Der WP-Artikel zur ART erklärt auch die Mathematik hinter der ART, aber dieser Teil ist nur zu verstehen, wenn man Tensoren inkl. Schreibweise verstanden hat. Theoretisch könnte man das auch erklären, indem man die den Tensoren zugrundeliegenden Formeln jedesmal ausschreibt, aber dann wird es unleserlich. Letztendlich hat WP den Weg gewählt, im Großteil verständlich zu bleiben, die Herleitung ist aber spezifisch, mit den mathematischen Konstrukten und Schreibweisen.
- Übrigens schreibt Meyers Grosses Taschenlexikon aus den späten 80er Jahren über "Tensor" nur "eine in der Differentialgeometrie verwendete mathematisch-physikalische Größe, die im allgemeinen eine Funktion des Ortes und der Zeit ist und eine Verallgemeinerung des Vektorbegriffs darstellt." Auf jede Form von Herleitung wird verzichtet. WP kann da weiter gehen, aber der Preis ist, dass die spezifischen Teile auch Verständnis der Formalien erfordern.
- Zurück zur Kosinusähnlichkeit: Ausgelöst wurde die Diskussion dadurch, dass die tiefgestellte "2" eingefügt wurde und unklar war, was sie bedeutet. Das wurde mittels p-Norm geklärt. Nach Wissensstand der Diskussionsbeteiligten ist nicht klar, ob die Schreibweise ohne die tiefgestellte "2" immer automatisch dasselbe bedeutet wie mit tiefgestellter "2" (deshalb die Erläuterung samt Anmerkung). Daraus wurde die Überlegung, ob man nicht ganz auf die Schreibweise der p-Norm (Doppelstrich) verzichten kann. Nun: Da die Kosinusähnlichkeit nur in diesen hohen Dimensionszahlen eine Bedeutung hat, halte ich es schon für sinnvoll, mit den üblichen mathematischen Symbolen zu arbeiten, und das ist der Doppelstrich. Wer die Doppelstrichschreibweise kennt, liest einfach weiter. Wer sie nicht kennt, dem wird durch die Anmerkung geholfen. Dadurch, dass der Begriff p-norm nur in der Anmerkung und nicht im Artikeltext vorkommt, ist aus meiner Sicht unnötige Komplexität im Artikeltext vermieden. Es wird nur noch für diejenigen wichtig, die die Schreibweise mit den Doppelstrichen nicht kennen, quasi als Zusatzservice. VG --Bicycle Tourer 04:20, 15. Nov. 2020 (CET)
- Der Kosinus des Winkels zwischen zwei Vektoren hängt per Definition gar nicht von der Zahl der Dimensionen ab. Wenn die Vektoren zentriert sind, ist er nichts anderes, als die Korrelation der Vektorkomponenten. Er ist einfach - anschaulich gesprochen - ein Maß dafür, wie sehr zwei Vekoren in dieselbe Richtung zeigen. Die p-Norm spielt dabei gar keine Rolle. TiHa (Diskussion) 06:06, 20. Nov. 2020 (CET)
- Das ist schon richtig, dass der Kosinus nicht von der Zahl der Dimensionen abhängig ist. Aber die Entstehung des Begriffs "Kosinus-Ahnlichkeit" kommt aus Anwendungen mit hoher Anzahl Dimensionen. Ohne diese Anwendungen hätte es den Begriff nie gegeben. In einem 2- oder 3-dimensionalen euklidischen Raum bedarf es dieses Begriffs einfach nicht, sondern man sagt "die Vektoren zeigen in (etwa) in die gleiche Richtung". Die Leute, die in den vielen Dimensionen agieren, verwenden die abstrakte Schreibweise mit den Doppelstrichen, weil es für sie "normal" und "gängig" ist. Schon die Erklärung "in dieselbe Richtung zeigen" ist eine Hilfskonstruktion für Leute in der Denkwelt des einfachen 2/3-dimensionalen euklidischen Vektorraums. Dass wir in dem WP-Artikel über die tiefgestellte "2" diskutieren, liegt nur daran, dass unter uns bereits Unsicherheit über die Bedeutung und Schreibweise herrscht. Hier hilft die explizite Berufung auf die p-Norm, quasi als Hilfserklärung. Wir können jetzt
- die Erklärung der Schreibweise weglassen, dann sind wir dort wo die Diskussion gestartet ist.
- die Schreibweise für die Definition der Kosinus-Ähnlichkeit generell ändern (ohne Doppelstrich): Halte ich nichts von, weil sie meines Erachtens in der Fachwelt über die Doppelstrichschreibweise definiert ist und wir damit Theoriefindung betreiben würden, indem wir das anders geschrieben herleiten als die Fachwelt (wir erfinden eine in diesem Zusammenhang neue/unübliche Schreibweise).
- akzeptieren, dass eine fachgerechte Herleitung mittels Doppelstrich für "Halbwissende" am Besten durch expliziten Hinweis auf die Erklärung der Doppelstrichschreibweise gelingt.
- Merke (wie oben schon gesagt): Allgemeinverständlichkeit und fachliche Korrektheit sind in der Mathematik nur bedingt erreichbar, wenn man die Begriffe auch herleitet. Das gilt übrigens auch für die Summenschreibweise (andere mathematische Felder): Ich habe Zweifel, dass ein Jurist, der sich im täglichen Leben nur noch mit den Grundrechenarten konfrontiert sieht, die Summenschreibweise ohne Nachlesen versteht. Sie ist aber unabdingbar, um eine Vielzahl von mathematischen Begriffen lesbar herzuleiten. Für den Doppelstich gibt es noch viel mehr "Unwissende", trotzdem wird er von der Fachwelt verwendet. VG --Bicycle Tourer 19:40, 21. Nov. 2020 (CET)
- Das ist schon richtig, dass der Kosinus nicht von der Zahl der Dimensionen abhängig ist. Aber die Entstehung des Begriffs "Kosinus-Ahnlichkeit" kommt aus Anwendungen mit hoher Anzahl Dimensionen. Ohne diese Anwendungen hätte es den Begriff nie gegeben. In einem 2- oder 3-dimensionalen euklidischen Raum bedarf es dieses Begriffs einfach nicht, sondern man sagt "die Vektoren zeigen in (etwa) in die gleiche Richtung". Die Leute, die in den vielen Dimensionen agieren, verwenden die abstrakte Schreibweise mit den Doppelstrichen, weil es für sie "normal" und "gängig" ist. Schon die Erklärung "in dieselbe Richtung zeigen" ist eine Hilfskonstruktion für Leute in der Denkwelt des einfachen 2/3-dimensionalen euklidischen Vektorraums. Dass wir in dem WP-Artikel über die tiefgestellte "2" diskutieren, liegt nur daran, dass unter uns bereits Unsicherheit über die Bedeutung und Schreibweise herrscht. Hier hilft die explizite Berufung auf die p-Norm, quasi als Hilfserklärung. Wir können jetzt
- Der Kosinus des Winkels zwischen zwei Vektoren hängt per Definition gar nicht von der Zahl der Dimensionen ab. Wenn die Vektoren zentriert sind, ist er nichts anderes, als die Korrelation der Vektorkomponenten. Er ist einfach - anschaulich gesprochen - ein Maß dafür, wie sehr zwei Vekoren in dieselbe Richtung zeigen. Die p-Norm spielt dabei gar keine Rolle. TiHa (Diskussion) 06:06, 20. Nov. 2020 (CET)
- Ich denke, dass wir hier an den Grenzen dessen sind, was eine allgemeinverständliche Enzyklopädie in Sachen Mathematik leisten soll und kann.