Diskussion:Mosaik-Plot

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 13 Jahren von Sigbert
Zur Navigation springen Zur Suche springen

"titanic" wäre weniger verwirrend, wenn die legende bei dem unteren weiblichen teil nicht fehlen würde und die breite korrekt wäre. die breite des jeweiligen balkens spiegelt die anzahl wieder, die höhe richtet sich nach dem relativen anteil. nun sind hier aber männlich und weiblich nicht im vergleich korrekt dargestellt - man könnte zum beispiel meinen, es wären in der ersten klasse mehr als doppelt soviele frauen in der ersten klasse gewesen (wenn man nur die breite betrachtet) und vorallem geht der erste blick ja auf die fläche, und da sieht es auch so aus, als wären absolut mehr frauen als männer aus der ersten klasse gerettet worden. für die grafische darstellung der frauen hätte mE also die Männer berücksichtigt werden müssen für eine korrekte Breite (100% Breite sollten oben und unten n Männer sein!).

"independet" ich kann nicht verstehen, was diese grafik sagen aussagen soll, sie spiegelt in keiner weise mehr zahlen aus den daten wieder?

--MatthiasKöhler 13:08, 10. Apr. 2011 (CEST)Beantworten

Der Plot "titanic" richtet sich nach dem ersten Plot rechts oben; der müsste dann ja auch falsch sein. Dagegen spricht, dass das R Programm zum Erzeugen des Plots sehr kurz ist :) Der Plot "independent" zeigt wie ein Mosaikplot aussieht, wenn die drei Variablen unabhängig wären (also gleich dem Produkt der marginalen relativen Häufigkeiten). Die Tabelle müsste dann natürlich auch anders aussehen. --Sigbert 16:29, 10. Apr. 2011 (CEST)Beantworten
es ist schön, eine rasche antwort zu sehen ... kannst du aber bitte etwas detaillierter antworten, sodass auch ich deinen gedankengängen folgen kann?
1) "Der Plot titanic richtet sich nach dem ersten Plot rechts oben" ---> welchen plot "RECHTS" oben meinst du bitte? es ist mir nicht klar, auf welche seite/abbildung usw. du dich beziehst, wenn du "rechts oben" sagst. außerdem entsteht der eindruck, dass du überhaupt nicht verstanden hast, was ich meine?
2) kannst du bitte den wert (=sinnhaftgikeit) deines "independent" plots erläutern! die wikipadia soll ja ein nachschlagewerk für relativ unvorgebildete leser sein; als solchen würde ich mich in dieser materie auch eher sein ... und daher erschließt sich mir der sinn deines plots im zusammenhang mit den daten überhaupt nicht. was soll es bringen, den bezug zu "überlebt" wegzulassen - für mich sieht das auf den ersten blick wie ein rechenfehler aus :D
--MatthiasKöhler 13:26, 11. Apr. 2011 (CEST)Beantworten
Mosaikplot der Titanic-Daten
  • zu 1) Den hier rechts meinte ich. Sind wir uns einig darüber, dass die Rechteckflächen (im Verhältnis zur Gesamtfläche) im Mosaikplot die relativen Anteile an der Gesamtzahl der Beobachtungen darstellen? Also das Rechteck links oben repräsentiert: Geschlecht männlich, Überlebt nein, Klasse eins. Und da dies 118/2201 = 5,4% sollte das Rechteck links oben ca. 5,4% der Gesamtfläche des Mosaikplots ausmachen.
  • zu 2) Wenn die Variablen unabhängig sind, dann müsste der Plot wie unter "independent" aussehen, dass heisst in den Lücken zwischen den Rechtecken lassen sich von links nach rechts und von oben nach unten geraden Linien ohne Knick durchzeichnen. Im Plot "titanic" (siehe nun hier rechts) sind die Lücken jedoch horizontal und vertikal gegeneinander verschoben, so dass man keine geraden Linien ohne Knick von rechts nach links und oben nach unten in den Lücken durchzeichnen kann. D.h. die Variablen im titanic Datensatz sind offenbar nicht unabhängig voneinander.
"Überlebt" im Doppelplot "titanic"/"independent" ist nicht weggelassen worden. Das "Yes"/"No" bezieht sich auf "Überlebt" und nicht auf das Geschlecht. Die Legende, die R produziert hat ist wirklich etwas unglücklich. --Sigbert 21:26, 13. Apr. 2011 (CEST)Beantworten