Diskussion:Pareto-Verteilung
Weiterleitungen
[Quelltext bearbeiten]Hallo, ein sehr guter Beitrag. Aber, ich kenne diese "Pareto-Verteilung" als "Pareto-Regel". Gibt es eine Möglichkeit unter dem Suchbegriff der Regel auf die Verteilung zu kommen. Das wäre gut. Osterheck 17:46, 10. Jan 2004 (CET)
Ja, nennt sich Redirect. Einfach auf Pareto-Regel den Text # REDIRECT [[Pareto-Verteilung]] eintragen. --elian 17:51, 10. Jan 2004 (CET)
Sind denn Redirects auf die Ursprungsseite erwünscht? Im Text ist ein Link auf den Eintrag 80/20-Regel, der wieder zu Pareto-Verteilung zurücklenkt. --DoctorNudel 15:08, 22. Jul 2004 (CEST)
- Nein, natürlich nicht, entweder den Link aus diesem Artikel entfernen oder Artikel für 80/20-Regel schreiben. --Hubi 16:37, 22. Jul 2004 (CEST)
80% leben in Entwicklungsländern
[Quelltext bearbeiten]In dem 2 Steiten Artikel kommt nicht ein mal das Wort "pareto" vor. Vielleicht kann man den Punkt streichen? --Thire 22:08, 7. Feb 2005 (CET)
- ? 2 seiten? sind das bei mir nicht ;) ... und pareto kommt bei mir vor?!?!!...Sicherlich 22:14, 7. Feb 2005 (CET)
- Ich war etwas schnell... Noch mal: beim vorletzten Punkt bei den Beispielen "80% der Menschen leben in den Entwicklungsländern" ist die Quelle ein zweiseitiges pdf-Dokument, in dem nicht ein Mal "pareto" vor kommt.--Thire 11:39, 9. Feb 2005 (CET)
Der Graph stimmt nicht
[Quelltext bearbeiten]Nach Gleichung (1) ist P = (X/Xmin)^k, also bei Xmin=1 wie im Graphen gewählt immer gleich 1, egal wie k gewählt wird. Nun mag es sein, daß die Fläche unter dem Graphen anders als Gl. (1) normiert ist, aber dann muß man das sagen. Ob die Autoren mal draufschauen ?!
- Hallo 85.183.132.226,
stimmt. Wenn ich demnächst den Artikel um Beispiele zum Potenzgesetz erweitere, achte ich auf Anpassung der Zeichnung (oder ich vergebe eine Konstante c=k ...). -- Anton 23:20, 6. Dez 2005 (CET)
Verständlichkeit "Verteilungsfunktion"
[Quelltext bearbeiten]das ist für die meisten leser wertloses mathematiker-chinesisch, nicht einmal die variablen werden erklärt, geschweigedenn die qualitative bedeutung dieser hieroglyphen. ekuah 18:11, 29. Mai 2006 (CEST)
- (so richtig motivierend, um etwas zu verbessern, sind deine Ausführungen nicht... Anton 22:26, 30. Mai 2006 (CEST))
- wie würdest du es sagen? ekuah 23:51, 30. Mai 2006 (CEST)
- Variablen werden eingeführt, nur nicht ausführlich. Deshalb folgen die meisten Leser dem angegebenen Link, um sich über Verteilungsfunktionen zu informieren. Danach kommen sie wieder und freuen sich über den letzten Satz im Abschnitt. Anton 14:59, 4. Jun 2006 (CEST)
Für diejenigen, die die mathematische Beschreibung nicht verstehen, gibt es doch 3 vorangestelle Abschnitte ohne Formeln. ~~----
- na ja, die "meisten leser" werden den abschnitt wohl überspringen. wenn ich auf "Verteilungsfunktion" klicke, komm ich vom regen in die traufe.ich will z.b. erstmal bloß wissen, was k bedeutet. dazu will ich aber keinen stundenlange recherche anstellen. ich erwarte die erklärung in dem artikel. hier ein paar okkultismen, die man bestimmt leicht klären kann.:
- Menge X aller Beobachtungsgrößen
- kumulativen Verteilungsfunktion
- Integrationskonstante
- wenn diese begriffe weder zum qualitativen noch zum quantitativen verständnis beitragen, bitte streichen. ich bin überzeugt, dass man nichteinmal abi braucht um so eine simple geschichte zu verstehen. es wird nur miserabel kummuniziert. ekuah 08:18, 6. Jun 2006 (CEST)
- na ja, die "meisten leser" werden den abschnitt wohl überspringen. wenn ich auf "Verteilungsfunktion" klicke, komm ich vom regen in die traufe.ich will z.b. erstmal bloß wissen, was k bedeutet. dazu will ich aber keinen stundenlange recherche anstellen. ich erwarte die erklärung in dem artikel. hier ein paar okkultismen, die man bestimmt leicht klären kann.:
- "größer als eine Schranke x" -- muss das nicht "größer als eine Schranke x-min" heißen? wenn nicht, was ist dann "x-min" in der formel? ekuah 17:04, 6. Jun 2006 (CEST)
- "Pareto-Verteilung bezieht sich auf" - da kann ich beim besten wohlwollen keinen informationsgehalt entdecken, was bedeutet denn das? eine verteilung kann sich (sprachlich) m.e. nicht auf etwas beziehen. wahrscheinlich besser: "Die Pareto-Verteilung wird beschrieben als..."
- ekuah 17:04, 6. Jun 2006 (CEST)
- ich weiß immer noch nicht was k in diesem orakel bedeutet, (d.h. qualitativ, dass es der "exponent", sehe ich ja). mal so gefragt: kann ich k vorhersehen, wenn ich bestimmte größen betrachte? ekuah 12:45, 7. Jun 2006 (CEST)
- k=a-1; das a wird bereits im ersten Abschnitt eingeführt. Die 1 tritt auf, wenn man kumulative Verteilungen betrachtet, d.h. Aufsummierung (Integral) einer Wahrscheinlichkeitsdichtefunktion. Ich stimme zu, dass sich der Artikel sprachlich verbessern läßt. Bzgl. der Fachbegriffe pflichte ich Martin Pescador bei: Sie tauchen nur in untergeordneten Abschnitten auf. Auch hier gilt das Zwiebelprinzip: jeder kann soweit eintauchen, wie er mag. Hatte ich es schon einmal gesagt? Die Perle des Artikels ist die Beschreibung des Zusammenhangs von Pareto und Zipf... Anton 22:23, 7. Jun 2006 (CEST)
- gehe jede wette ein, hier weiß keiner was k bedeutet (ich meine nicht, als was man k alles so bezeichnen kann, sondern woher ich die zahl in der praxis bekomme) was ist denn ein "freier Fitparameter"? du hast eine zu hohe meinung von dem artikel; es steht vielleich nichts falsches drin, aber da is nix mit eintauchen soweit ich will, wenn fremdes mit fremden erklärt wird. das sit nicht nur ein sprachliches problem, sondern ein didakzisches. ekuah 00:31, 8. Jun 2006 (CEST)
- noch mal präziser: wenn ich die kostenposten und kosten usw. meines haushaltes unter die lupe nehme: was muss ich zählen, um k zu bekommen? ekuah 08:38, 8. Jun 2006 (CEST)
- schätze mal, ein "fitparameter" ist eine "passend-mach-größe" oder ein "biege-parameter" (um das kurven-orakel zurechtzubiegen). aus der zipfschen perspektive beschreibt er das größenverhältnis zwischen zwei aufeinanderfolgenden rängen, stimmts? ekuah 13:57, 8. Jun 2006 (CEST)
es ist ziemlich verwirrend, dass die schranke x heißt und zugleich der wert x heißt. müsste die schranke nicht auch xmin heißen? vielleicht kann man das typografisch unterscheiden indem man x und x verwendet? ekuah 08:33, 12. Jun 2006 (CEST)
außerdem muss m.e. in der erläuterung irgendwie das wort zufall auftauchen. es wird nicht klar, was die funktion praktisch beschreibt. kann man für wert (oder beobachtungsgröße) nicht zufallsgröße schreiben? ekuah 08:49, 12. Jun 2006 (CEST)
große Exponenten
[Quelltext bearbeiten]"Das Pareto-Prinzip gilt für nicht zu große Exponenten k (siehe kumulative Verteilungsfunktion oben links)."
hab das mal gestrichen, weil es sort fehl am platze war. es gehört eher in den abschnit "verteilungsfunktion". es ist außerdem eine recht unscharfe aussage (für ein mathe-thema). was heißt "zu groß"?. ich vermute, weil der anteil des größten wertes bei steigendem k gegen 100% geht und man deshalb nicht mehr von statistik sprechen kann, da braucht man ja viele werte. ekuah 11:03, 9. Jun 2006 (CEST)
- Wird k zu groß, gilt die 80/20 Regel nicht mehr. 20% der Werte belegen fast 100%, für die restlichen 80% bleibt nichts mehr.
Abb Wahrscheinlichkeitsdichteverteilung
[Quelltext bearbeiten]was ist "Pareto-Wahrscheinlichkeitsdichteverteilung"?
- Die Verteilung, die einer kumulativen Verteilung zu Grunde liegt. Anschaulich: Anzahl der Städte mit mehr als x Einwohnern ist eine kumulative Verteilung; man kann die Anzahl direkt ablesen. Städte mit x Einwohnern ist eine Dichte. Es gibt keine Stadt, die genau x Einwohner hat, aber es gibt einige, die im Intervall x; x+dx liegen. Aus dem Integral über die Dichteverteilung (Summierung über ein Intervall) erhält man die kumulativen Werte. (Vielleicht ersichtlich, wenn man die Dichte integriert: int(k*x^(-k-1)) = -x^(-k) = -1/x^k) ).
80-20-Regel
[Quelltext bearbeiten]die zahlen 80 und 20 sind vermutlich über den daumen gepeilt. wenn dem so ist, wäre es m.e. sinnvoll, das kurz zu kommentieren. ekuah 11:18, 9. Jun 2006 (CEST)
- Beispiel in die Einleitung eingebaut (gab es nicht einmal einen eigenen Artikel zum Pareto-Prinzip?) Anton 16:24, 15. Jun 2006 (CEST)
Definition
[Quelltext bearbeiten]hi Cuitala, danke für deine beiträge, allmählig lüftet sich das geheimnis. hier noch einige fragen, die der menge der unkundigen, die ja teilmenge unserer zielgruppe ist, unweigerlich kommen werden. was bedeutet,
- dass eine Zufallsvariable der p.-v. unterliegt
- Anwort: Das bedeutet, daß die Zufallsvariable Werte in der Häufigkeit annimmt, wie es die Paretoverteilung voraussagt.
- dass sie genügt
- Anwort: Im Prinzip dasselbe, nämlich, daß man die Mathematik der Paretoverteilung für diese Art von zufälligem Wert benutzen kann. Liegen andere Voraussetzungen oder Fragestellungen vor, dann bekommt man Antworten, die mit anderen Verteilungsfunktionen beschrieben werden.
- und wer ist sie, die Zufallsvariable, die Pareto-Verteilung oder die Wahrscheinlichkeitsdichte
- Antwort: die Zufallsvariable
- dass die Zufallsvariable Werte annimmt zu, kann man schreiben "Damit errechnet sich die Wahrscheinlichkeit, dass die Zufallsvariable X Werte größer x annimmt durch"?
- Antwort: Ja.
- wie kann ich aussrechnen, wie hoch die wahrscheinlichkeit eines bestimmten wertes ist?
- Antwort: Gar nicht, denn es handelt sich um eine stetige Zufallsvarible, deshalb ist es nur möglich, eine Antwort auf die Frage zu geben, wie hoch die Wahrscheinlichkeit ist, daß der Wert zwischen zwei anderen liegt.
- woher bekomme ich k, wenn sich meine quittungen und kassenzettel sortiert habe?
- Antwort: Stichprobenverteilung aufstellen und dann in der Paretoverteilung den Parameter k so lange variieren, bis der Abstand zur Kassenzettelstichprobe minimal ist.
- zu abb. 2, was ist Wahrscheinlichkeitsdichteverteilung, dasselbe wie Wahrscheinlichkeitsdichte ?
- Antwort: Ja.
ich hoffe, ich nerve nicht. ekuah 09:07, 15. Jun 2006 (CEST)
- ist das korrekt:
Die Parato-Verteilung sagt mit den Parametern und die Häufigkeit von Werten einer stetigen Zufallsvariablen voraus, wenn sie die Wahrscheinlichkeitsdichte
aufweist.
Die Häufigkeit, mit der die Zufallsvariable einen Wert annimmt, errechnet sich damit mit der Verteilungsfunktion
- .
Dabei ist ein sogenannter Fitparameter, d.h. er wird an vorliegende Werte (z.B. Stichproben) angepasst. Der Parameter beschreibt das Größenverhältnis der Zufallswerte in Abhängigkeit von ihrer Häufigkeit.
Damit errechnet sich die Wahrscheinlichkeit, dass die Zufallsvariable Werte größer annimmt durch
... hab das mal so eingefügt.
noch eine frage: was ist der unterschied (gibts einen?) zwischen "f(x)" und "F(x)"? ekuah 09:02, 23. Jun 2006 (CEST)
hallo Cuitala. das thema hatten wir schon, was bedeutet:
- dass eine Zufallsvariable der p.-v. unterliegt
deine Anwort war: Das bedeutet, daß die Zufallsvariable Werte in der Häufigkeit annimmt, wie es die Paretoverteilung voraussagt. meine umsetzung war: Die Parato-Verteilung sagt ... die Häufigkeit von Werten einer stetigen Zufallsvariablen voraus. -- damit bist du nicht einverstanden.
es sollte sich eine konkrete formulierung finden lassen, die erklärt, was ich praktisch ausrechnen kann, sonst kann ich ja gleich sagen "die formel sieht so aus:", oder "die p.-v. ist mathemathik". im augenblick werden die unbekannten symbole durch unbekannte sysmbolische wörter ersetzt. ich habe keine chance, in der wikipedia die rätsel aufzulösen. das sollte aber der sinn eine enzyklopädie sein. es ist nicht zu hart, wenn ich sage, das so eine "erklärung" wertlos ist. ekuah 13:19, 23. Jun 2006 (CEST)
Naja, das war umgangssprachlich formuliert, ist aber nicht exakt, denn die Funktion f(x) ist eine Dichtefunktion und unter Häufigkeit versteht man eine Anzahl von Dingen. Eine Zufallszahl kann, je nach dem, welchen konkreten Sachverhalt, Tatbestand, Naturphänomen mit den inneliegenden Eigenschaften unterschiedlich oft bestimmte Werte annehmen. Wie genau diese verschiedenen Werte über alle Werte verteilt sind, das sagt die Verteilungsfunktion oder auch die Wahrscheinlichkeitsdichte. Je nach Typ der dahinterliegenden Fragestellung ergeben sich unterschiedliche Verteilungsmuster. Denjenigen, die die hier zitierte Dichte haben, hat man den Namen Paretofunktion gegeben. Einerseits sollten alle in einem Artikel neu verwendeten Symbole erklärt sein, andererseits kann man nicht alles vom 1x1 an aufschreiben, dazu muß man schon auch die anderen Artikel oder mal ein Buch dazu lesen. In diesem Sinne finde ich den Artikel nun sauber, denn alle Parameter sind erklärt oder verlinkt.
- danke für deine mühe. gleich redest du wieder nicht mehr mit mir: von 1x1 kann hier nicht die rede sein. Antwort: Doch, denn man kann nicht in jedem Artikel von Anfang an alles erklären, bei komplizierten Sachverhalten muß man auch auf andere Begriffe zurückgreifen dürfen.
- und die verlinkten artikel sind z.t. noch viel unverständlicher. Antwort: Dann müssen wir sie besser machen.
- und ein symbol erklären, ist etwas anderes, als es durch ein anderes symbol (ein sprachliches: "genügt") zu ersetzen. Antwort: "genügt" ist sicher unglücklich, habe das nun geändert. X ist paretoverteilt, wenn die zugehörige Wahrscheinlichkeitsdichte soundso ist. Ich denke, das sollte keine Zweifel mehr offen lassen.
- einen satz dreimal lesen müssen, bevor man ihn auf der reihe hat, ist ein problem des satzes oder seines autoren, und nicht das problem eines lesers mit abitur. gegen umgangssprachlich ist absolut nichts einzuwenden und fachchinesisch ist keine gewähr für exaktheit, im gegenteil. Antwort: Auch mit Abitur kann man nicht alles beim ersten Lesen begreifen. Aber sicherlich hast Du Recht, man sollte es sprachlich nicht komplizierter machen, als es wirklich ist.
- unter häufigkeit versteht man nicht die anzahl von dingen sondern die relative anzahl von dingen. "je nach fragestellung"-- das ist gerade die information, die für das verständnis wichtig ist, der artikel aber nicht gibt: wie lautet denn die fragestellung?. es muss sich mit einem praktischen bezug formulieren lassen. kannst du es bitte noch mal versuchen? ekuah 15:10, 23. Jun 2006 (CEST) Antwort: Die Fragestellung kenne ich in konkreten Fall auch nicht, bei Binomialverteilung und Hypergeometrrische Verteilung ist das Bild der schwarzen und weißen Kugeln einfach, bei Pareto habe ich so ein Bild nicht, wenn es jemand hat, würde ich es auch gern hier lesen.
umformung der formeln
[Quelltext bearbeiten]die schiefe ist angegeben mit
- .
wenn ich mich nicht verrechnet habe, ist das das gleiche wie
- .
vielleicht bringt das ja was. -- 84.56.240.240 00:19, 22. Nov. 2006 (CET)
Wohlstandsverteilung
[Quelltext bearbeiten]Müsste das nicht Einkommensverteilung heißen? Der Link verweist sogar auf die Einkommensverteilung. Wohlstand lässt sich schwer messen und wenn ich mich richtig erinnere, setzte die ursprüngliche Idee auch auf empirischen Daten auf bei denen 20% der Bevölkerung 80% des Gesamteinkommens des Volkes hatten. Von daher denke ich, dass dies abgeändert werden sollte, denn Wohlstand<>Einkommen
- Tatsächlich sind Vermögensverteilungen „ungleichverteilter“ (Gini um die 60%) als Einkommensverteilungen (Gini um die 40% bei Ländern wie Deutschland). Eine Pareto-Verteilung von 80:20 führt zu einem Gini-Koeffizienten von 60%. http://www.umverteilung.de --DL5MDA 17:14, 15. Aug. 2007 (CEST)
Dieser Artikel beschreibt eine mathematische Verteilung. Drum gehört das Paretoprinzip in einen eigenen Artikel.
Den Absatz Ungleichverteilungsmaße und das Pareto-Prinzip verstehe ich nicht. Die Beispielgrafiken bedürfen der Erläuterung, um ihren Zusammenhang zur Paretoverteilung zu erkennen. Vielleicht eignet sich eine Grafik für den Artikel Paretoprinzip. Tubas 16:42, 21. Feb. 2009 (CET)
Verständlichkeit - Einleitung?
[Quelltext bearbeiten]Hallo,
wie so viele Themen aus Mathematik und Statistik ist auch dieses offensichtlich von Fachleuten für Fachleute geschrieben worden.
"Die Pareto-Verteilung, benannt nach dem italienischen Ingenieur, Soziologen und Ökonomen Vilfredo Pareto (1848–1923), ist eine stetige Wahrscheinlichkeitsverteilung." - dann folgt schon die Definition und die Formeln fangen an.
Ist die Tatsache, dass es sich um eine Wahrscheinlichkeitsverteilung handelt, das einzige, was man einem fachfremden Leser dazu mitteilen kann? Oder ist die Biografie des Herrn Pareto so wichtig, dass sie mehr Raum in der Einleitung einnehmen muss, als due Beschreibung des eigentlichen Lemmas?
Es muss doch irgendwelche Anwendungsfälle geben, irgendeine bekannte Beobachtung oder eine Berechnung, die von allgemeinem Interesse ist. Falls nicht, wäre sogar zu überlegen, ob der Artikel überhaupt eine Berechtigung hat - Wikipedia ist kein Mathewiki. Das gehört dann - meiner Meinung nach - in die Einleitung.
Irgendwo gegen Ende des Artikels finden sich dann zwar Abschnitte mit einem Beispiel und eine Übersicht markanter Verteilungen, aber beides erscheint mir zusammenhanglos und noch zu unverständlich.
Die mathematisch korrekte Darstellung hat ihre Berechtigung, aber in einem Lexikon gehört der allgemeinverständliche Teil zwingend dazu und ist sogar noch wichtiger!
Es wäre schön, wenn im Artikel, vielleicht schon in der Einleitung, folgende Fragen beantwortet würden: - Warum ist die Paretoverteilung von Bedeutung? - Welche bekannte/ wichtige Beobachtung lässt sich als Paretoverteilung darstellen? - Gibt es praktische Anwendungen? In welchen Bereichen?
Hier muss ich voll und ganz zustimmen! Die Mathematischen Erläuterungen und Formeln sind zum Nachschlagen gut und wertvoll, aber die Motivation (= die drei oben genannten fehlenden Punkte) für die Paretoverteilung ist für ein Lexikon absolut notwendig! (nicht signierter Beitrag von 80.153.51.106 (Diskussion) 09:47, 20. Apr. 2011 (CEST))
--217.91.139.42 11:26, 14. Jul. 2009 (CEST)
- Also ich verstehe das auch nicht. Und wundere mich warum seit einem Jahr hier niemand hilft. Haben mal einen Baustein eingefügt. Gruss, --Markus 11:36, 14. Aug. 2010 (CEST)
- 217.91.139.42, Markus -- wie findet Ihr in diesem Zusammenhang den Artikel Poisson-Verteilung? Bringt der ungefähr das, was Ihr Euch wünscht? -- UKoch 22:31, 4. Apr. 2011 (CEST)
Übersicht einiger markanter Verteilungen
[Quelltext bearbeiten]Im Artikel steht "98 % zu 1 %: Der Theil-Index liegt bei 4." Müssen es in der Summe nicht 100% sein? (nicht signierter Beitrag von 89.199.206.111 (Diskussion) 09:30, 20. Mai 2010 (CEST))
erledigt. --82.135.115.226 13:42, 7. Feb. 2011 (CET)
Unverständlicher Teil: "Ungleichverteilungsmaße und das Pareto-Prinzip"
[Quelltext bearbeiten]Was mag dieses Theil-Dings sein? Wozu ist es gut? Warum sollte das jemand wissen wollen? In der Form sieht das so drangeklatscht aus und man erkennt nicht den Mehrwert der Aussagen. WB 11:55, 17. Jun. 2011 (CEST)
- Der Theil-Index ist verlinkt, ging aber in der unsinnigen "Übersicht" verloren. Dass der Theil-Index ≈ 1 ist, sollte drin bleiben, inwiefern dieser Wert gesonderte Relevanz besitzt, dass man eine Merkhilfe braucht, erschliesst sich mir auch aus keinem der beiden Artikel. --Phoinix 14:31, 17. Jun. 2011 (CEST)
Beispiels-Graph
[Quelltext bearbeiten]Im ersten Bild unter "Beispiele" scheint es mir, als würde hier vertreten, in Deutschland gebe es zigtausende Gemeinden mit null Einwohnern. Oder als wäre das zumindest wahrscheinlich. Verstehe ich das falsch oder behauptet das wirklich jemand? Grüße Okmijnuhb·bitte recht freundlich 18:55, 19. Jun. 2011 (CEST)
- Nein, diese Auffassung wird nicht vertreten, da die im Diagramm angegebene Verteilung ab <14000EW Null ist. Ich gebe aber zu, dass das aus dem Graph nicht ersichtlich wird, und werde das zeitnah korrigieren. Danke für den Hinweis! --AccountaliveD 19:55, 19. Jun. 2011 (CEST)
- OK... Versteh ich dann aber genauso wenig, denn es gibt doch viele Gemeinden mit <14.000EW. Ich habe keine Ahnung, was die geringste Einwohnerzahl ist, aber die müsste doch berücksichtigt werden (entweder exakt als tatsächlich vorhanden oder wenigstens ungefähr als wahrscheinlich - was immer die Grafik auch zeigen mag). Bei der Gelegenheit: Worauf bezieht sich das "n", von dem auf der Beschreibung der Y-Achse die Rede ist? Doch wohl auf die Einwohnerzahl? Aber die liegen auf der x-Achse. Müsste/sollte/könnte man das "n" nicht umbenennen in "y"? Grüße Okmijnuhb·bitte recht freundlich 20:07, 19. Jun. 2011 (CEST)
- Der Graph behandelt nicht alle Gemeinden, sondern nur Städte. Offenbar hat sich der, der die Daten erfasst hat (nicht ich), gesagt: "Für mich sind nur die 999 größten Gemeinden Städte". Eigentlich seltsam, denn die Graphen, die behaupten, sich auf diesen Datensatz zu beziehen, benutzen offenbar nicht den, sondern einen größeren. Naja sei's drum. Weiß ich jetzt nicht, ob ich das jetzt noch ändere.. mal sehen.
- Die Grafiken mit dem n meinen mit n die Einwohnerzahl. Zum Beispiel: Es gibt ca 100 Städte, die mehr als 100.000 Einwohner haben. Die Grafiken sind aber nicht von mir und ich habe festgestellt, dass es einigermaßen hakelig ist, dieses kumulative Diagramm nachzubauen. --AccountaliveD 21:13, 19. Jun. 2011 (CEST)
- OK... Versteh ich dann aber genauso wenig, denn es gibt doch viele Gemeinden mit <14.000EW. Ich habe keine Ahnung, was die geringste Einwohnerzahl ist, aber die müsste doch berücksichtigt werden (entweder exakt als tatsächlich vorhanden oder wenigstens ungefähr als wahrscheinlich - was immer die Grafik auch zeigen mag). Bei der Gelegenheit: Worauf bezieht sich das "n", von dem auf der Beschreibung der Y-Achse die Rede ist? Doch wohl auf die Einwohnerzahl? Aber die liegen auf der x-Achse. Müsste/sollte/könnte man das "n" nicht umbenennen in "y"? Grüße Okmijnuhb·bitte recht freundlich 20:07, 19. Jun. 2011 (CEST)
Verhältnis zu Gauss
[Quelltext bearbeiten]Dass Null-Einwohner-Orte recht unwahrscheinlich sind lässt mich an die Normalverteilung von Gauss denken, die für mich als Laien, soweit ich sie verstehe, plausibler zu sein scheint: Orte mit 0, 3 oder 100Mio EW sind unwahrscheinlicher als Orte mit 20.000EW. Vielleicht könnte jemand noch in die Einleitung schreiben, in welchem Verhältnis das hiesige Dings zum Gaussschen Dings steht, ob sie sich widersprechen oder bestätigen und wo überhaupt der Unterschied ist. Grüße Okmijnuhb·bitte recht freundlich 20:19, 19. Jun. 2011 (CEST)
- Die sind völlig unterschiedlich. Pareto hat ja das Maximum beim kleinsten Wert. Gauss hingegen in der "Mitte" - tatsächlich gibt es bei Gauss keinen kleinsten Wert, weil Gauss nie Null wird. Was du da beschreibst (Alle Werte >0. Wenige kleine Werte, viele mittelgroße Werte, wenige ganz große Werte) passt nicht zu Pareto, sondern eher zu einer Log-Normalverteilung. --AccountaliveD 21:21, 19. Jun. 2011 (CEST)
- War keine Absicht ;-)... Diese Zusammenhänge sollten mMn verstärkt in den Artikel. Sozusagen 3 Eskalationsstufen des Elends: 1) eine Einführung, die auch so unbegabte wie ich noch verstehen und die die Dinge einigermaßen verständlich einordnet. 2) Die mathematisch korrekte Definition und 3) vertiefte Ausführungen für Mathe-Supergurus. Im Moment ist schon die Enleitung auf Level 3.
- Mal ehrlich: "ist eine stetige Wahrscheinlichkeitsverteilung auf einem rechtsseitig unendlichen Intervall [x_{\min},\infty). Sie ist skaleninvariant und genügt einem power law." versteht doch kein Mensch. Sowas kann man doch nicht in die Einleitung schreiben. Wie wäre es mit "...ist ein mathematisches Dings zur Berechnung von Wahrscheinlichkeiten. Es gilt nur für positive Zahlen (Falls das mit dem rechtsseitigen unendlichen Intervall gemeint sein sollte). Von diesem oder jenem unterscheidet sie sich durch bla. Ihr Vorteil besteht im blub. Damit ergeben sich besonders für piep gute Anwendngsmöglichkeiten." Grüße Okmijnuhb·bitte recht freundlich 09:57, 20. Jun. 2011 (CEST)
- Naja, dazu sind die Begriffe ja jeweils auf die Artikel verlinkt, die du dir durchlesen kannst. Ich bin zwar auch großer Fan von dieser "Das ist einfach so ein Ding, dass blablubb"-Art, Dinge zu erklären, aber in so Spezialartikeln muss man ein bisschen Wissen voraussetzen, sonst fängt man jedes mal wieder beim "Urschleim" an und das bindet enorm viel Arbeitskraft, die wir leider nicht haben (schon deshalb, weil nur sehr wenige Menschen mathematische Dinge gut erklären können). Dann lieber die verlinkten Grundlagenartikel ausbauen - da wäre es an zentraler Stelle erklärt. Noch ein Tipp: Geh beim Lesen nicht mit zu viel Respekt an mathematische Texte ran. Hinter vielen großen Wörtern versteckt sich am Ende eine ganz banale Sache und oft stört es auch nicht, wenn man unverständliche Dinge für den Moment einfach ignoriert. ;) --AccountaliveD 13:23, 20. Jun. 2011 (CEST)
Erwartungswert und Varianz
[Quelltext bearbeiten]Es wird angegeben, dass der Erwartungswert für den Wert hat. Wie ist einem solchen Fall die Varianz definiert, damit sich für die Varianz ebenfalls der Wert ergibt, wie es im Artikel angegeben ist? -Sigma^2 (Diskussion) 09:24, 4. Aug. 2014 (CEST)
- Das müsste doch mit der üblichen Definition und den üblichen Rechenregeln für Erweiterte reelle Zahlen abgedeckt sein, oder siehst du da Probleme? Grüße -- HilberTraum ⟨d, m⟩ 09:53, 4. Aug. 2014 (CEST)
- Ich sehe zunächst das Problem, dass auf den Artikel Varianz (Stochastik) verwiesen wird, dort aber dieser Fall nicht abgedeckt ist. Zweitens gilt für die Varianz, falls endlich ist, die sogenannte Verschiebungsdarstellung , siehe Verschiebungssatz (Statistik). Diese Verschiebungsdarstellung wird teilweise auch zur Definition der Varianz verwendet. Im Fall ergibt sich für die Varianz , was im Bereich der erweiterten reellen Zahlen zunächst nicht eindeutig definiert ist. Man könnte wohl durchaus definieren , falls , ohne Rücksicht darauf, ob existiert (im Bereich der erweiterten reeellen Zahlen) oder endlich ist. - Sigma^2 (Diskussion) 10:53, 4. Aug. 2014 (CEST)
- Ja, das mit dem Verschiebungssatz ist ein Argument. Das wäre natürlich unpraktisch, wenn der nicht mehr gilt. Ich habe noch in ein paar Bücher geschaut: Alle haben einen endlichen Erwartungswert vorausgesetzt, manche sogar endliches 2. Moment. Danke für den Hinweis. -- HilberTraum ⟨d, m⟩ 13:16, 4. Aug. 2014 (CEST)
- So ist es auch in der mir zur Verfügung stehenden Literatur. Eine (seltene) Ausnahme ist Klenke (2011), Wahrscheinlichkeitstheorie, 2. Aufl., S. 103: "Formal setzen wir manchmal , falls ist." - Sigma^2 (Diskussion) 14:33, 4. Aug. 2014 (CEST)
- Ja, das mit dem Verschiebungssatz ist ein Argument. Das wäre natürlich unpraktisch, wenn der nicht mehr gilt. Ich habe noch in ein paar Bücher geschaut: Alle haben einen endlichen Erwartungswert vorausgesetzt, manche sogar endliches 2. Moment. Danke für den Hinweis. -- HilberTraum ⟨d, m⟩ 13:16, 4. Aug. 2014 (CEST)
- Ich sehe zunächst das Problem, dass auf den Artikel Varianz (Stochastik) verwiesen wird, dort aber dieser Fall nicht abgedeckt ist. Zweitens gilt für die Varianz, falls endlich ist, die sogenannte Verschiebungsdarstellung , siehe Verschiebungssatz (Statistik). Diese Verschiebungsdarstellung wird teilweise auch zur Definition der Varianz verwendet. Im Fall ergibt sich für die Varianz , was im Bereich der erweiterten reellen Zahlen zunächst nicht eindeutig definiert ist. Man könnte wohl durchaus definieren , falls , ohne Rücksicht darauf, ob existiert (im Bereich der erweiterten reeellen Zahlen) oder endlich ist. - Sigma^2 (Diskussion) 10:53, 4. Aug. 2014 (CEST)
Schiefe
[Quelltext bearbeiten]Kann es sein, dass unter der Wurzel unter dem Bruchstrich nicht 2, sondern k stehen sollte? So ist's jedenfalls im englischsprachigen Artikel. Kann jemand mit Ahnung mal gucken? -- UKoch (Diskussion) 22:45, 3. Mai 2015 (CEST)
- Ja stimmt, ich hab’s nochmal mit Maple nachgerechnet. Danke! -- HilberTraum (d, m) 11:14, 4. Mai 2015 (CEST)
- Auch danke! -- UKoch (Diskussion) 21:58, 6. Mai 2015 (CEST)
Überprüfung des Paretoprinzips
[Quelltext bearbeiten]Ich kann mir nicht helfen, ich habe den Erwartungswert
nun mehrmals nachgerechnet und komme auf
- ,
nicht die im Artikel angegebene Formel. Beziehungsweise komme ich allgemein für das Quantil auf
- .
Herleitung: Es gilt
- ,
also
- .
Daher lautet die bedingte Dichte für :
und der Erwartungswert (für ) somit
- .
Liegt der Artikel falsch? Oder wo liegt mein Denkfehler? --77.10.201.199 22:38, 4. Dez. 2019 (CET)
Schlechtes Beispiel "Einwohnerzahlen deutscher Städte"
[Quelltext bearbeiten]Hallo. Ich habe versucht, das Eingangsbeispiel mit den deutschen Städten zu rekonstruieren, indem ich Daten des statistischen Bundesamtes verwende (https://www.destatis.de/DE/Themen/Laender-Regionen/Regionales/Gemeindeverzeichnis/Administrativ/05-staedte.html). Wenn ich da vesuche, eine Paretoverteilung zu fitten, kommt nichts wirklich schönes dabei heraus, eine Lognormalverteilung passt aber perfekt. Ich habe den Eindruck, dass das hier im Beispiel nur deswegen funktioniert, weil die Auflösung im Histogramm so schlecht gewählt ist. Wenn man die Bins etwas schmäler macht, sieht man nämlich deutlich den Anstieg am Anfang: wenige sehr kleine Gemeinden, ein Maximum bei 3000 bis 3500 Einwohnern und dann ein rascher Abfall mit wenigen sehr großen Städten. Kann dazu jemand Stellung beziehen? Habe ich etwas falsch verstanden? Oder sollte man da besser ein anderes Beispiel nehmen?--PatrickC (Diskussion) 13:13, 19. Mär. 2021 (CET)