Diskussion:Importance Sampling
Auf dieser Seite werden Abschnitte ab Überschriftenebene 2 automatisch archiviert, die seit 7 Tagen mit dem Baustein {{Erledigt|1=--~~~~}} versehen sind. |
Verschiebung / Lemma
[Quelltext bearbeiten]Die Seite nach Jahren ohne Diskussion von "Importance Sampling" nach "Stichprobenentnahme nach Wichtigkeit" zu Verschieben geht gar nicht. "Stichprobenentnahme nach Wichtigkeit" ist meiner Meinung nach zudem Begriffsbildung / Begriffsetablierung - etabliert ist auch im Deutschen "Importance Sampling". Ich stelle den alten Zustand her und verschiebe die Seite zurück. Falls die Diskussion etwas anderes ergibt, dann kann der Artikel DANACH ggf. wieder auf das deutsche Lemma verschoben werden. --Doc ζ 12:59, 24. Mai 2018 (CEST)
- "Geht gar nicht" ist kein inhaltliches Argument. "Stichprobenentnahme nach Wichtigkeit" ist aus anderen Gründen nicht gut. Das englische sampling ist viel weniger differenziert als die statistische Begriffsbildung im Deutschen. Sampling kann Stichprobenziehung aus einer endlichen Grundgesamtheit (typischerweise nicht i.i.d.), Stichprobenziehung im Sinn einer mathematischen (i.i.d.) Stichprobe und Zufallszahlenerzeugung (= künstliche Erzeugung von Zahlen, die als Realisierungen von i.i.d.-Zufallsvariablen mit einer gegebenen Wahrscheinlichkeitsverteilung gelten können) bedeuten. Importance Sampling ist eine spezielle Technik der Zufallszahlenerzeugumg bei der Monte-Carlo-Integration. Es mag sein, dass in der deutschen Fachliteratur kein Begriff etabliert wurde und überwiegend das englische Importance Sampling üblich ist. Eine vernünftige deutsche Bezeichnung wäre Gewichtete Zufallszahlenerzeugung, aber das wäre wohl WP:TF.
- In der Theorie der Stichprobenziehung gibt es viele gewichtete Verfahren (P-gewichtete Stichproben, Hansen-Hurwitz-Schätzer, Horvitz-Thompson-Schätzer, Auswahl mit ungleichen Wahrscheinlichkeiten usw.) diese werden aber nicht als importance sampling bezeichnet. Leider ist die Wikipedia bei allen Fragen der Stichprobentechnik völlig unterbelichtet und behandelt fast nur den Fall der i.i.d.-Stichprobe der mathematischen Statistik – so wie mathematische Statistik an mathematischen Fakultäten verstanden wird –. Hier ist etwas Literatur zur Stichprobentheorie zusammengestellt.
- Ich bin dafür, es vorläufig bei dem englischen Begriff Importance Sampling zu belassen. Zu hinterfragen wäre noch, ob es bei einer Eindeutschung und bewussten Bildung eines Anglizismus nicht Importance-sampling oder Importance-Sampling anstelle von Importance Sampling heißen muss.
- --Sigma^2 (Diskussion) 23:45, 2. Nov. 2023 (CET)
Definition
[Quelltext bearbeiten]Die Definition hat nichts (!) mit "importance sampling" zu tun, sondern deutet vage das allgemeine Prinzip der Schätzung eines Erwartungswertes durch den arithmetischen Mittelwert einer Zufallsstichprobe an, das vielen Monte-Carlo-Methoden zugrunde liegt. Beim importance sampling geht dagegen es darum, die Effizienz einer Standardmethode durch modifizierte Stichprobenziehungen zu verbessern. --Sigma^2 (Diskussion) 10:55, 13. Okt. 2023 (CEST)
- Hmm, en:Wiki hilft hier auch nicht oder überlese ich dort etwas? Falls du eine Definition hast, gerne eintragen! biggerj1 (Diskussion) 23:04, 13. Okt. 2023 (CEST)
- PS: wenn ich berechen will (mit , so kann ich das arithmetische Mittel doch nur als Schätzer benutzen, falls ich Realisierungen aus dieser Verteilung erzeugen kann, also gilt. Diese x sind dann auch nach Wichtigkeit in P gezogen: je größer die Wahrscheinlichkeiteisdichte, umso öfter taucht die entsprechende Realisierung auf. In der statistischen Physik ist P allerdings oft nicht apriori bekannt, sondern nur indirekt ... Daher kommt man dann auf Methoden wie MCMC um importance sampling zu ermöglichen. Was siehst du anders? Ich bin wie immer offen für deine Perspektive :) biggerj1 (Diskussion) 23:23, 13. Okt. 2023 (CEST)
- Wenn ich Realisierungen aus einer gegebenen Verteilung verwende ist dass noch kein importance sampling, erst wenn ich Realisierungen aus einer anderen Verteilung verwende. Bei MCMC werden noch zusätzlich nicht stochastisch unabhängige Beobachtungen verwendet, aber das ändert für mich nichts an der Grundideee des importance sampling.--Sigma^2 (Diskussion) 08:41, 3. Nov. 2023 (CET)
- PS: wenn ich berechen will (mit , so kann ich das arithmetische Mittel doch nur als Schätzer benutzen, falls ich Realisierungen aus dieser Verteilung erzeugen kann, also gilt. Diese x sind dann auch nach Wichtigkeit in P gezogen: je größer die Wahrscheinlichkeiteisdichte, umso öfter taucht die entsprechende Realisierung auf. In der statistischen Physik ist P allerdings oft nicht apriori bekannt, sondern nur indirekt ... Daher kommt man dann auf Methoden wie MCMC um importance sampling zu ermöglichen. Was siehst du anders? Ich bin wie immer offen für deine Perspektive :) biggerj1 (Diskussion) 23:23, 13. Okt. 2023 (CEST)
Hintergrund
[Quelltext bearbeiten]Der Abschnitt Hintergrund ist in Physiker-Chinesisch geschrieben und für Nichtphysiker in weiten Teilen unverständlich. Das Wort "Größe" wird für eine Zufallsvariable verwendet. ist ein "normiertes statistisches Gewicht". Was soll das sein? "Bolzmanngewicht" verlinkt auf einen Artikel, in dem das Wort noch nicht einmal auftaucht. "eine Größe im Zustand " Was soll das sein? usw. durch den gesamten Abschnitt.--Sigma^2 (Diskussion) 11:06, 13. Okt. 2023 (CEST)
- Ich verstehe das Stirnrunzeln :) hier eine grobe "Übersetzungshilfe" ohne Garantien:
- "Größe" meint Funktion, z.B. die potentielle Energie
- "Zustand" meint Zufallsvariable X, z.B. die Position
- "eine Größe im Zustand" meint Wert der Funktion bei einer speziellen Realisierung x der Zufallsvariable X
- normiertes statistisches Gewicht meint Wahrscheinlichkeitsdichte oder Wahrscheinlichkeit. (Man sagt es ganz gerne, weil häifig die Normierungskonstante (die Zustandssumme) unbekannt ist.... )
- Boltzmann-Faktor ist proportional zur Wahrscheinlichkeitsdichte (kommt aus der Statistische Mechanik , nach Ludwig Boltzmann ) biggerj1 (Diskussion) 23:00, 13. Okt. 2023 (CEST)