Additive Glättung

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

In der Statistik bezeichnet das additive Glätten, auch bekannt als Laplace-Glättung, eine Technik zur Glättung von Zähldaten, um Probleme zu beseitigen, die durch das Auftreten der Häufigkeit 0 eines Ereignisses verursacht werden.

Gegeben seien die beobachtete Zahlen (Engl. counts) von verschiedenen Merkmalsausprägungen , dann ist der additiv geglätte Schätzer für die Parameter der Multinomialverteilung:

mit und ein Glättungsparameter.[1]

Man beachte, dass der additiv geglättete Schätzer der Parameter vom Maximum-Likelihood-Schätzer abweicht.

Ein Grund für den Einsatz der Glättung ist auch für bisher nicht beobachtete Ausprägungen () in generativen Modellen einen erzeugenden Pfad zu ermöglichen. Der geglättete Schätzer kann in der Bayesschen Statistik als Maximum-a-posteriori Schätzer betrachtet werden, der mithilfe einer Prior-Verteilung folgt.

Die Laplace-Glättung mit einem Glättungsparameter von kann intuitiv verstanden werden, da sie darauf hinweist, dass selbst für Ereignisse, die derzeit nicht beobachtet werden, mindestens eine Beobachtung vorhanden sein muss. Andernfalls würde man nichts über die Existenz des Ereignisses wissen.

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. Foster, D. (2020). Generatives Deep Learning: Maschinen das Malen, Schreiben und Komponieren beibringen. Deutschland: O’Reilly. Seite 18, https://books.google.de/books?id=WsDYDwAAQBAJ&pg=PA18