Benutzer:SuPich/Mittlere absolute Abweichung

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Die mittlere absolute Abweichung (englisch mean absolute deviation, kurz MAD oder MD) ist ein Streuungsmaß in der deskriptiven Statistik und gibt ähnlich wie die empirische Varianz an, wie sehr die Stichprobe um ihren Mittelpunkt streut. Als Mittelpunkt wird je nach Definition das arithmetisches Mittel oder der Median verwendet. Im Gegensatz zur empirischen Varianz wird jedoch bei der mittleren absoluten Abweichung der Abstand zum Mittelpunkt nicht quadratisch gewichtet, sondern nur dem Betrage nach. Große Abweichungen vom arithmetischen Mittel fallen daher nicht so stark ins Gewicht.

Gegeben sei eine Stichprobe mit Elementen. Es sei dessen arithmetisches Mittel und dessen Median.

  • Die mittlere absolute Abweichung vom arithmetischen Mittel ist definiert als:[1][2][3]
, also als arithmetisches Mittel der absoluten Abweichungen vom arithmetischen Mittel der Stichprobe.
  • Die mittlere absolute Abweichung vom Median ist entweder definiert als:[4][5]
, also als arithmetisches Mittel der absoluten Abweichungen vom Median der Stichprobe;[4] Oder als:
, also als Median der absoluten Abweichungen vom Median der Stichprobe.

Für alle diese Definitionen wird auch die Notation oder verwendet; weiter existiert für die mittlere absolute Abweichung vom Median auch die Notation .

Gegeben sei die Stichprobe

,

es ist also .

Mittlere absolute Abweichung vom arithmetischen Mittel

[Bearbeiten | Quelltext bearbeiten]

Für das arithmetische Mittel ergibt sich

.

Damit ist die mittlere absolute Abweichung vom arithmetischen Mittel:

Mittlere absolute Abweichung vom Median

[Bearbeiten | Quelltext bearbeiten]

Als sortierte Stichprobe erhält man

,

somit ist der Median

.

Für die mittlere absolute Abweichung vom Median, nach der ersten Definition, ergibt sich:

Für die mittlere absolute Abweichung vom Median nach der zweiten Definition benötigt man die sortierte Liste der absoluten Abweichungen:

Somit ist nach dieser Definition

.

Insbesondere liefern alle drei Definitionen im Allgemeinen nicht dieselben Werte.

Betrachtet man die mittlere absolute Abweichung von einem beliebigen Wert , also

,

so ist minimal, wenn der Median ist.[6] Ein analoges Resultat gilt auch für die mittlere quadratische Abweichung von einem Wert : sie wird genau dann minimal, wenn das arithmetische Mittel ist. In diesem Sinne ist die mittlere absolute Abweichung ein natürliches Streumaß um den Median, ebenso wie die mittlere quadratische Abweichung ein natürliches Streumaß um das arithmetische Mittel ist.

Die mittlere absolute Abweichung vom Median ist ein robustes Streuungsmaß, es ist also deutlich unempfindlicher gegenüber Ausreißern als etwa die Standardabweichung. Dies liegt an der Verwendung des robusten Medians. Besonders relevant ist dies, wenn eine Regel für das Entfernen von Ausreißern aus einem Datensatz gefunden werden soll: Das übliche Verfahren, alle Werte, die mehr als drei Standardabweichungen vom arithmetischen Mittel entfernt sind, zu streichen, ist insofern problematisch, als dass Standardabweichung und Mittel selbst durch Ausreißer verzerrt sein könnten. Ein deutlich unempfindlicheres Verfahren wäre, alle Werte zu streichen, die mehr als das k-fache des MedAD vom Median abweichen, wobei k ein von der Wahrscheinlichkeitsverteilung abhängiger Faktor ist.[7]

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. Eric W. Weisstein: Mean Deviation. In: MathWorld (englisch).
  2. Reinhold Kosfeld, Hans Friedrich Eckey, Matthias Türck: Deskriptive Statistik. Grundlagen – Methoden – Beispiele – Aufgaben. 6. Auflage. Springer Gabler, Wiesbaden 2016, ISBN 978-3-658-13639-0, S. 118, doi:10.1007/978-3-658-13640-6.
  3. Norbert Henze: Stochastik für Einsteiger. Eine Einführung in die faszinierende Welt des Zufalls. 10. Auflage. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-658-03076-6, S. 32, doi:10.1007/978-3-658-03077-3.
  4. a b Helge Toutenburg, Christian Heumann: Deskriptive Statistik. 6. Auflage. Springer-Verlag, Berlin/Heidelberg 2008, ISBN 978-3-540-77787-8, S. 74, doi:10.1007/978-3-540-77788-5.
  5. Thomas Cleff: Deskriptive Statistik und Explorative Datenanalyse. Eine computergestützte Einführung mit Excel, SPSS und STATA. 3., überarbeitete und erweiterte Auflage. Springer Gabler, Wiesbaden 2015, ISBN 978-3-8349-4747-5, doi:10.1007/978-3-8349-4748-2.
  6. Ehrhard Behrends: Elementare Stochastik. Ein Lernbuch – von Studierenden mitentwickelt. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-8348-1939-0, S. 275, doi:10.1007/978-3-8348-2331-1.
  7. Leys, C., et al: Detecting outliers: Do not use standard deviation around the mean, use absolute deviation around the median. In: Journal of Experimental Social Psychology. Band 49, Nr. 4, 2013, S. 764–766, doi:10.1016/j.jesp.2013.03.013 (englisch, ulb.ac.be [PDF]).