Multivariate Verfahren

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Multivariate Statistik)
Zur Navigation springen Zur Suche springen

Mit Hilfe von multivariaten Verfahren (auch multivariate Analysemethoden) werden in der multivariaten Statistik mehrere statistische Variablen oder Zufallsvariablen zugleich untersucht. Beispielsweise können für Fahrzeuge die Variablen Anzahl der Sitze, Gewicht, Länge usw. erhoben werden. In der univariaten Analyse hingegen wird jede Variable einzeln analysiert.

Zusammenhangs- bzw. Abhängigkeitsstrukturen zwischen den Variablen, z. B. größere Anzahl von Sitzen bedingt ein größeres Gewicht, können nur mit einer multivariaten, nicht aber mit einer univariaten Analyse erkannt werden.

Multivariate Verfahren wollen im Wesentlichen die in einem Datensatz enthaltene Zahl der Variablen und/oder Beobachtungen reduzieren, ohne die darin enthaltene Information wesentlich einzuschränken. Dazu wird die (Zusammenhangs-)Struktur der Daten analysiert. Entweder gibt man eine Struktur vor und prüft, ob die Daten mit der vorgegebenen Struktur zusammenpassen (Strukturprüfende Verfahren: Teil der induktiven Statistik), oder man versucht, die Struktur aus den Daten zu extrahieren (Strukturentdeckende Verfahren: Teil der explorativen Statistik).

Die klassischen Verfahren sind durchweg lineare Modelle, die besondere Anforderungen an die verwendeten Daten stellen. So sollten die Daten ausreißerfrei und nicht asymmetrisch verteilt sein. Weichen die Daten von der geforderten Struktur ab, behilft man sich beispielsweise, indem man vorhandene Ausreißer entfernt oder die Daten einer nichtlinearen Transformation, etwa dem Logarithmieren, unterzieht.

Es existieren alternative Methoden, die iterativ gewonnene Lösungen ermöglichen. Häufig verwendete Kriterien für optimale Lösungen sind

Die manuelle Berechnung multivariater Verfahren ist meist sehr aufwändig. Daher erfuhren diese Methoden erst mit der Entwicklung der EDV ihren Aufschwung.

Die Ergebnisse erlauben häufig keine Rückschlüsse auf zugrundeliegende Daten. Beispielsweise können bei Ergebnissen nur wenige Angaben über zugrundeliegende Wahrscheinlichkeitsverteilungen gemacht werden.

Strukturentdeckende Verfahren

[Bearbeiten | Quelltext bearbeiten]

Strukturentdeckende Verfahren sind z. B.

Strukturprüfende Verfahren

[Bearbeiten | Quelltext bearbeiten]
Beispiele für Strukturprüfende Verfahren
Skalenniveau der unabhängige Variablen
abhängige Variable Metrisch Kategoriell
Metrisch Multiple lineare Regression Varianzanalyse, Dummy-Variablen-Regression
Kategoriell Diskriminanzanalyse, Logistische Regression Log-lineares Modell

Im Rahmen der Regressionsanalyse für eine abhängige Variable und mehrere unabhängige Variablen werden verallgemeinerte lineare Modelle eingesetzt, um den Skalenniveaus der abhängigen und unabhängigen Variablen Rechnung zu tragen. Dazu gehören z. B. die multiple lineare Regression, die Logistische Regression (Logit-Modell) und die Log-linearen Modelle usw.

Weitere Strukturprüfende Verfahren sind

Grafische Darstellung

[Bearbeiten | Quelltext bearbeiten]
Karte von Charles Minards aus dem Jahre 1869. Diese zeigt den Verlust an Soldaten, die Truppenbewegungen und die Temperaturen im Laufe von Napoleons Russlandfeldzug. Lithographie, 62 × 30 cm.

Für die Darstellung mehrerer Variablen wurden eine ganze Reihe von speziellen Grafikdarstellungen entwickelt. Eine der berühmtesten frühen multivariaten Grafiken ist die Karte von Charles Joseph Minard aus dem Jahre 1869 über den Russlandfeldzug Napoleons.

Menschen können nicht mehr als drei Dimensionen sehen; an einem Bildschirm in der Regel sogar nur zwei Dimensionen. Hochdimensionale Daten können daher häufig nicht ohne Informationsverluste dargestellt werden.

Spezielle Darstellungsmethoden sind:

Beispiele für Verwendung von Multivariaten Verfahren:

  • Um psychologische Profile zu erstellen und aufgrund von Vergleichen herauszufinden, wer der wahrscheinlichste Täter/Sprecher/Autor ist (Kriminologie, Sprachwissenschaft).
  • Um den Text eines anonymen Autors zu vergleichen mit Texten von bekannten Autoren und den wahrscheinlichsten Autor zu finden (eine Spielart des zuerst genannten Punktes).
  • Data-Mining: Große Datenmengen in Datenbanken werden auf unbekannte Strukturen hin analysiert. Man erhofft sich hier Erkenntnisse über das Zusammenwirken verschiedener Aspekte, beispielsweise die Konsumausgaben von Kunden in Abhängigkeit vom sozialen Status durch Herausfinden von Ähnlichkeitsstrukturen.
  • Entwicklung von sozialen Abstimmungsprozessen (Politische Soziologie) und der Einfluss einzelner Akteure darauf.
  • Bonitätsprüfungen von Schuldnern (Diskriminanzanalyse).
  • Bei der Wertpapieranalyse: Welche Unternehmenszahlen beeinflussen hauptsächlich die Ertragskraft eines Unternehmens? (Faktorenanalyse)
  • Bei der Suche nach Ursachen für die Eiszeiten (Faktorenanalyse)
  • In der Radioastronomie für die Signalanalyse bei SETI.[2]
  • Für die Analyse von Peak-förmigen Daten eignet sich das Indirect-Hard-Modeling-Verfahren.
  • Heinz Ahrens, Jürgen Läuter: Mehrdimensionale Varianzanalyse. Hypothesenprüfung, Dimensionserniedrigung, Diskrimination bei multivariaten Beobachtungen. Akademie-Verlag, Berlin 1974.
  • Peter Atteslander: Methoden der empirischen Sozialforschung. 11., neu bearbeitete und erweiterte Auflage. Schmidt, Berlin 2006, ISBN 3-503-09740-6 (Grundlagenwissen).
  • Klaus Backhaus, Bernd Erichson, Wulff Plinke, Rolf Weiber: Multivariate Analysemethoden. Eine anwendungsorientierte Einführung. 11., überarbeitete Auflage. Springer, Berlin u. a. 2006, ISBN 3-540-27870-2.
  • Anthony P. M. Coxon, Peter M. Davies: The User’s Guide to Multidimensional Scaling. With Special Reference to the MDS(X) Library of Computer Programs Heinemann Educational Books, London 1982, ISBN 0-423-82252-7.
  • Fergus Daly, David Hand, Chris Jones, Daniel Lunn, Kevin J. McConway: Elements of Statistics. The Open University u. a., Harlow u. a. 1995, ISBN 0-201-42278-6.
  • Ludwig Fahrmeir, Gerhard Tutz: Multivariate Statistical Modelling Based on Generalized Linear Models. 2. Auflage. Springer, New York u. a. 2001, ISBN 0-387-95187-3.
  • Andreas Handl, Torben Kuhlenkasper: Multivariate Analysemethoden. Theorie und Praxis mit R. 3., wesentlich überarbeitete Auflage. Springer Spektrum, Berlin 2017, ISBN 978-3-662-54753-3.
  • Wojtek J. Krzanowski: Principles of Multivariate Analysis. A User’s Perspective (= Oxford Statistical Science Series. 22 (recte: 23)). Revised edition. Oxford University Press, Oxford u. a. 2000, ISBN 0-19-850708-9.
  • Kantilal V. Mardia, John T. Kent, John M. Bibby: Multivariate Analysis (= Probability and Mathematical Statistics. A Series of Monographs and Textbooks.). Academic Press, Amsterdam u. a. 2006, ISBN 0-12-471252-5.
  • Barbara G. Tabachnick, Linda S. Fidell: Using Multivariate Statistics. 5. edition, international edition. Allyn & Bacon, Boston MA u. a. 2007, ISBN 978-0-205-46525-5.

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. Studentische Arbeit der HU Berlin
  2. KLT-optimized telecomunications. In: Claudio Maccone: Deep space flight and communications. Springer, Berlin 2009, ISBN 978-3-540-72942-6, S. 149–248; Innovative SETI by the KLT (PDF) abgerufen am 7. Juli 2010