In der Statistik bezeichnet man als Produktsummenmatrix oder auch Momentenmatrix eine symmetrische Matrix , die sich aus dem Produkt der Datenmatrix mit ihrer Transponierten ergibt. Die Inverse der Produktsummenmatrix spielt bei der Berechnung des Kleinste-Quadrate-Schätzers und bei der Berechnung von Projektionsmatrizen eine große Rolle. Die Produktsummenmatrix misst die in den Regressoren enthaltene Information.
Die Produktsummenmatrix ist wie folgt definiert:
X
⊤
X
=
(
∑
x
t
1
2
∑
x
t
1
x
t
2
∑
x
t
1
x
t
3
⋯
∑
x
t
1
x
t
K
∑
x
t
2
x
t
1
∑
x
t
2
2
∑
x
t
2
x
t
3
⋯
∑
x
t
2
x
t
K
∑
x
t
3
x
t
1
∑
x
t
3
x
t
2
∑
x
t
3
2
⋯
∑
x
t
3
x
t
K
⋮
⋮
⋮
⋱
⋮
∑
x
t
K
x
t
1
∑
x
t
K
x
t
2
∑
x
t
K
x
t
3
⋯
∑
x
t
K
2
)
=
∑
x
i
x
i
⊤
{\displaystyle \mathbf {X} ^{\top }\mathbf {X} ={\begin{pmatrix}\sum x_{t1}^{2}&\sum x_{t1}x_{t2}&\sum x_{t1}x_{t3}&\cdots &\sum x_{t1}x_{tK}\\\sum x_{t2}x_{t1}&\sum x_{t2}^{2}&\sum x_{t2}x_{t3}&\cdots &\sum x_{t2}x_{tK}\\\sum x_{t3}x_{t1}&\sum x_{t3}x_{t2}&\sum x_{t3}^{2}&\cdots &\sum x_{t3}x_{tK}\\\vdots &\vdots &\vdots &\ddots &\vdots \\\sum x_{tK}x_{t1}&\sum x_{tK}x_{t2}&\sum x_{tK}x_{t3}&\cdots &\sum x_{tK}^{2}\end{pmatrix}}=\sum \mathbf {x} _{i}\mathbf {x} _{i}^{\top }}
,[ 1] [ 2]
wobei
X
{\displaystyle \mathbf {X} }
die Datenmatrix
X
=
(
x
11
x
12
⋯
x
1
k
⋯
x
1
K
x
21
x
22
⋯
x
2
k
⋯
x
2
K
⋮
⋮
⋱
⋮
⋱
⋮
x
t
1
x
t
2
⋯
x
t
k
⋯
x
t
K
⋮
⋮
⋱
⋮
⋱
⋮
x
T
1
x
T
2
⋯
x
T
k
⋯
x
T
K
)
{\displaystyle \mathbf {X} ={\begin{pmatrix}x_{11}&x_{12}&\cdots &x_{1k}&\cdots &x_{1K}\\x_{21}&x_{22}&\cdots &x_{2k}&\cdots &x_{2K}\\\vdots &\vdots &\ddots &\vdots &\ddots &\vdots \\x_{t1}&x_{t2}&\cdots &x_{tk}&\cdots &x_{tK}\\\vdots &\vdots &\ddots &\vdots &\ddots &\vdots \\x_{T1}&x_{T2}&\cdots &x_{Tk}&\cdots &x_{TK}\end{pmatrix}}}
darstellt.
Der Kleinste-Quadrate-Schätzer ergibt sich als Produkt der inversen Produktsummenmatrix mit dem Produkt von
X
⊤
{\displaystyle \mathbf {X} ^{\top }}
mit dem Vektor der endogenen Variablen:
b
=
(
b
1
b
2
b
3
⋮
b
K
)
=
(
∑
x
t
1
2
∑
x
t
1
x
t
2
∑
x
t
1
x
t
3
⋯
∑
x
x
1
x
t
K
∑
x
t
2
x
t
1
∑
x
t
2
2
∑
x
t
2
x
t
3
⋯
∑
x
t
2
x
t
K
∑
x
t
3
x
t
1
∑
x
t
3
x
t
2
∑
x
t
3
2
⋯
∑
x
t
3
x
t
K
⋮
⋮
⋮
⋱
⋮
∑
x
t
K
x
t
1
∑
x
t
K
x
t
2
∑
x
t
K
x
t
3
⋯
∑
x
t
K
2
)
−
1
⋅
(
∑
x
t
1
y
t
∑
x
t
2
y
t
∑
x
t
3
y
t
⋮
∑
x
t
K
y
t
)
=
(
X
⊤
X
)
−
1
X
⊤
y
{\displaystyle \mathbf {b} ={\begin{pmatrix}b_{1}\\b_{2}\\b_{3}\\\vdots \\b_{K}\end{pmatrix}}={\begin{pmatrix}\sum x_{t1}^{2}&\sum x_{t1}x_{t2}&\sum x_{t1}x_{t3}&\cdots &\sum x_{x1}x_{tK}\\\sum x_{t2}x_{t1}&\sum x_{t2}^{2}&\sum x_{t2}x_{t3}&\cdots &\sum x_{t2}x_{tK}\\\sum x_{t3}x_{t1}&\sum x_{t3}x_{t2}&\sum x_{t3}^{2}&\cdots &\sum x_{t3}x_{tK}\\\vdots &\vdots &\vdots &\ddots &\vdots \\\sum x_{tK}x_{t1}&\sum x_{tK}x_{t2}&\sum x_{tK}x_{t3}&\cdots &\sum x_{tK}^{2}\end{pmatrix}}^{-1}\cdot {\begin{pmatrix}\sum x_{t1}y_{t}\\\sum x_{t2}y_{t}\\\sum x_{t3}y_{t}\\\vdots \\\sum x_{tK}y_{t}\end{pmatrix}}=(\mathbf {X} ^{\top }\mathbf {X} )^{-1}\mathbf {X} ^{\top }\mathbf {y} }
.
Der Vektor der endogenen Variablen entspricht
y
=
(
y
1
y
2
⋮
y
t
⋮
y
T
)
{\displaystyle \mathbf {y} ={\begin{pmatrix}y_{1}\\y_{2}\\\vdots \\y_{t}\\\vdots \\y_{T}\end{pmatrix}}}
.
Die über n Summanden gemittelte Produktsummenmatrix konvergiert zu einer positiv definiten Matrix
V
{\displaystyle \mathbf {V} }
,
lim
n
→
∞
X
n
⊤
X
n
n
=
V
{\displaystyle \lim _{n\to \infty }{\frac {\mathbf {X} _{n}^{\top }\mathbf {X} _{n}}{n}}=\mathbf {V} }
,
die bei der Bestimmung der asymptotischen Eigenschaften des KQ-Schätzers eine wichtige Rolle spielt.
↑ Winfried Schröder: Data Mining: Theoretische Aspekte und Anwendungen , S. 136
↑ Gholamreza Nakhaeizadeh: Neuere statistische Verfahren und Modellbildung in der Geoökologie , S. 113
Spezielle Matrizen in der Statistik