2.7 射影
統計学における射影とは,線形変換の特別な場合を指す.これは例えば光によって影が地面にできるようなものと捉えることもできる. 現実の3次元的な空間にある物体が,地面という2次元的な空間に写されたものが影であるというイメージである.
まず射影を紹介する前に,直和に関する概念を導入する.
Definition 2.12 (直和分解・直交直和分解・直交補空間) VをRnの部分ベクトル空間として,Vの部分ベクトル空間W1,W2との直和の意味でV=W1,W2と表せるとする.
このとき,VとW1とW2に分解することを直和分解という.すると{}^{\forall}\boldsymbol v \in Vに対して{}^{\exists}\boldsymbol w_1 \in W_1, \boldsymbol w_2 \in W_2が存在して一意に定まる.
さらに,もし{}^{\forall}\boldsymbol w_1 \in W_1, \boldsymbol w_2 \in W_2について,\boldsymbol w_1^{\top} \boldsymbol w_2 = 0が成り立つならば,W_1, W_2をVの直交直和分解と呼び
\begin{align} V = W_1 \oplus W_2 \end{align}
と表す.また,このようなW_1, W_2は一方から見て他方を直交補空間と呼ぶ.例えば「W_2はW_1の直交補空間である」などという.
直和の記号\oplusはあまり見慣れないと思うが分からなくなった際は講義資料の記号一覧を参照してほしい.
2.7.1 射影と直交射影
次に射影の定義を与える.
Definition 2.13 (射影) ベクトル空間Vに対してその直和分解V=W_1+W_2を与える部分ベクトル空間W_1, W_2を考える.この時,
\begin{align} f_{W_1}:V \longrightarrow W_1, \hspace{5mm} f_{W_2} = V \longrightarrow W_2 \end{align}
という2つの写像f_{W_1}, f_{W_2}をそれぞれVからの射影という.
このとき,{}^{\forall}\boldsymbol x \in Vについて,ある\boldsymbol w_1 \in W_1, \boldsymbol w_2 \in W_2が存在して,\boldsymbol x = \boldsymbol w_1 + \boldsymbol w_2と一意に分解することができて,さらにf_{W_1}(\boldsymbol x) = \boldsymbol w_1, f_{W_2}(\boldsymbol x) = \boldsymbol w_2が成り立つ.
ここで定義された射影はより一般的な概念となっている.特に統計学や機械学習と関係性が深いものとし,射影の特別な場合である直交射影が挙げられる.
Definition 2.14 (直交射影) ベクトル空間Vとその直交直和分解V=W_1 \oplus W_2を考える.この時,
\begin{align} f_{W_1}:V \longrightarrow W_1, \hspace{5mm} f_{W_2} = V \longrightarrow W_2 \end{align}
をそれぞれ,VからW_1またはW_2への直交射影という.
つまり,直交射影とは射影を構成する直和分解が直交直和分解となっている特別な場合とみなせる.
Theorem 2.10 (直交射影と正規直交基底) ベクトル空間Vとして,その直和分解V = W_1 \oplus W_2を考える.W_1の正規直交基底として\{ 1_{m},\ldots,1_{\boldsymbol v} \}とするとき,{}^{\forall}\boldsymbol x \in VのW_1への直交射影P_{W_1}(\boldsymbol x)は
\begin{align} P_{W_1}(\boldsymbol x) = \sum_{i=1}{m}\boldsymbol v_i (\boldsymbol v_i^{\top}\boldsymbol x) \end{align}
で与えられる.これは
\begin{align} P_{W_1}(\boldsymbol x) = V_{W_1}V_{W_1}^{\top} \boldsymbol x \end{align}
とも表現できる.ただし,V = \{ 1_{m},\ldots,1_{\boldsymbol v} \}である.
A = V_{W_1}V_{W_1}^{\top}とすれば,Aは\boldsymbol xをW_1へ写す線形写像であるので,直交射影も線形写像の一つであることがわかる.
直交射影の大切な性質として,
\| \boldsymbol x - f(\boldsymbol x) \|^2, \hspace{5mm} \boldsymbol x \in V, f(\boldsymbol x) \in W_1 を最小にするfを構成することが知られている.これは最良近似性と呼ばれる.
2.7.2 射影行列
先ほど紹介したような行列A = V_{W_1}^{\top}V_{W_1}を冪(べき)乗を考えてみると,AA = V_{W_1}^{\top}V_{W_1} V_{W_1}^{\top}V_{W_1} = V_{W_1}^{\top} I V_{W_1} = Aとなり,AにAを何度かけてもAになるという性質を持つことがわかる.この性質によって行列を特徴づけたものを射影行列と呼ぶ.
Definition 2.15 (射影行列) A \in \mathbb R^{n}についてA^2 = AA = Aが成り立つならばAは射影行列であるという.
特に直交射影に対応するような射影行列を直交射影行列と呼ぶこともある.
Theorem 2.11 (ベクトル空間の基底による射影行列) n次元のベクトル空間\mathbb R^{n}の直交直和分解W_1 \oplus W_2を考える. W_1, W_2それぞれの基底を\{ \boldsymbol w_{1},\ldots,\boldsymbol w_{m} \},\{ \boldsymbol w_{m+1},\ldots,\boldsymbol w_{n} \}としておく.このときそれぞれの基底から構成される行列A=(\boldsymbol w_{1},\ldots,\boldsymbol w_{m}), B = (\boldsymbol w_{m+1},\ldots,\boldsymbol w_{n})とする.
このとき,\mathbb R^{r}からW_1, W_2それぞれの直交射影行列P_{W_1}, P_{W_2}は
\begin{align} P_{W_1} &= A(A^{\top}A)^{-1}A^{\top} \\ P_{W_2} &= B(B^{\top}B)^{-1}B^{\top} = I_n - A(A^{\top}A)^{-1}A^{\top} \end{align}
で与えられる.
Theorem 2.12 (射影行列の性質) いま,\mathbb R^{n} = W_1 \oplus W_2とする.W_1,W_2をそれぞれm次元,n-m次元の空間として,\mathbb R^{n}からの射影行列をP_{W_1}, P_{W_2}とする.このとき以下が成り立つ.
- P_{W_i} = P_{W_i}^{\top}, i=1,2
- P_{W_i}, i=1,2は冪等行列である.
- \text{tr }P_{W_1} = m, \text{tr }P_{W_2} = n-m
Exercise 2.6 (射影行列の性質) P_{W_1}, P_{W2}がそれぞれべき等行列であることを確かめよ. ここでべき等行列とはあるn次正方行列Aに対してA^2 = Aが成り立つことである.