2.7 分散

分散(variance)は期待値と並んで紹介されることが多く,頻用される概念なのでしっかり押さえておきたい. 分散は平均からの偏差の期待値として定義され,意味合いとしてはばらつき具合を表す指標となる.分散の値が大きいということは,平均から比較的離れた値も取りやすい.一方分散が小さい場合は平均まわりの値を比較的とりやすいことを意味する. ちなみに分散が0の場合は平均と同じ値しかとらないことを意味しており,定数の場合がこれに当たる.

2.7.1 分散の定義

確率変数\(X\)に対して,分散\(V[X]\)は以下のように定義される.

Definition 2.3 (分散) 確率変数\(X\)を考える.\(f(x)\)を確率関数,または確率密度関数とする.また\(\mu = E[X]\)とするとき,分散\(V[X]\)は次のように定義される.

\[\begin{align} V[X] &= E[(X-\mu)^2] \end{align}\]

\(\mu\)\(X\)の期待値であるが,この時点では変数ではなく定数であることに注意されたい.

分散とは,確率変数\(X\)に対して\(T(X) = (X - \mu)^2\)という変換をした確率変数の期待値である.期待値の定義に基づけば

\[\begin{align} V[X] &= E[(X-\mu)^2] = \int_{-\infty}^{\infty} (x-\mu)^2 f(x) dx \end{align}\]

となる.離散型の場合は離散型の期待値の定義に従って計算すれば良い.

分散は,慣習的に\(\sigma^2\)で表されることが多い.特に\(\sigma = \sqrt{\sigma^2} = \sqrt{V[X]}\)標準偏差(standard deviation)という.これは分散に対して正の平方根を取ったものである.

\((X-\mu)^{2}\)という確率変数の実現値の値は,もともとの確率変数の実現値の二乗のオーダーになっているため,スケールが変わってしまっている. これを修正するために正の平方根を取ることで,もともとの実現値のオーダーで散らばり具合を見ることができる.

2.7.2 分散の性質

分散の計算にあたっては次の性質を利用することが多い.

Theorem 2.2 (分散の計算公式) 分散については以下の式が成り立つ.

\[\begin{align} \tag{2.5} V[X] &= E[X^2] - E[X]^2 \end{align}\]

\[\begin{align} \tag{2.6} V[X] &= E[X(X-1)] + E[X] - E[X]^2 \end{align}\]

確率関数や密度関数によっては分散を直接計算するよりも\(E[X^2]\)\(E[X(X-1)]\)を計算する方が比較的簡単な場合がある. そのようなケースにおいては,上記の公式は非常に有用である.

Exercise 2.4 (分散の計算公式の確認) (2.5)式と(2.6)式が成り立つことを確認せよ.