2.7 分散
分散(variance)は期待値と並んで紹介されることが多く,頻用される概念なのでしっかり押さえておきたい. 分散は平均からの偏差の期待値として定義され,意味合いとしてはばらつき具合を表す指標となる.分散の値が大きいということは,平均から比較的離れた値も取りやすい.一方分散が小さい場合は平均まわりの値を比較的とりやすいことを意味する. ちなみに分散が0の場合は平均と同じ値しかとらないことを意味しており,定数の場合がこれに当たる.
2.7.1 分散の定義
確率変数Xに対して,分散V[X]は以下のように定義される.
Definition 2.3 (分散) 確率変数Xを考える.f(x)を確率関数,または確率密度関数とする.またμ=E[X]とするとき,分散V[X]は次のように定義される.
V[X]=E[(X−μ)2]
μはXの期待値であるが,この時点では変数ではなく定数であることに注意されたい.
分散とは,確率変数Xに対してT(X)=(X−μ)2という変換をした確率変数の期待値である.期待値の定義に基づけば
V[X]=E[(X−μ)2]=∫∞−∞(x−μ)2f(x)dx
となる.離散型の場合は離散型の期待値の定義に従って計算すれば良い.
分散は,慣習的にσ2で表されることが多い.特にσ=√σ2=√V[X]を標準偏差(standard deviation)という.これは分散に対して正の平方根を取ったものである.
(X−μ)2という確率変数の実現値の値は,もともとの確率変数の実現値の二乗のオーダーになっているため,スケールが変わってしまっている. これを修正するために正の平方根を取ることで,もともとの実現値のオーダーで散らばり具合を見ることができる.