2.3 確率変数の変数変換

確率変数\(X\)をある関数\(T(x)\)によって新たな確率変数\(Y=T(X)\)を作ることを考えよう. このとき,\(X\)の型(連続・離散)と\(Y\)の型は一致する. このように作られた確率変数についてその確率関数・確率密度関数はどのように表されるだろうか.

2.3.1 離散型の場合

離散型の場合は,\(X\)の実現値\(x_1, \ldots, x_k\)に対応して\(y_i = T(x_i), i=1,\ldots,k\)が確率変数\(Y\)の実現値になる.このとき

\[\begin{align} A_j = \{x | T(x) = y_j \}, \ j=1,\ldots,m \end{align}\]

とするとこれは\(Y=y_j\)という事象に対応する\(x\)の集合であるが,もし\(T(x)\)が単射であれば \(x\)は唯ひとつに定まるが,そうでなければ\(x\)は複数存在する場合がある.

一方,確率変数\(Y\)についてはそれに対応する確率関数\(P_Y(t)\)が存在して確率の公理を満たさなければいけない.このときこの関数は

\[\begin{align} P_Y(y_j) = \sum_{x \in A_j} P_X(x), \ j=1,\ldots,m \end{align}\]

となる.

実際には\(T(x)\)の性質に大きく依存する議論であるが,ここでは\(T(x)\)は比較的単純な関数であるとしておく.

Exercise 2.2 (離散型確率変数の変数変換) 確率変数\(X\)をサイコロを振って出た目と対応させる.この時,次のような変換を考える.

\[\begin{align} T(x) = \begin{cases} 1, & x = 1,2,3 \\ 2, & x = 4,5 \\ 3, & x = 6 \end{cases} \end{align}\]

この時,確率変数\(Y=T(X)\)についての確率関数を求めよ.ただしサイコロの出る目の確率は全て\(1/6\)とする.

2.3.2 連続型の場合

連続型の場合について考えていく.ここでは\(y=T(x)\)は単調増加関数で,微分可能な逆関数\(x = T^{-1}(y)\)が存在するとする.

いま\(Y=T(X)\)という変換により定まる確率変数\(Y\)の確率密度関数\(f_Y(y)\)は次のようになる.

\[\begin{align} \int_a^b f_Y(y) dy &= P(a \leq Y \leq b) \\ &= P \bigl( T^{-1}(a) \leq T(X) \leq T^{-1}(b) \bigr) \\ &= \int_{T^{-1}(a)}^{T^{-1}(b)} f_X(x) dx \\ &= \int_{a}^{b} f_X (T^{-1}(y)) \frac{\displaystyle d T^{-1}(y)}{dy} dy \end{align}\]

となる.この式変形では置換積分を用いている.これは

\[\begin{align} f_Y(y) = f_X(T^{-1}(y)) \frac{d T^{-1}(y)}{dy} \end{align}\]

を意味している.これが(2.2)式を満たしているか確認しておこう. \(T(x)\)が単調増加関数なので\(T^{-1}(y)\)も単調増加となり,

\[\begin{align} f_Y(y) \leq 0 \end{align}\]

である.また\(f_Y(y)\)の全区間での積分は

\[\begin{align} \int_{-\infty}^{\infty} f_Y(y) dy &= f_X(x) dx = 1 \end{align}\]

となる.