2.1 確率変数・確率分布

\(X\)がいくつかの値\(x_i, i=1,\ldots,k\)のいずれかを取る変数とする（\(k=\infty\)でもよい）．この時，以前議論したように\(x_i\)に対して確率を定義してみよう．

変数\(X\)が\(x_i\)という値を取る，という事象を\(e_i\)として，全体事象\(S = \{e_1,\ldots,e_k \}\)を考える．そして\(P(X=x_i) = P(e_i)\)を確率の公理を満たすように定める．このようにして定められた\(X\)に関する確率を，\(X\)の確率分布と呼ぶ．単に分布と呼ぶこともある．また，確率分布が与えられている変数\(X\)のことを確率変数と呼ぶ．

2.1.1 確率関数

確率変数はあくまで「変数」であり，値を決まった時，\(x_1,\ldots,x_k\)のどれかひとつに定まる．確率分布は\(P(e_i)\)によって与えられるが，直接的に \[\begin{align} \tag{2.1} P(x) = P(X=x) \end{align}\] と定義すると，\(P(e_i)=P(x_i), i=1,\ldots,k\)となる．このように\(x\)の関数として考えられた\(P(x)\)を確率関数と呼ぶ．ただし\(P(x)\)は以下を満たすとする， \[\begin{align} \tag{2.2} 0 \leq P(x) \leq 1 \\ \sum_{x} P(x) = 1 \end{align}\]

確率変数はどんな値を取るのかは確定的ではないので，実際に確率変数が取った具体的な値を明確に区別するために実現値と呼んでおこう．慣習的に確率変数は\(X,Y\)のような大文字で表現する一方，実現値は\(x,y\)のように小文字で書く．

Example 2.1 (確率関数) サイコロを一つ，一回振った時に出る目の数に対応する確率変数\(X\)を考える．この時実現値は1から6までの整数で，確率変数は\(P(x) = 1/6, x=1,\ldots,6\)である．この確率関数は確率の公理を満たしている．

2.1.2 確率変数の型

これまで，例としては確率変数としての実現値を整数のような離散の値を見てきたが，言及しているように実現値の種類は無限個でも良い．離散の値を取る確率変数を離散型確率変数（discrete random variable）と呼び， \(x \in [0,1]\)のようなある区間の値（連続的な値）を実現値に持つ確率変数を連続型確率変数（continuous random variable）と呼ぶ．

実現値が有限個として\(k\)個であれば，例えば\(P(x) = 1/k\)とすれば確率関数を定義できる．しかし実現値が無限個の場合を考えると，同様に確率関数を定義した場合\(P(x) = 1/\infty = 0\)となり，どんな実現値であってもその値を取る確率が\(0\)となってしまうように思える．そのため，連続型確率変数を扱う場合は，事象の考え方を変えて，\(a \leq X \leq b\)という幅を考えて，この事象に対して確率を考えていくことになる．

まず，任意の\(a,b\)に対して，\(P(a \leq X \leq b)\)を与えるような確率関数を考える必要がある．これには積分を用いて次のような関数を考えれば良いことがわかっている．

\[\begin{align} \tag{2.3} f(x) &\leq 0, \ -\infty < x < \infty \\ \int_{-\infty}^{\infty} &f(x) dx = 1 \end{align}\]

これは\(f(x)\)が非負の関数で全区間で積分の値が1であることを要請している．この関数を用いれば，先ほどの\(P(a \leq X \leq b)\)は，\(a\)から\(b\)までの区間の定積分\(\int_a^b f(x) dx\)の値と対応させればうまくいきそうである．すなわち

\[\begin{align} \tag{2.4} P(a \leq X \leq b) = \int_a^b f(x) dx \end{align}\]

で定義する．こうすると，\(X\)の事象だけでなく，和事象，積事象や余事象の操作で生まれるどんな事象についても扱うことが可能になる．

ただし，このように定義したとしても連続型の確率変数における唯一点\(a\)の確率\(P(X=a) = \int_a^a f(x) dx = 0\)であることに変わりはない．その代わり区間で考えるようにしなければいけないことに注意しよう．

このように連続型確率変数に対する確率関数を離散型のそれと明確に区別して確率密度関数（probability density function）と呼ぶ．ただし確率分布については離散・連続型で特に区別せず確率分布と呼ぶ．離散・連続型を明確に言及する場合は，離散型確率分布，連続型確率分布などと呼ぶ．