4 確率の概念

本章では,確率について議論を進めていく.まず中学・高校の範囲でも扱っている 順列組み合わせについて確認し,その後集合と確率について議論を進める. また,条件付き確率やベイズの定理についても見ていく.

4.1 順列と組み合わせ

4.1.1 順列

異なるn個のものを右から全てを一列に一つずつ並べていくとして,その並び方は何通りあるだろうか. この場合は,最初の一つはn通り,次の一つはn1通り,と続いていく.このようにある整数n について,n×(n1)××2×1とししたものが,並べ方の場合の数となる. これを順列と呼ぶ.また,この計算のことをn!と表しnの階乗と呼ぶ.

n!=nk=1k=n×(n1)××2×1

次に,n個のうちr>0個を右から一列に並べていくことを考えよう.明らかに,計算上はn×(n1)××(nr+2)×(nr+1)とすれば良い.これをnPrと表す. これは,n!(nr)!で割ったものとして表すこともできるので

nPr=n!(nr)!

と表現されることが多い.

次にn個のうち,同じものがいくつかあった場合を考える.例えば赤玉がnred,白玉がnwhiteとする.これらを全て並べた時の場合の数はどうなるだろうか.この場合は,一度全てを異なるものとみなしておいて,その後で同じものの並び順を考慮するのが良い.

全てを異なると見なす場合,明らかにn=nrednwhiteの順列n!である. しかし,実際には赤玉,白玉は同じものであるので,同じ並べ方を重複して数え上げていることになる. 同じ色だけに着目した時,その並べ方はそれぞれnred!,nwhite!通りあるので, これだけ重複して数え上げていることがわかる.すなわち,この場合は

n!nred!nwhite!

と計算すれば良いことがわかる.さらに一般化すれば,k種類のものがそれぞれnk個ずつある場合, 全てを一列に並べる時の場合の数は

n!ki=1ni!

と計算することができる.

4.1.2 組み合わせ

次に組み合わせの数について考える.n個の異なるものからr個選ぶ時, その場合の数は幾つになるだろうか.これを表す記号としてnCr\displaystyle \binom{n}{r}が用いられる.

ここまでに見てきた順列_n P_rは,

  1. n個のものからr個のものを取り出す
  2. 取り出したr個のものを全て並べる

という2段階の行為として分解できる.それぞれ_n C_r通り,r!通りあることを考えると,

\begin{align} _n P_r = _n C_r \times r! \Longleftrightarrow _n C_r = \frac{_n P_r}{r!} = \frac{n!}{(n-r)! r!} \end{align}

とできる.これが組み合わせの場合の数を求める公式である.

Exercise 4.1 (誕生日問題)

  1. A~Fまでの数字が書かれたカードが1枚ずつある.このとき,この6枚を一列に並べる時の並べ方の総数はいくつか.
  2. ある箱に赤玉が6個,白玉が5個,黒玉が8個あるとする.このとき,全てを一つずつ取り出して一列並べたとき,その並べ方の総数はいくつか.
  3. 25人のクラスで,誕生日が全員異なる場合の数と全ての場合の数を求めて, その割合を求めよ.このとき簡単のため閏年は無視する. また計算にはRを用いて良い.

4.2 集合と確率

集合については第1回の講義で簡単に触れた. ここでは改めて集合について考えていき,その後確率を導入していく.

要素の集まりを集合と呼び,慣習的には大文字で表す.例えばある集合Aを考える. ある要素aが集合Aに含まれるか,または含まれないかを記号でそれぞれ

\begin{align} a \in A, \hspace{5mm} a \notin A \end{align}

と表す.また要素を一つも持たない集合を空集合と呼び\phiと表すことにする.

4.2.1 和集合と積集合

ある2つの集合A,Bを考える.この2つの集合に含まれる要素全ての集合を和集合と呼び, \begin{align} A \cup B \end{align}

と表す.また,2つの集合のどちらにも含まれる要素全ての集合を積集合と呼び,

\begin{align} A \cap B \end{align}

と表す.

次に一般にk個の集合A_i, i=1,\ldots,kを考えた時,これらの和集合・積集合をそれぞれ

\begin{align} \bigcup_{i=1}^{k} A_i, \hspace{5mm} \bigcap_{i=1}^{k} A_i \end{align}

と表す.この和集合は,少なくともどれかの集合A_iには含まれる要素全ての集合であり,積集合は全ての集合A_iに含まれている要素全ての集合となる.

4.2.2 分割

特に,集合A_i, i=1,\ldots,kのうち,どの二つの集合A_i, A_j, i \neq jに対して互い疎な時,つまりA_i \cap A_j = \phiが成り立つ時,\displaystyle \bigcup_{i=1}^{k} A_iA_i,i=1,\ldots,j分割されているという.

Exercise 4.2 (集合と分割) 次の集合に対して,分割であるような集合族と分割でない集合族をそれぞれ考えよ.

  1. \{ 1,2,3,4,5,6 \}
  2. 実数全体の集合\mathbb R

4.3 確率の公理

集合に対して確率を定義したい.ここでは次のように定義しよう. いま考えたい要素全体の集合を全体集合といいSとする.Sに属する要素をe_iと書き, 要素はk個あるものとする(k=\inftyでも構わない).

この時,P(e_i)が一つ与えられていて,

\begin{align} 0 \leq P(e_i) \leq 1, i=1,2,\ldots,k \\ \sum_{i=1}^{k} P(e_i) = 1 \end{align}

が成り立っているとする.これは単にこのようにするという約束事であり,このような約束事を公理と呼ぶ.

いまA \subset Sとして,このAに対する確率を考えたい.すなわちP(A)を考えたいが,これについては

\begin{align} P(A) = \sum_{e_i \in A} P(e_i) \end{align}

と定める.これは集合に含まれる要素の確率の和であり,自然のように思える. ただし,A = \phiの場合,Aには何の要素も含まれないため,

\begin{align} P(\phi) = 0 \end{align}

とする.また,明らかに

\begin{align} P(S) = 1 \end{align}

である.このように確率が定義された集合のことを,事象と呼ぶ. この時注意したいのは,確率を扱う場合には必ず確率を伴う全体集合Sがセットになっているということである. これは言語化してしまえば当たり前のことであるが,例えば,サイコロの出る目(1から6)の確率を考えている場合,よくあるものではP(i) = 1/6, i=1,\ldots,6という状況を考えており,確率の公理を満たしている. この時の全体集合はS=\{ 1,2,3,4,5,6 \}となっている.これは,もしサイコロの目が7だったら,とか サイコロを降ったら地震が起こる場合は,とか着目したいもの以外の現象が入る余地を排除しているのである. 逆に言えば,全体集合Sを考える際には,着目したい現象は漏れなく考慮しておくべきなのである.

Exercise 4.3 (確率の公理) サイコロの目1,2,3,4,5,6に対して,確率の公理を満たすように確率関数を定めよ.ただし,同様に確からしい場合,つまり全て1/6となる場合は除いて構成してみよう.

4.4 和事象・積事象の確率

全体集合S,二つの事象A,B \subset Sについて,A \cup B, A \cap Bの確率を考える. これについて以下が成り立つ.

Theorem 4.1 (和事象の確率) \begin{align} P(A \cup B) &= \sum_{e_i \in A \cup B} P(e_i) \\ &= \sum_{e_i \in A} P(e_i) + \sum_{e_i \in B} P(e_i) - \sum_{e_i \in A \cap B} P(e_i) \end{align}

明らかに,A \cap B = \phiのとき,P(A \cup B) = P(A) + P(B)が成り立つ. さらに一般化して,A_i \in S, i=1,\ldots,kかつA_i \cap A_j = \phi, i \neq jとして

\begin{align} P\left( \bigcup_{i=1}^{k} A_i \right) = \sum_{i=1}^{k} A_i \end{align}

が成り立つ.

4.5 余事象の確率

Definition 4.1 (余事象) 全体集合Sとその事象A \in Sを考える.この時,Aに対して余事象を以下のように定義する.

\begin{align} \overline A = S \setminus A \end{align}

ここで,S \setminus Aとは,集合Sから集合Aの要素を除いたものである.

明らかに,S = A \cup \overline Aが成り立つ.

Theorem 4.2 (余事象の確率) 余事象の定義4.1より,

\begin{align} P(\overline A) = 1 - P(A) \end{align}

Exercise 4.4 (余事象) 次の集合について,その余事象(補集合)を答えよ.

  1. 全体集合を\mathbb Rとして,[1,0]
  2. 全体集合を\mathbb Nとして,偶数全体の集合.

4.6 一般的な事象に対する確率

これまでに議論してきた事象とその確率について,改めて,なるべく一般的な議論に適用するように以下のようにまとめておく. まず,全体事象をS,その部分集合としての部分事象A_i \in S, i=1,\ldots,kとする. 空集合に対応する事象として空事象\phiとしておく(空事象は何も起こらないことではないことに注意されたい).

これらを踏まえて,本講義で扱う確率は,次の三つの公理を満たすものとする.

Definition 4.2 (確率の公理) 次の3つを確率の公理とする.

  1. 0 \leq P(A) \leq 1
  2. P(S) = 1, P(\phi) = 0
  3. A_i, i=1,\ldots,kかつA_i \cap A_j = \phi, i \neq j \Leftrightarrow \displaystyle P\left( \bigcup_{i=1}^{k} A_i \right) = \sum_{i=1}^{k} P(A_i)

4.7 条件付き確率

全体集合Sに対する部分事象A,Bを考える.この時,Bを与えたときのAの確率を上血b付き確率という. 例えば,B = \{ 晴れ, 雨 \}としてA = \{ 傘を持っていく, 傘を持って行かない \}としよう.直感的には,単純に傘を持っていくかどうかの確率と,天気がわかっている元での傘を持っていくかどうかの確率は異なると思える(雨とわかっているなら傘は持っていくし,晴れなら持って行かない確率の方が断然高いだろう).

これを数学的に次のように定義する.

Definition 4.3 (条件付き確率) Sの任意の部分事象A,Bを考える.ここではP(B) > 0とする.事象Bを与えた時の事象A条件付き確率

\begin{align} P(A|B) = \frac{P(A \cap B)}{P(B)} \end{align}

と定義する.

Exercise 4.5 (互いに疎な場合の条件付き確率) Sの任意の部分事象A,Bを考える.P(B) > 0A \cap B = \phiのとき,P(A|B)の値を求めよ.

最後に,積事象A \cap Bの確率を考えよう.

Theorem 4.3 (乗法公式) 積事象A \cap Bの確率は次のように求められる.

\begin{align} P(A \cap B) = P(B) P(A|B) \end{align}

さらに,もしP(A \cap B) = P(A)P(B)となるならば,A,B独立であるという.

A,Bが独立の時,P(A|B) = P(A)ということなので,Aで条件づけられたとしても,それは Bの確率に何ら関係ないことを意味している. その意味で,A,Bは独立ということなのである.この場合,同様にP(B|A) = P(B)も成り立つ.

Exercise 4.6 (条件付き確率) 2つのサイコロX,Yを投げることを考える.

  1. 1つ目のサイコロの目が3の時,2つのサイコロの目の積が12となる確率P(XY=12|X=3)を求めよ.また併せて,2つのサイコロの目の積が12となる確率P(XY=12)も求めよ.
  2. 1つ目のサイコロの目が偶数の時,2つのサイコロの目の和が8になる確率P(X+Y=8|X \in \{2,4,6\})を求めよ.

4.8 ベイズの定理

ベイズの定理は統計学・データサイエンスで頻出する定理であるため,基本的な考え方については,ぜひ抑えてもらいたい.

Theorem 4.4 (ベイズの定理) A \cap B_i, i=1,\ldots,kAの分割であるとする.この時任意のi(1 \leq i \leq k)について,以下が成り立つ. \begin{align} P(B_i | A) = \frac{P(A|B_i)P(B_i)}{\sum_{i=1}^{k} P(A|B_i)P(B_i)} \end{align}

まず前提として,全体事象に対してその分割を考えていることに注意されたい. また,ベイズの定理は条件付き確率と乗法公式を繰り返し用いることで導くこともできる.

まず,乗法公式4.3を変形してみると,

\begin{align} P(A \cap B) = P(B) P(A|B) \Leftrightarrow P(A|B) = \frac{P(A \cap B)}{P(B)} \tag{4.1} \end{align}

と条件付き確率P(A|B)を,積事象A \cap Bと事象Bの確率の比として表せる.

これに注意して,簡単な場合としてA = (A \cap B_1) \cup (A \cap B_2), (A \cap B_1) \cap (A \cap B_2) = \phiを考えよう.すると条件付き確率P(B_1 | A)を変形していくと

\begin{align} P(B_1 | A) &= \frac{P(A \cap B_1)}{P(A)} \\ & = P(A \cap B_1) + P(A \cap B_2) \end{align}

とできる.いまk=2の場合を考えたが,Aの分割が\displaystyle \bigcup_{i=1}^{k} A \cap B_iという場合がベイズの定理4.4そのものになっていることがわかる.

Exercise 4.7 (ベイズの定理) ある工場で3台の機械,A,B,Cで同じ製品を作っている.A,B,Cの機械でそれぞれ全体の製品の20%, 30%, 50%を生産している.また,A,B,Cの各機械からは,3%,2%,1%の不良品がでることが,経験的にわかっているとする.この時,ベイズの定理(4.1)式を用いて,次の問いに答えよ.

  1. 製品全体の中から1個を取り出した時,それが不良品である確率を求めよ.
  2. 製品全体の中から1個を取り出し,それが不良品であることが分かった時,その製品が機械Aによって生産されたものである確率はいくらか,同様に,機械B,Cで生産されたものである確率を求めよ.

この演習を取り組む際には,まず事象を整理しよう.まずある機械が製品を生産という事象が3種類A,B,Cがあり,それとは別に故障するという事象Eがあると考えておく. またそれぞれの確率は,

\begin{align} P(A) = 0.2, \hspace{3mm}, P(B) = 0.3, \hspace{3mm}, P(C) = 0.5 \\ P_A(E) = 0.03, \hspace{3mm}, P_B(E) = 0.02, \hspace{3mm}, P_C(E) = 0.01 \end{align}

と整理できる.ここで,P_k(E)は機械kによって生産された製品が故障する確率とした.