1.8 ベイズの定理

ベイズの定理は統計学・データサイエンスで頻出する定理であるため,基本的な考え方については,ぜひ抑えてもらいたい.

Theorem 1.4 (ベイズの定理) \(A \cap B_i, i=1,\ldots,k\)\(A\)の分割であるとする.この時任意の\(i(1 \leq i \leq k)\)について,以下が成り立つ. \[\begin{align} P(B_i | A) = \frac{P(A|B_i)P(B_i)}{\sum_{i=1}^{k} P(A|B_i)P(B_i)} \end{align}\]

まず前提として,全体事象に対してその分割を考えていることに注意されたい. また,ベイズの定理は条件付き確率と乗法公式を繰り返し用いることで導くこともできる.

まず,乗法公式(1.3)を変形してみると,

\[\begin{align} P(A \cap B) = P(B) P(A|B) \Leftrightarrow P(A|B) = \frac{P(A \cap B)}{P(B)} \tag{1.1} \end{align}\]

と条件付き確率\(P(A|B)\)を,積事象\(A \cap B\)と事象\(B\)の確率の比として表せる.

これに注意して,簡単な場合として\(A = (A \cap B_1) \cup (A \cap B_2), (A \cap B_1) \cap (A \cap B_2) = \phi\)を考えよう.すると条件付き確率\(P(B_1 | A)\)を変形していくと

\[\begin{align} P(B_1 | A) &= \frac{P(A \cap B_1)}{P(A)} \\ & = \dfrac{P(A \cap B_1)}{P(A \cap B_1) + P(A \cap B_2)} \\ &= \dfrac{P(A|B_1) P(B_1)}{P(A|B_1)P(B_1) + P(A|B_2)P(B_2)} \end{align}\]

とできる.いま\(k=2\)の場合を考えたが,\(A\)の分割が\(\displaystyle \bigcup_{i=1}^{k} A \cap B_i\)という場合がベイズの定理1.4そのものになっていることがわかる.

Exercise 1.7 (ベイズの定理) ある工場で3台の機械,\(A,B,C\)で同じ製品を作っている.\(A,B,C\)の機械でそれぞれ全体の製品の20%, 30%, 50%を生産している.また,\(A,B,C\)の各機械からは,3%,2%,1%の不良品がでることが,経験的にわかっているとする.この時,ベイズの定理(1.1)式を用いて,次の問いに答えよ.

  1. 製品全体の中から1個を取り出した時,それが不良品である確率を求めよ.
  2. 製品全体の中から1個を取り出し,それが不良品であることが分かった時,その製品が機械\(A\)によって生産されたものである確率はいくらか,同様に,機械\(B,C\)で生産されたものである確率を求めよ.

この演習を取り組む際には,まず事象を整理しよう.まずある機械が製品を生産という事象が3種類\(A,B,C\)があり,それとは別に故障するという事象\(E\)があると考えておく. またそれぞれの確率は,

\[\begin{align} P(A) = 0.2, \hspace{3mm}, P(B) = 0.3, \hspace{3mm}, P(C) = 0.5 \\ P_A(E) = 0.03, \hspace{3mm}, P_B(E) = 0.02, \hspace{3mm}, P_C(E) = 0.01 \end{align}\]

と整理できる.ここで,\(P_k(E)\)は機械\(k\)によって生産された製品が故障する確率とした.