1.8 ベイズの定理

ベイズの定理は統計学・データサイエンスで頻出する定理であるため,基本的な考え方については,ぜひ抑えてもらいたい.

Theorem 1.4 (ベイズの定理) ABi,i=1,,kAの分割であるとする.この時任意のi(1ik)について,以下が成り立つ. P(Bi|A)=P(A|Bi)P(Bi)ki=1P(A|Bi)P(Bi)

まず前提として,全体事象に対してその分割を考えていることに注意されたい. また,ベイズの定理は条件付き確率と乗法公式を繰り返し用いることで導くこともできる.

まず,乗法公式(1.3)を変形してみると,

P(AB)=P(B)P(A|B)P(A|B)=P(AB)P(B)

と条件付き確率P(A|B)を,積事象ABと事象Bの確率の比として表せる.

これに注意して,簡単な場合としてA=(AB1)(AB2),(AB1)(AB2)=ϕを考えよう.すると条件付き確率P(B1|A)を変形していくと

P(B1|A)=P(AB1)P(A)=P(AB1)P(AB1)+P(AB2)=P(A|B1)P(B1)P(A|B1)P(B1)+P(A|B2)P(B2)

とできる.いまk=2の場合を考えたが,Aの分割がki=1ABiという場合がベイズの定理1.4そのものになっていることがわかる.

Exercise 1.7 (ベイズの定理) ある工場で3台の機械,A,B,Cで同じ製品を作っている.A,B,Cの機械でそれぞれ全体の製品の20%, 30%, 50%を生産している.また,A,B,Cの各機械からは,3%,2%,1%の不良品がでることが,経験的にわかっているとする.この時,ベイズの定理(1.1)式を用いて,次の問いに答えよ.

  1. 製品全体の中から1個を取り出した時,それが不良品である確率を求めよ.
  2. 製品全体の中から1個を取り出し,それが不良品であることが分かった時,その製品が機械Aによって生産されたものである確率はいくらか,同様に,機械B,Cで生産されたものである確率を求めよ.

この演習を取り組む際には,まず事象を整理しよう.まずある機械が製品を生産という事象が3種類A,B,Cがあり,それとは別に故障するという事象Eがあると考えておく. またそれぞれの確率は,

P(A)=0.2,,P(B)=0.3,,P(C)=0.5PA(E)=0.03,,PB(E)=0.02,,PC(E)=0.01

と整理できる.ここで,Pk(E)は機械kによって生産された製品が故障する確率とした.