プログラミング

ベイズの定理をパチンコでたとえる

投稿日:

こんにちは。

整形外科医師ブロガーのボククボです。

今回は、数学のお話です。

ベイズの定理とは、事後確率を求める公式ですが、

機械学習による分類モデルにも応用されます。

単純ベイズ分類器について理解するには、
ベイズの定理をがっちり理解することが重要です。

というわけで、誰にでも?わかるように

パチンコを例に解説しようと思います。

  • パチンコばっかりやって試験に落ちそうな大学生
  • 学校の授業で事後確率が理解できなかった高校生
  • 機械学習について勉強中だけど全然わからん

などの方に読んでいただけると幸いです。

事後確率とは?

事後確率なんて言うと、生活に不要な概念に思えますが、

パチンコで例えると

【激熱リーチが来た後で、大当たりする確率】

です。

激熱リーチが来てるんだから、平場より
大当たりしてる確率も跳ね上がってるだろ!

と思いますよね。

その跳ね上がった確率のことです。
パチスロ雑誌では、演出信頼度と書いてあります。

ちなみに
【激熱リーチ】というのを数学的に表現すると、

  • 大当たり時に高確率で出現する
  • ハズレ時に低確率で出現する

リーチ演出という定義になります。

上の二つの事象は、合わせても低確率になりますので

激レアリーチ=激熱リーチ

ということになります。

(まあ、理論上はハズレ時にのみ
稀にでるリーチってのもありうるのですが。。)

補足:実はリーチ演出の方が後ですが

一応パチンコ台の抽選方法に関する補足です。
混乱する方は読み飛ばしていただいてかまいません。

パチンコは、
ヘソに玉が入った瞬間に大当たりかどうか
決定しています。

激熱リーチ演出を目にするのは、
大当たり抽選が済んでいる後ですが、

便宜上、リーチ後に大当たりが
出現しているものとして考えます。

事後(リーチ後)の大当たり確率を事後確率と呼ぶことにします。

ベイズの定理

A=激熱リーチ(全回転リーチとでもしますか)
B=大当たり

と名付けると

【全回転リーチが来た後で大当たりする確率】
(事後確率)は

P(B❘A) と表します。

P(B|A)=P(A∧B)/P(A)で計算されますが、
(後述します。)

ベイズの定理は少し分子のP(A∧B)を分解します。
*P(A∧B)は、AとBが同時に起きる確率です。

すなわち、

となります。

事後確率は、

P(B)、P(A|B)、P(A)が計算できれば求まるという
公式です。

わけがわからないと思いますので、一つ一つ
パチンコで説明します。

全体の式の意味

分子

繰り返しますが、

分子に記載してあるP(B)P(A|B)というのは

P(A∧B)を分解した形です。

ベイズの定理は、

P(B❘A)=P(A∧B)/P(A)

とも書き直せるわけです。

P(A∧B)というのは、
事後とか事前とか関係なく、
大当たりして、全回転リーチも出る確率です。

なんの演出も出ていない平場で

「全回転リーチがでて大当たりしないかな。。」

なんてボヤキながら待っている確率ですね。
(たぶん1/3000ぐらいでしょうか。)

かなり低い確率になります。

分母

分母はP(A)です。

全回転リーチが出る確率のことです。

P(A)が低い(=レア演出)なほど

事後確率(信頼度)は跳ね上がります。

なぜ、P(A)で割るのかについては、下図を参照ください。

全回転リーチが来てる時点で、かなり
考慮すべき事象が限定されている(P(A)倍になっている)
わけですね。

全回転リーチ以外を介する出来事(あたり、はずれ)
を無視できる。

といってもいいです。

全回転リーチが確定すると、
起こりうる出来事(全事象)が、
P(A)倍とガクンとへるので、

確率が1/P(A)倍になるのです。

P(B)P(A|B)について

ベイズの定理の形に直した場合の

各項の意味について解説します。

P(B)

これは単純に、大当たりの確率ですね。

事前確率と呼ばれるものです。

エヴァンゲリオン13 超暴走】でいえば

初当たり確率の1/199のことです。

何も事(リーチ演出)が
起こってない状態(事前)での確率ですね。

P(A❘B)

すべての大当たりのうち
全回転リーチを介して大当たりする割合です。

多分数十分の1ぐらいでしょうか。

P(B):大当たり確率
P(B|A):大当たりのうち、全回転リーチを介する割合

なので

P(A∧B)=P(B)×P(A|B)

となることは、理解できます。

尤度

P(A❘B)は尤度(ゆうど)とも呼ばれます。

「尤もらしい(もっともらしい)」の「尤」ですね。

事後確率を考える上では、ピンときませんが、
機械学習でベイズ分類器を理解するのには重要な概念です。

パチンコで例えると、

ホールで大当たりをしている人がいたしたとして、
「全回転リーチを介して当たったんだな」
と推測することが、どれぐらい尤もらしい(ありうるの)か。

というのが尤度です。

つまりは、

すべての大当たりのうち
全回転リーチを介して大当たりする割合ですね。

機械学習では、尤度が定数で与えられることはなく
訓練データから推測される確率分布(関数)の形で表現されます。

この分布は尤度関数と呼ばれ、
単純ベイズ分類器では、
これにテストデータを入れることで
分類クラスをが推定できます。
(また別の記事で解説するかも。)

まとめ

ベイズの定理・事後確率の解説を、

パチンコを題材に解説してみました。

一部の方にとっては、理解しやすいのではないかと

思いましたが、いかがだったでしょうか。

ご意見などあれば、コメントにお願いします。

-プログラミング
-, , , , ,

Copyright© ボククボのブログ , 2020 All Rights Reserved Powered by STINGER.