素人確率統計

Last-modified: 2020-01-07 (火) 21:49:05

確率統計のはなし

マスコミは統計でウソをつくなんていうページも作ってみるかな~と画策中。

火曜日生まれの男子の問題

クソ面白い問題がtwitterで議論されていたらしい。なので14年ぶりにこのページを更新。
https://togetter.com/li/25071

1)子どもが二人いる。少なくとも一人は男。もう一人が男である確率は? 答え:1/3

2)子どもが二人いる。(少なくとも)一人は男で火曜日に生まれた。二人とも男である確率は?  答え:13/27

これはなかなかにすごい。面白い。直観と違いすぎるが、実は正しい。下記のツイートが的を射ているように感じた。

追加情報が、二人のうちのどちらにかかっているか曖昧なほど1/3(追加情報がない場合の確率)に近くなって、追加情報が二人のうち片方を特定してしまっているような場合は1/2(男女の2択)に近くなる? (zunda @zu_n_da)

1)が1/3であるのは、直観に反しているかもしれないが、ちょっと思考実験(シミュレーション)してみればわかる。あなたは100世帯の2人子供がいる家庭を無作為に抽出した。そのうち、どちらか一方が男である家庭は75世帯だろう。そしてその中で両方とも男である家庭は25世帯であるはずだ。すなわち、1/3なのである。

しかし一方で、「俺には子どもが二人いる。一人は実は俺の息子で田中A雄だ。さて、もう一人が男である確率は?」であれば、上記1)の1/3ではなくなり1/2となることは間違いないところ。

すなわち、1)の問題で感じる違和感、(なんで1/2じゃないの?)という直観に反する感覚は実はやっぱり正しくて、情報が特定されればされるほど、「A,B二人のうち少なくとも一方が男である」という完全あいまいな条件から、徐々に男であるのはAであることが確定される度合いによって、1/2に近づいていくのである。

つまり、2)の答えが1/2に近いことは、 1)の確率が1/3であることの違和感に対する数学的な回答ともいえる。1)の答えが1/3になることに対する違和感は、日常生活ではビッグデータを扱うことなどない一般人にとっては全く正当なものであって、たいていの場合には1/2に感じるのは当然なのである(我々は実際に考える場合、具体的な二人のお子さんを持つ家庭を想像し、片方が男の子(確定)させてしまう。こうなればもう一方は1/2で男か女なのは当たり前)

直観では1)は変に感じる、直観では1/2でなのになんで1/3なの?という方面から考えていくと、直観とも合致すると思う。具体的な情報を与えれば与えるほど、1/2に近づくのである。

その他、参考にしたURL
https://ktrmnm.github.io/blog/2016/05/16/201605-twoboys/

2020-01-07記

確率統計は判断力を養う

 確率統計に精通すると、判断力が養われる。これは僕が勝手に思っていることだが、間違いなく判断力がつく。それって本当に起こるのか。起こるとするとどのくらいの確率で起こるのか。その起こる確率って、実際に僕が目にする頻度だろうか、体験する頻度だろうか。とか。

 また、そのアンケート調査はなぜそういう結果が出たのか。母集団はどれくらいで、サンプルはどのくらい取り、回収率はどのくらいだったか。ちまたにあふれる「アンケート」とやらは、たいていが「結果を新聞社の主張にあわせたものにしたい」という新聞社(を中心とするマスコミ)の操作である、ということに気がつく。

 その他ABO血液型の嘘、占星術の嘘、詐欺被害の回避、という実用的なものから人間観察、話のネタまで。確率統計に精通すると、判断力が養われるだけでなく人生も豊かになる。というのは大げさでしょうか。

必読書

『統計でウソをつく法』(ダレルハフ著、講談社ブルーバックス刊)を絶対に読め。話はそれからだ。amazonにリンクしたから今すぐ買え。この他にも「統計はこうやって人をだます」という趣旨の本が多く出回っているけれど、それらに手を出す前に、まずこのダレルハフの統計でウソをつく法をまず真っ先に読むべき。

ツベルスキー&カーネマンのタクシー問題

 ある町のタクシーの15%は青で85%は赤である。ひき逃げ事件が起き、証言によると轢いたのは青タクシーだという。この目撃者は事件発生時の状況では80%の確率で正しい色を見分けられ、20%は逆の色を言ってしまうことが分かった。さて、証言通り青タクシーが犯人である確率はいくつか。

正解は約41%

 詳細計算式は割愛。事前確率を無視すれば、8割方青っぽいが、実はそうでもないのである、というお話。これはちょっと納得がいかなかった。

ホントかよオイ!

 僕はある町で殺人事件を犯した。町の人口は5千万人で、僕はそのうちの一人だ。僕が殺人事件を犯しているのを見たという証人が現れた。その証人は事件当日の状況で80%の確率で僕と見分けられることがわかった。さて、僕が犯人である確率はどれくらいか。

 僕が犯人である確率はこのベイズの定理に当てはめるとざーっと計算したところ5000万分の4くらいになる。(と思う。計算に自信なし)人口比で5千万分の1で僕が犯人であるという確率をまず考えなければならないのだから、当然こんな確率になる。

 8割の確率で「貴様が犯人だ」と証言する人物が現れても、僕を裁くことはできないということか。さて、本当にそうなのだろうか。

この定理の使用方法

 僕的に全く納得がいかないので、下記のような問題を作成し、自己解決を図ることとした。

ビー玉選別機械

 青と赤の二色のビー玉が大量に詰まった箱がある。85%が赤ビー玉で15%が青ビー玉。ある業者がこれを80%の確率で選別する機械を開発した。この機械を通すと、青のビー玉は青バケツに、赤のビー玉は赤バケツに勝手に入れてくれる。

 このビー玉選別機械は、赤バケツには結構な量で赤ビー玉が入っている。こちらは89%きちんと赤のビー玉が入っている。しかし、青バケツには赤バケツにくらべるとそんなに量は入っていないし、しかも青バケツには41%の青ビー玉しか入っていないのだ。半分以上赤ビー玉が入っている!!

 ・・・・という話に単純化できるわけだ。、この機械のセールスマンは、80%の確率で選別するというふれこみでこの機械を開発したというのにだ。

つまり(僕なりの理解)

 「証言」というと、ご大層なものだが、この選別機械の仕組みが分かれば、なんとなくそういう話として理解できる。

 証言というものがこの選別機械と同様なわけがなく、タクシー問題で言うと正しく80%の確率で青タクシーであるという証言をする証人は存在しない。そしてやっぱり僕は殺人犯として起訴されるだろう。

 このタクシー問題は、犯罪者の詭弁としての利用価値しかない。薬品の判定、機械などの判断について考える時にのみ有効と思う。もちろん、人間は間違うものだし記憶というものは曖昧なものだから、それだけで審判するのは危険であるという警句ともとれる。しかしそんなことはこのタクシー問題を出すまでもなく、すでに知られていることだ。

ヒントを与えられると確率が変化する例

テレビ番組「裏側に商品」

 3つの扉がある。このうちのどれかひとつの扉のうらには高額商品が隠されている。のこり2つはスカ。さて、この企画に参加したあなたは、一つの扉を選び、その前に立った。

 そのときである。司会者が「さて、あなたはその扉を選びました。よかったですねえ、こちらの扉ははずれでしたよ」と、選んでいない扉のうち一つを開け、はずれ扉であることを示した。

 「さあ、そのまま今立っている前の扉を開けますか?それとも残りの一つの扉に移りますか?」

正解は

 そのまま開けたら確率は3分の1だが、もう一つの扉に移動すれば、なんと確率は3分の2に跳ね上がるのだ。このくらいはちょっと考えると分かるかも。分からなければ、実際シミュレートしてみると良い。5~6回もさいころを振れば理解できるはず。

囚人問題その1

 A,B,Cの3人の死刑囚がいる。このうちの一人だけか恩赦にて助かることになった。恩赦で助かる確率はA,B,C等しく3分の1。囚人Bが看守に「AとC,どちらかは必ず死刑になるんだからどっちが死刑になるかは教えてくれよ」と言い、看守は「Cは死刑になるよ」と教えてくれた。さて、囚人Bが助かる確率はどれくらいか

正解は

 3分の1でかわらない。計算としては、「看守が「Cが死刑になる」と言う確率」は

  1. Aが恩赦になる場合には100%
  2. Bが恩赦になる場合には50%
  3. Cが恩赦になる場合は0%

そもそもの恩赦になる確率は全員3分の1。で、これらをベイズ定理に当てはめると3分の1という確率が求められる。分母が100%÷3+50%÷3、分子が50%÷3なので。

囚人問題その2

 A,B,Cの3人の死刑囚がいる。このうちの一人がくじで恩赦で助かることになった。それぞれ罪の重さにより助かる確率はA,B,Cそれぞれ2分の1、4分の1、4分の1である。囚人Bが看守に「AとC,どちらかは必ず死刑になるんだからどっちが死刑になるかは教えてくれよ」と言い、看守は「Cは死刑になるよ」と教えてくれた。さて、囚人Bが助かる確率はどれくらいか

こちらの正解は

 5分の1になる。聞く前と聞いた後では、確率が下がってしまう。分母は100%÷2+50%÷4、分子が50%÷4なので。
さて、この問題は『考えることの科学』(中公新書刊、市川伸一著)からの引用で、著者は「この問題を作成した私たち自身が驚いてしまった」だそうである。

いったい何が驚きなの???

 僕としては確率に精通している著者(精通しているというかこれでメシを食っている著者)が驚いたことが驚きに値する。囚人Bの気持ちになってみれば分かる。助かる確率はAが2分の1で圧倒的に高いんだから、囚人Aが死刑になってくれればうれしかったはず。そうすれば残り1つの椅子は助かる確率が同率の囚人Cとで分け合うことになるはずだったんだから。

仮に「Aが死刑だよ」と看守が教えてくれた場合の確率をベイズの定理にあてはめて計算してみると
分母は100%÷4+50%÷4、分子が50%÷4で、3分の1。

 つまりもし「囚人Aが死刑になる」と看守が言っていたら4分の1から3分の1へ確率は上がったのだ。(囚人Bとすれば、こんなややこしい計算をするまでもなく看守がそう言ってくれることを祈りつつ聞いたはずである(笑))確率が下がることもあり得るのであれば、逆に確率が下がることだって(感覚的にも)別に不思議じゃない。

僭越ながら確率のマスター批判を

 だいたい、囚人Bの気持ちになれないことも問題だけれども、5分の1とか4分の1とかいう確率で考えていたから混乱しただけなんじゃない?一人は90%の確率で助かり、残りは5%の確率しかない。こんな極端な状況を考えれば、不思議でも何ともなくなると思うけれども。囚人問題その1をやってからその2をやると、確かにちょっと不思議に感じることは確かだけれど。

マンガ『中退アフロ田中』から

 マンガを読んでいて面白いのがあった。合コンしたいブサ男がイケメン男に相談する。イケメン男『合コンなんてそううまくいくモノではない。気に入った女の子が来る確率は1/10、その気に入った子がこっちを気に入ってくれる確率は1/5、つまり成功率は1/50くらいなんだよ』という。

 それを聞いたブサ男Aは、『あのイケメンでさえ1/50なんじゃ、俺たちなんて…』ブサ男B『しかし、それは前提確率が間違っているぞ!俺たちブサ男にとって、気に入った子が来る確率は7/10位、つまり7倍くらいにはなるだろう!』『おお、そういえばそうだそうだ!』『しかし問題はその子がこっちを気に入ってくれる確率だが、それは…1/35くらいか?!」『ふむふむ』『計算すると…やはり1/50か!!』『おお!』『これはつまり、イケメンのメリットが帳消しになっていると言うことだ!!』

 と、主人公たちは妙に自信を深めて合コンに望むのだった。と言う話。おもしろかった。

職場の偉い人の話

 「事故に遭う子供の80%は、自宅から80m以内で事故に遭っている」のだそうです。ふーん。だからいったいなんだっつうんでしょうか。「事故に遭う子供」が特別な抽出でなくて、外で遊んでいる子供を単に無作為抽出しても80%は自宅から80m以内で検出されることでしょう。単に母集団の割合を示すことにしかならい場合も十分に考えられる。

 偉い人=アタマがいい=確率統計に精通している、という等式は成り立つことはなく、むしろ簡単にだまされているのがとても可笑しい。ただ、僕の勤め先は行政機関。「統計でウソをつく方」を用いてみんなをだまそうとしているのかも知れませんよ。国民の皆さんはだまされないように僕たちを監視してくださいね。こんな僕でも楽勝で論破できるような変なウソをつく偉い人は結構いっぱいいる。