[logo] Web連載「数学ガールの秘密ノート」
Share

第258回 シーズン26 エピソード8
確率の冒険:《命》に関わる確率(後編)

書籍『数学ガールの秘密ノート/確率の冒険』

この記事は『数学ガールの秘密ノート/確率の冒険』として書籍化されています。

無料でWeb立ち読み アマゾンで購入

登場人物紹介

:数学が好きな高校生。

テトラちゃんの後輩。 好奇心旺盛で根気強い《元気少女》。言葉が大好き。

$ \newcommand{\TEXT}[1]{\textbf{#1}} \newcommand{\REMTEXT}[1]{\textbf{#1}} \newcommand{\KATSU}{\mathrel{\REMTEXT{かつ}}} \newcommand{\MATAWA}{\mathrel{\REMTEXT{または}}} \newcommand{\UL}[1]{\underline{#1}} \newcommand{\NEQ}{\neq} \newcommand{\ABS}[1]{\left|\mathstrut #1\right|} \newcommand{\SETM}{\,|\,} \newcommand{\EMPTYSET}{\{\,\}} \newcommand{\UNDERCOND}{\mathrel{|}} $

図書室にて

は後輩のテトラちゃんと確率の問題に取り組んでいる(第257回参照)。 解答は出たものの……

問題(○○菌に感染しているか否か)

《○○菌》に感染している人は《全人口の $1$ %》である。

○○菌に感染しているか否かを調べる《判定キット》がある。

判定キットは感染しているか否かを《$90$ %の確率》で正しく判定する。

  • 《感染している》という判定のことを《陽性》と呼ぶ。
  • 《感染していない》という判定のことを《陰性》と呼ぶ。

ある人を判定キットで調べたら《陽性》だった。

この人が○○菌に実際に感染している確率を求めよ。

※注意:○○菌ならびに各数値はすべて架空のものです。

テトラ「できました! 事象 $B$ が起きた、つまり《陽性》になったという条件のもとで 事象 $A$ が起きている、つまり《感染している》状況になる条件付き確率はこう表せました!(第257回参照)」

$$ P(A \UNDERCOND B) = \frac{P(A) \cdot P(B \UNDERCOND A)}{P(A) \cdot P(B \UNDERCOND A) + P(\bar A) \cdot P(B \UNDERCOND \bar A)} $$

「できたね」

テトラ「さっそく《わかったことのまとめ》を使って、具体的な数値を代入しますっ!」

$$ P(A \UNDERCOND B) = \REMTEXT{(第257回参照)} = 0.08333\cdots \\ $$

解答(○○菌に感染しているか否か)

この人が○○菌に実際に感染している確率は、 $\frac{1}{12}$ である(約 $8.3$ %)。

テトラ「え?????????????」

「ずいぶんたくさん疑問符出たねえ」

テトラ「それは……変です。約 $8.3$ %なんて、変です」

「実際は $8.3333\cdots$ %だけどね」

テトラ「変というのは、それじゃなくてですね……あたし、最初は《感染している》確率が $90$ %だと思ったんですよ!! $90$ %ではなくて、約 $8.3$ %が正解だなんて……あたしはとんでもないまちがいをしてたわけじゃないですかっ!」

「そうなんだ。テトラちゃんでもそんなに《とんでもない》まちがいをする。 だから、世の中の人たちもきっと同じように《とんでもない》まちがいをしているだろうね」

テトラ「そんな……そんな……」

「恐い話だよ。この○○菌の問題はあくまで《架空の問題》だけど、 これと似たような状況は世の中によくあるはず。 何かの病気にかかっている確率がある程度わかっていて、 その病気にかかっているかどうかをある確率で判定できる方法がある。 そしてその判定方法で《陽性》と出る」

テトラ「はい……その結果を見て、 自分が……あるいは家族が……実際にその病気に《かかっている》か《かかっていないか》を判断するわけですよね」

「そうだね。そのときに実際の数値は違うだろうけれど、 $90$ %と約 $8.3$ %では判断を大きくミスする可能性がある」

テトラ「でも……でも……それって《命》に関わる判断かもしれませんよね……」

「そうなんだ。本当に恐い話だよ」

テトラ「いったい、どこからそんなに大きな違いが生まれてしまうんでしょうか?」

「もっと詳しく分析してみよう」

確率の比較

「まず $1$ %という確率を、約 $8.3$ %と比較してみる。 《感染している》事象を $A$ として、 《陽性である》事象を $B$ としているから、こういうことだね」

  • $P(A) = 1$ %
    …… 《感染している》確率。
  • $P(A \UNDERCOND B) = \REMTEXT{約}8.3$%
    …… 《陽性である》という条件のもとで、実際に《感染している》条件付き確率。

テトラ「比較するというのは《$1$ %より約 $8.3$ %の方が大きい》ということでしょうか」

「そうだね。誰かを選んだだけなら《感染している》確率は $1$ %だけど、 《陽性》という判定が出ているなら《感染している》確率は約 $8.3$ %と大きくなる。 ということはこの場合、判定キットは確かに役に立ったといえるね」

テトラ「す、すみません。これは役に立つか立たないかという二つに一つの話になるんでしょうか。 そんなにゼロイチで言えないような……」

「おっと、うん、そうか。『役に立つ』と言い切っちゃったけど、 言いたかったのは《陽性》になったという情報で《感染している》という確率は上がったということだよ」

テトラ「はい、わかりました。すみません、何だか重箱の隅をつついたみたいで……」

「いやいや」

テトラ「《感染している》かどうかのような問題は《命》に関わることがありそうなので、 表現の仕方に十分な注意が必要じゃないかと感じるんです。 特に、あたしは $90$ %なんて最初に答えちゃいましたし」

「なるほど」

具体的に考える

テトラ「先ほどは先輩がすぐに『$90$ %はよくあるまちがい』とおっしゃってくださいましたけど、 もしもこの問題をあたしが一人で解いていたら、絶対に $90$ %と信じて疑わなかったと思います。 あたしの考えた道筋はこうでした(第257回参照)」

  • (1)判定キットは $90$ %で正しく判定できます。
  • (2)《陽性》という判定が出たらそれは $90$ %の確率で正しい判定です。
  • (3)《陽性》というのは○○菌に感染しているという意味です。
  • (4)《陽性》という判定が $90$ %の確率で正しいんですから、《陽性》の判定が出たら $90$ %の確率で○○菌に感染しているといえます。

「そうだね。(2)は、もしも《感染している》人しか世の中にいなかったら正しい。 でも、いまは《感染している》人と《感染していない》人が混じっている状態だから、 (2)は正しくない」

テトラ「まちがったとしても、 $90$ %が $83$ %になるといったちょっとしたズレじゃなくて、 いきなり約 $8.3$ %というすごいズレになるのが驚きです」

「ほんとだね」

テトラ「先輩が式変形をガイドしてくれなかったら、絶対にまちがってました」

「そうか……うん、《例示は理解の試金石》だから、具体的な人数で考えるという方法もあるよ」

テトラ「具体的な人数……たとえば全体の人数を $100$ 人とする、みたいに?」

「そうなんだけど、全体が $100$ 人だと《感染している》人が $100 \times 0.01 = 1$ 人になっちゃうから少なすぎるなあ」

テトラ「では、全体を $1000$ 人にしましょう!」

○○菌の問題を、全体が $1000$ 人だとして考える

  • 全人口が $1000$ 人だとします。
  • $1000$ 人のうち、《感染している》のは $1$ %なので、 $1000\times 0.01 = 10$ 人です。
  • $1000$ 人のうち、《感染していない》のはその $10$ 人以外なので、 $1000 - 10 = 990$ 人です。
  • $1000$ 人のうち、《陽性》になるのは……ええと?

「《陽性》になるのは二通りの場合があるね」

  • 正しい判定で《陽性》になる場合……真陽性
  • 誤った判定で《陽性》になる場合……偽陽性

テトラ「今回の判定キットだと、正しい判定で《陽性》になるのは、 すべての《感染している》人のうち $90$ %になります。 《感染している人》は $10$ 人なので、 正しい判定で《陽性》になるのは、 $10 \times 0.9 = 9$ 人です」

「誤った判定で《陽性》になるのは何人かな」

テトラ「逆に考えればいいですね。 判定キットが誤った判定をするのは $10$ %ですから、 すべての《感染していない》人のうち $10$ %が、誤った判定で《陽性》になってしまいます。 《感染していない人》は $990$ 人なので、 正しくない判定で《陽性》になるのは、 $990 \times 0.1 = 99$ 人です」

「$9$ 人と $99$ 人を合計した $9 + 99 = 108$ 人が《陽性》の人数だとわかった」

○○菌の問題を、全体が $1000$ 人だとして考える

  • 全人口は、 $1000$ 人。
  • 《感染している》のは、 $10$ 人。
  • 《感染していない》のは、 $990$ 人。
  • 正しい判定で《陽性》になるのは、 $9$ 人。
  • 誤った判定で《陽性》になるのは、 $99$ 人。
  •  《陽性》になるのは、合計で $108$ 人。

テトラ「ということは《陽性》の判定が出る人のうち、正しい判定で《陽性》になる人の割合は、 $$ \frac{9}{9 + 99} = \frac{9}{108} = \frac{1}{12} = 0.0833\cdots $$ で、確かに約 $8.3$ %になりました。ここまでの計算はつじつまが合ってます」

「ここまで来たから他の人数も出してみようか」

テトラ「そうですね。 $1000$ 人のうち、正しい判定で《陰性》になる人数は、 《感染していない》$990$ 人のうち正しい判定 $90$ %の人数ですから、 $990 \times 0.9 = 891$ 人です。多いですね……というか、ほとんどがこのパターンなんですね」

「そうだね。それに比べると、誤った判定で《陰性》になるのは、 《感染している》$10$ 人のうち誤った判定 $10$ %の人数で、 $10 \times 0.1 = 1$ 人になる。こっちはすごく少ないね」

テトラ「すごく少ないですけど、これは重大な誤判定だと思いますっ! ……だって、 誤って《陽性》になった人ならば、もっと別の検査をするなどして実際に《感染している》かどうかを調べるかもしれません。 でも、誤って《陰性》になってしまったら、《感染している》かどうかを見逃してしまうかもしれませんから」

「確かに、そこには非対称性があるなあ。 《感染している》ことを誤判定することと、 《感染していない》ことを誤判定するのは、意味や重みが違う。 それは、この問題設定の外側の話だけどね……ともかくこれで人数がでそろった」

○○菌の問題を、全体が $1000$ 人だとして考える

  • 全人口は、 $1000$ 人。
  • 《感染している》のは、 $10$ 人。
  • 《感染していない》のは、 $990$ 人。
  • 正しい判定で《陽性である》のは、 $9$ 人。
  • 誤った判定で《陽性である》のは、 $99$ 人。
  •  《陽性》になるのは、合計で $108$ 人。
  • 正しい判定で《陰性である》のは、 $891$ 人。
  • 誤った判定で《陰性である》のは、 $1$ 人。
  •  《陰性である》のは、合計で $892$ 人。

テトラ「先輩、先輩! これ、表にすべきですよね」

「ああ、まったくだ!」

無料で「試し読み」できるのはここまでです。 この続きをお読みになるには「読み放題プラン」へのご参加が必要です。

ひと月500円で「読み放題プラン」へご参加いただきますと、 440本すべての記事が読み放題になりますので、 ぜひ、ご参加ください。


参加済みの方/すぐに参加したい方はこちら

結城浩のメンバーシップで参加 結城浩のpixivFANBOXで参加

(2019年4月26日)

書籍『数学ガールの秘密ノート/確率の冒険』

この記事は『数学ガールの秘密ノート/確率の冒険』として書籍化されています。

書籍化にあたっては、加筆修正をたくさん行い、 練習問題や研究問題も追加しました。

どの巻からでも読み始められますので、 ぜひどうぞ!

無料でWeb立ち読み アマゾンで購入

[icon]

結城浩(ゆうき・ひろし) @hyuki


『数学ガール』作者。 結城メルマガWeb連載を毎週書いてます。 文章書きとプログラミングが好きなクリスチャン。2014年日本数学会出版賞受賞。

Twitter note 結城メルマガ Mastodon Bluesky Threads Home