ベイズの定理と新型コロナウイルス

(要旨)ーーー
3月21日の厚労省の公表値を用いて,罹患率=発症患者/PCR検査数と定義すると,罹患率は,約5%になります.
しかし,PCR検査の,感度と特異性(酒井健司,朝日デジタル)の情報を入れてベイズ推定した罹患率は5.9%になります.
この推定値の増加は,主としてPCR検査感度に原因があり,実際の罹患者を取りこぼしていたためです.
(注)この数値は,PCR検査を受けた限定されたグループをサンプルとしているために,一般の集団に対しては少し割り引いた数値になるでしょう.
======================================

■条件付き確率についての「ベイズの定理」とは次のように説明できます.
$$p(Y|X)p(X)=p(X \cap Y)=p(X|Y)p(Y)$$
記号の意味は例えば以下の様です.
$$p(X)$$  $$X$$が起こる確率
$$p(Y|X)$$ $$X$$が起こった後で$$Y$$が起こる確率
$$p(X \cap Y)$$ $$X$$かつ$$Y$$が起こる確率

ベイズの定理は,$$X$$(原因)が起きた後で$$Y$$(結果)が起きる確率$$p(Y|X)$$と,$$X$$と$$Y$$を入れ替えた確率$$p(X|Y)$$を結び付ける定理です.

■新型コロナウイルスに対するPCR検査数は,厚生労働省の発表で,日本でも3月21日現在,18,134人になりました.
PCR検査による感染者数は1,007人,発症患者(=罹患者と定義)はそのうちの884人です.

 

 

 

 

 

 

 

発症患者/PCR検査数=罹患率 と仮の罹患率を定義すると,罹患率は約5%です.
陽性率=感染者数/PCR検査数=0.056 ,陰性率=0.944 も仮に定義します.

新型コロナ検査、どれくらい正確? 感度と特異度の意味査(酒井健司,朝日デジタル)をもとにして,次のように仮定します.PCR検査の感度というのは,罹患者がPCR検査で+になる確率のことで,あまり大きくなく0.7, 罹患者でもPCR検査が-となる場合(偽陰性)の確率は0.3程度だそうです.
検査の特異性により,非罹患者が+(疑陽性)と判定される確率は0.01だそうです.
*注)3月24日のメルマガに使った仮定の数値は,実際とだいぶ違いましたので,修正した以下の表に差し替えました.
$$\begin{array}{|c|c|c|}
\hline
& + & - \\[0mm]
\hline
罹患 & 0.7 & 0.3(偽陰性) \\[0mm]
\hline
非罹患 & 0.01(疑陽性) & 0.99 \\[0mm]
\hline
\end{array}$$
これらの仮定の下で,以下の2つを推定しましょう.ただし,ベイズの定理を使います.
(1)PCR検査で陽性と判定されたとき,罹患者である確率を求めなさい.
$$p(罹患|+)=\displaystyle \frac{p(+|罹患)p(罹患)}{p(+)}=\displaystyle \frac{0.7 \times 0.05}{0.05 \times 0.7+0.95 \times 0.01}=0.79$$
+(陽性)でも,検査感度のせいで罹患者をとりこぼすことが多い,非罹患者の割合が多いので偽陽性も無視できず,全体として決定率を下げている(79%).

(2)罹患率を推定しなさい.
$$ p(罹患|-)=\displaystyle \frac{p(-|罹患)p(罹患)}{p(-)}=\displaystyle \frac{0.3 \times 0.05}{0.05 \times 0.3+0.95 \times 0.99}=0.016 $$
陰性と判定されたものの中に見逃された患者である可能性は1.6%ほどある.
従って,全人口のなかで推定される罹患率は$$0.056 \times 0.79+0.944 \times 0.016=0.059$$,すなわち,5.9%と推定できる.

*注)ただし,PCR検査は限定されたグループに対してなされており,偏った集団をサンプルとしているので,全人口に対してなら少し割り引いた値が推定される.