ベイズの定理と新型コロナウイルスPCR検査★

私は3月24,26日のまぐまぐメルマガ(311,312号)で以下の内容の発表をしました.-----
3月21日の厚労省の公表値を用いて,罹患率=発症患者/PCR検査数と定義すると,罹患率は,約5%になります.しかし,PCR検査の,感度と特異性(酒井健司,朝日デジタル)の情報を入れてベイズ推定した罹患率は5.9%になります.この推定値の増加は,主としてPCR検査感度に原因があり,実際の罹患者を取りこぼすためです.(注)この数値は,PCR検査を受けた限定されたグループをサンプルとしているために,一般の集団に対しては少し割り引いた数値になるでしょう.-----
今日PCR検査数も増加したので,4月24日時点の厚労省のデータを用いて,再計算をしてみました.ただし,PCR検査数が増加したといっても(検査を受ける条件はあまり緩和されていません).したがって,陽性確率が高いサンプル集団について検査が行われている状況は同じです.
カバーの図を見てください.ここで推定する数値はあくまでもサンプル集団に関するもので,全体集団に対してはいくらか割り引いた数字になるでしょう.

 

 

 

 

 

 

 


ーーーーー
■PCR検査状況(厚労省4/23データ)

 【PCR検査陽性者数】    【PCR検査陽性時の有症状・無症状の別】

 

 

 

 

 

 

 

 

 

新型コロナウイルスに対するPCR検査数は,4月23日の厚労省の発表で,135,983人になりました.1月前(3月21日)の数字の7.5倍です.PCR検査の陽性者数は11,919人,陽性者のうち発症患者(陽性者∩発症患者)は7,315人です.
発症患者/PCR検査数=罹患率 と仮の罹患率を定義すると,罹患率は約5.4%です.
陽性率=陽性者数/PCR検査数=0.088(前回0.056) ,陰性率=0.912(前回0.944)も定義します.

(要旨)================================================
4月23日の厚労省の公表値を用いて,罹患率=発症患者/PCR検査数と定義すると,罹患率は,約5.4%(前回5.0%)になります.しかし,PCR検査の,感度と特異性(酒井健司,朝日デジタル)の情報を入れてベイズ推定した罹患率は8.6%(前回5.9%)になります.この推定値の増加は,主としてPCR検査感度に原因があり,実際の罹患者を取りこぼすためです.
(注)この数値は,PCR検査を受けた限定されたグループをサンプル集合としているために,一般の集団に対しては少し割り引いた数値になるでしょう.
===================================================

■条件付き確率についての「ベイズの定理」とは次のように説明できます.
$$p(Y|X)p(X)=p(X \cap Y)=p(X|Y)p(Y)$$
記号の意味は例えば以下の様です.
$$p(X)$$  $$X$$が起こる確率
$$p(Y|X)$$ $$X$$が起こった後で$$Y$$が起こる確率
$$p(X \cap Y)$$ $$X$$かつ$$Y$$が起こる確率

ベイズの定理は,$$X$$(原因)が起きた後で$$Y$$(結果)が起きる確率$$p(Y|X)$$と,$$X$$と$$Y$$を入れ替えた確率$$p(X|Y)$$を結び付ける定理です.

■PCR検査の精度

新型コロナ検査、どれくらい正確? 感度と特異度の意味(酒井健司,朝日デジタル)により,次のように仮定します.
PCR検査の感度とは,罹患者がPCR検査で陽性(+)と正しく判定される確率のことで,あまり大きくなく0.7.
真の罹患者でもPCR検査が陰性(-)(偽陰性)となる確率が0.3程度だそうです.
検査の特異性とは,非罹患者が陽性(+)(疑陽性)と判定される確率で0.01程度だそうです.

$$\begin{array}{|c|c|c|}
\hline
& + & - \\[0mm]
\hline
罹患 & 0.7 & 0.3(偽陰性) \\[0mm]
\hline
非罹患 & 0.01(疑陽性) & 0.99 \\[0mm]
\hline
\end{array}$$

■これらの仮定の下で,以下の2つを推定しましょう.ただし,ベイズの定理を使います.
(1)PCR検査で陽性と判定されたとき,罹患者である確率を求めなさい.
$$p(罹患|+)=\displaystyle \frac{p(+|罹患)p(罹患)}{p(+)}=\displaystyle \frac{0.7 \times 0.054}{0.054 \times 0.7+0.946 \times 0.01}=0.80$$
+(陽性)でも,検査感度のせいで罹患者をとりこぼすことが多い.また,非罹患者の割合が多いので偽陽性の数も無視できず,全体として決定率を80%(前回79%)に下げている.

(2)罹患率を推定しなさい.
$$ p(罹患|-)=\displaystyle \frac{p(-|罹患)p(罹患)}{p(-)}=\displaystyle \frac{0.3 \times 0.054}{0.054 \times 0.3+0.946 \times 0.99}=0.017 $$
陰性と判定されたものの中に見逃された患者である可能性は1.7%(前回1.6%)ほどある.
従って,全人口のなかで推定される罹患率は$$0.088 \times 0.80+0.912 \times 0.017=0.086$$,すなわち,8.6%(前回5.9%)と推定できます.

 =====================================================text

■条件付き確率についての「ベイズの定理」とは次のように説明できます.
p(Y|X)p(X)=p(X∩Y)=p(X|Y)p(Y)
記号の意味は例えば以下の様です.
p(X)  Xが起こる確率
p(Y|X) Xが起こった後でYが起こる確率
p(X∩Y) XかつYが起こる確率
ベイズの定理は,X(原因)が起きた後でY(結果)が起きる確率p(Y|X)と,XとYを入れ替えた確率p(X|Y)を結び付ける定理です.
■PCR検査の精度

新型コロナ検査、どれくらい正確? 感度と特異度の意味(酒井健司,朝日デジタル)により,次のように仮定します.
PCR検査の感度とは,罹患者がPCR検査で陽性(+)と正しく判定される確率のことで,あまり大きくなく0.7.
真の罹患者でもPCR検査が陰性(-)(偽陰性)となる確率が0.3程度だそうです.
検査の特異性とは,非罹患者が陽性(+)(疑陽性)と判定される確率で0.01程度だそうです.

■これらの仮定の下で,以下の2つを推定しましょう.ただし,ベイズの定理を使います.
(1)PCR検査で陽性(+)と判定されたとき,真の罹患者である確率を求めなさい.
p(罹患|+)=p(+|罹患)p(罹患)/p(+)=0.7×0.054/(0.054×0.7+0.946×0.01)=0.80
+(陽性)でも検査感度のせいで罹患者をとりこぼすことが多い,また,非罹患者の割合が大きいので偽陽性も無視できず,この2つの原因が,+判定でも罹患者である確率80%(前回79%)を下げている.
(2)罹患率を推定しなさい.
p(罹患|−)=p(−|罹患)p(罹患)/p(−)=0.3×0.054/(0.054×0.3+0.946×0.99)=0.017
-(陰性)と判定されたものの中に見逃された患者である可能性は1.7%ほどある.

従って,サンプル集合全体で推定される罹患率は0.088×0.80+0.912×0.017=0.086
すなわち,8.6%(前回5.9%)と推定できます.