ブログ

PCR検査から有病率推定(谷)

陽性率を,p(+)=累積陽性者数/累積PCR検査数と定義すると,東京都の2021.3.17までのデータや厚労省の公表データを用いて,陽性率は,東京都で約6.5%(全国で4.9%,厚労省)になります.しかし,PCR検査の感度と特異度の情報(酒井健司,朝日デジタルなど)を入れてベイズ推定し,陽性的中率p(罹患|+)や偽陰性率p(罹患|-)を求めました.

ランダム・サンプリングのデータがないので,罹患率(有病率)も陽性率に等しいと仮定せざるを得ませんでした.
注)日本疫学会の定義によりますと,有病率と罹患率は異なります.

有病率=ある時点における疾病を有する者の数/調査対象全数
罹患率=ある時点における発生新規患者数/感染感受性のある人数

罹患率は,集団内の感染感受性のある人数に対して定義されるので,2つの定義で分母が異なります.さらに,有病率でいう「ある期間で疾病を有する者の数」は,罹患率でいう「新規感染者の数」とは異なるわけですが,タイムラグを考慮すれば,どちらも同様な傾向と近似ができそうです.

ここでは,有病率と罹患率を同義語として扱いました.毎日発表される,新規感染者数は,罹患率とは異なりますがよく似た指標であります.

 

 

東京都の2021.3.17までの陽性者累計116,293人,検査実施累計1,779,950人を用い,現在の陽性率はx=6.5%程度(全国ではx=4.9%)程度と推定します.
ランダム・サンプリングではないし,データが不足しているので,罹患率(有病率)も陽性率に等しいと仮定します.

(注)ここで対象となるサンプル集合は,PCR検査を受診できる限定されたグループですので,ランダム・サンプリングではなく偏っており(発症条件が課さたグループ),その陽性率は一般集合より若干高値でしょう.また,サンプリング条件が感染状況とともに変化しているので,単純な時間変化の比較はできません.
================================
■条件付き確率についての「ベイズの定理」とは次のように説明できます.
p(Y|X)p(X)=p(X∩Y)=p(X|Y)p(Y)
記号の意味は例えば以下の様です.
p(X) Xが起こる確率
p(Y|X) Xが起こった後でYが起こる確率
p(X∩Y) XかつYが起こる確率
ベイズの定理は,X(原因)が起きた後でY(結果)が起きる確率p(Y|X)と,XとYを入れ替えた確率p(X|Y)を結び付ける定理です.
===============================
■PCR検査の精度
新型コロナ検査、どれくらい正確? 感度と特異度の意味(酒井健司,朝日デジタル)などにより,次のように仮定します.
PCR検査の感度とは,罹患者がPCR検査で陽性(+)と正しく的中する確率のことで,あまり大きくなく0.7程度といわれます.真の罹患者でもPCR検査が陰性(-)(偽陰性)となる(罹患者を取りこぼす)確率が0.3程度あるそうです.
PCR検査の特異度とは,非罹患者を正しく陰性(ー)と判定する確率のことで0.99程度です.非罹患者を陽性(+)(偽陽性)と判定するのは稀で0.01程度の確率ですが,非罹患者の割合が多い集団(罹患(有病)率が小さい集団)では,無視できない偽陽性数になります.

 

■これらの仮定の下で,以下の2つを推定しましょう.
ただし,ベイズの定理を使います.
罹患(有病)率をp(罹患)≡x,非罹患(非有病)率を1-xとします.
(1)PCR検査で陽性と判定されたとき,罹患者である確率を求めなさい.

 

青線グラフ

つまり,PCRの結果が陽性のときでも,その的中率はp(罹患|+)=83%(x=6.5%附近)程度です.
罹患していても,検査感度のため,検査の結果が陽性にならない偽陰性が30%あり,罹患者をとりこぼしている.
一方,検査の特異度が高いので,偽陽性率は0.1%と小さいにも関わらす,非罹患者の割合(1-x)が多い集団では,陽性判定中に占める偽陽性の数も無視できない.これらの原因のため的中率が低下します.
(2)罹患(有病率)を推定しなさい.
(陰性)判定されたものの中に見逃された罹患者のいる確率p(罹患|-)は,

 

赤線グラフ

陰性と判定されたものの中に見逃された患者である可能性は,p(罹患|-)=2%(x=6,5%の付近)ほどある.
従って,全人口のなかで推定される罹患(有病)率は,
p(罹患)=x・p(罹患|+)+(1-x)・p(罹患|-)

第1項:第2項=真陽性:偽陽性=5.40:1.87
x=6.5%のときには,陽性中に占める偽陽性の数は25%程度である.