COVID-19 検診シミュレーションとベイズ統計解説

ベイズ統計の基礎

ベイズ統計では、事前確率 P(H) と尤度 P(D | H) を組み合わせて、 事後確率 P(H | D) を求めます。ここで、D はデータ、H は仮説です。

$$ P(H\mid D) = \frac{P(D\mid H)\,P(H)}{P(D)} $$

分母の P(D) は周辺尤度 (evidence) と呼ばれ、 全ての仮説にわたる尤度と事前確率の総和で定義されます:

$$ P(D) = \sum_i P(D\mid H_i)\,P(H_i) $$

感染症検査の文脈では、H を「感染している」、¬H を「感染していない」、 D を「検査が陽性」と読むことで、 感染している人が陽性と判定される確率(真陽性率 Sensitivity)は P(陽性 | 感染)、 感染していない人が陰性と判定される確率(特異度 Specificity)は P(陰性 | ¬感染) で表せます。

前提パラメータ




無差別検診 (母集団全体)

項目計算式結果
感染者数 pop × prevalence
非感染者数pop − 感染者数
真陽性 感染者数 × sensitivity
真陰性 非感染者数 × specificity
偽陰性 感染者数 − 真陽性
偽陽性 非感染者数 − 真陰性

事前診断あり (選択集団検診)


項目計算式結果
選択集団内感染者数 preGroup × preGroupPrev
事前診断で漏れた感染者数(pop × prevalence) − 選択集団内感染者数
真陽性 選択集団内感染者数 × sensitivity
真陰性 (preGroup − 選択集団内感染者数) × specificity
偽陰性 選択集団内感染者数 − 真陽性
偽陽性 (preGroup − 選択集団内感染者数) − 真陰性