(1) 让我们假设总人口为 N。
首先,我们定义以下变量:
- 罹患病的人口比例为 p=21=0.5。
- 罹患病的人被检测为阳性的概率为 P(阳性∣罹患)=0.6。
- 没有罹患病的人被错误检测为阳性的概率为 P(阳性∣未罹患)=0.04。
现在,我们需要计算在检测阳性的情况下,实际罹患的概率,即 P(罹患∣阳性)。根据贝叶斯定理,我们有:
P(罹患∣阳性)=P(阳性)P(阳性∣罹患)⋅P(罹患)
其中,P(阳性) 可以通过全概率公式计算得到:
P(阳性)=P(阳性∣罹患)⋅P(罹患)+P(阳性∣未罹患)⋅P(未罹患)
=0.6⋅0.5+0.04⋅0.5
=0.3+0.02
=0.32
因此,
P(罹患∣阳性)=0.320.6⋅0.5=0.320.3=3230=1615≈0.9375
所以,当检测结果为阳性时,实际罹患的概率约为 93.75%。
(2) 现在假设罹患病的人口比例下降到 5%,即 p=0.05。
我们仍然使用贝叶斯定理计算初次检测阳性时的实际罹患概率:
P(罹患∣阳性)=P(阳性)P(阳性∣罹患)⋅P(罹患)
P(阳性) 现在为:
P(阳性)=P(阳性∣罹患)⋅P(罹患)+P(阳性∣未罹患)⋅P(未罹患)
=0.6⋅0.05+0.04⋅0.95
=0.03+0.038
=0.068
因此,
P(罹患∣阳性)=0.0680.6⋅0.05=0.0680.03≈0.4412
所以,初次检测阳性时,实际罹患的概率约为 44.12%。
我们需要多次检测阳性后,使罹患概率达到 90%以上。假设每次检测都是独立的,那么检测 n 次阳性后的罹患概率为:
P(罹患∣n 次阳性)=P(n 次阳性)P(n 次阳性∣罹患)⋅P(罹患)
其中,
P(n 次阳性)=P(n 次阳性∣罹患)⋅P(罹患)+P(n 次阳性∣未罹患)⋅P(未罹患)
我们计算连续 n 次阳性的概率:
P(n 次阳性∣罹患)=0.6n
P(n 次阳性∣未罹患)=0.04n
因此,
P(n 次阳性)=0.6n⋅0.05+0.04n⋅0.95
目标是:
P(罹患∣n 次阳性)≥0.9
所以:
0.6n⋅0.05+0.04n⋅0.950.6n⋅0.05≥0.9
解这个不等式:
0.6n⋅0.05≥0.9⋅(0.6n⋅0.05+0.04n⋅0.95)
0.6n⋅0.05≥0.54⋅0.6n⋅0.05+0.036⋅0.04n⋅0.95
0.6n⋅0.05−0.54⋅0.6n⋅0.05≥0.036⋅0.04n⋅0.95
0.046⋅0.6n⋅0.05≥0.036⋅0.04n⋅0.95
0.046⋅0.6n≥0.036⋅0.04n⋅0.95/0.05
0.046⋅0.6n≥0.036⋅19⋅0.04n
0.046⋅0.6n≥0.684⋅0.04n
0.6840.046≥(0.60.04)n
0.6840.046≥(151)n
0.0673≥(151)n
log15(0.0673)≥−n
n≥−log15(0.0673)
n≈3.45
因此,需要连续4次检测阳性,才能达到90%以上的罹患概率。