事後確率最大化法( MAP, Maximum A Posteriori) 结合了观测数据的尤度和先验信息. 在这种情况下, 先验信息是 x1−x2 服从均值为 1, 方差为 2 的正态分布. 假设我们有以下观测数据 (a1,a2)=(1,0),(0,1),(1,1) 和对应的测定值 y=−5,7,1. 我们需要通过 MAP 方法来估计 x1 和 x2. 步骤如下:
- 定义先验分布和尤度函数:
- 先验分布: 根据文献, x1−x2 服从均值为 1, 方差为 2 的正态分布:
p(x1,x2)∝exp(−2⋅2(x1−x2−1)2)=exp(−4(x1−x2−1)2)
- 尤度函数: 观测模型为 y=a1x1+a2x2+e, 假设误差 e 服从标准正态分布 N(0,1):
L(x1,x2)=i=1∏32π1exp(−2(yi−(a1ix1+a2ix2))2)
具体来说:
L(x1,x2)∝exp(−21[(−5−x1)2+(7−x2)2+(1−(x1+x2))2])
- 构建事后分布:
- 事后分布 p(x1,x2∣y) 与先验分布 p(x1,x2) 和尤度函数 L(x1,x2) 成比例:
p(x1,x2∣y)∝L(x1,x2)⋅p(x1,x2)
将先验分布和尤度函数结合起来:
p(x1,x2∣y)∝exp(−21[(−5−x1)2+(7−x2)2+(1−(x1+x2))2])⋅exp(−4(x1−x2−1)2)
- 最大化事后分布:
logp(x1,x2∣y)∝−21[(−5−x1)2+(7−x2)2+(1−(x1+x2))2]−4(x1−x2−1)2
- 求偏导数并设为零以找到 x1 和 x2 的最优值: 对 x1 求偏导数:
∂x1∂logp(x1,x2∣y)=−(∂x1∂[21(−5−x1)2+21(1−(x1+x2))2])−41⋅2(x1−x2−1)
对 $x_2$ 求偏导数:
∂x2∂logp(x1,x2∣y)=−(∂x2∂[21(7−x2)2+21(1−(x1+x2))2])+41⋅2(x1−x2−1)
- 求解方程: 计算偏导数并设为零: 对 x1:
∂x1∂logp(x1,x2∣y)=(x1+5)+(x1+x2−1)−21(x1−x2−1)=0
整理得:
2x1+x2+4−21x1+21x2+21=0⇒23x1+23x2+29=0⇒x1+x2+3=0⇒x1+x2=−3(1)
对 x2:
∂x2∂logp(x1,x2∣y)=(x2−7)+(x1+x2−1)+21(x1−x2−1)=0
整理得:
x2−7+x1+x2−1+21x1−21x2−21=0⇒23x2+23x1−215=0⇒x1+x2=5(2)
根据(1)和(2)的解, 出现矛盾, 说明在不一致的数据条件下, 先验和观测结合产生的结果无法一致. 所以在重新审视数据及模型的一致性是必需的.
你说得对,在前面的计算中并没有充分考虑误差项 e。同时,事后概率最大化法的中文是“最大后验概率法”。
我们重新考虑误差项 e,并重新应用最大后验概率法进行计算。
假设模型为 y=a1x1+a2x2+e,其中 e 是服从标准正态分布 N(0,1) 的误差项。
观测数据为:
⎩⎨⎧a1=1,a2=0,y=−5a1=0,a2=1,y=7a1=1,a2=1,y=1
我们假设 x1 和 x2 的先验分布为 x1−x2 服从均值为 1,方差为 2 的正态分布:
p(x1,x2)∝exp(−4(x1−x2−1)2)
观测数据的尤度函数为:
L(x1,x2)∝exp(−21[(−5−x1)2+(7−x2)2+(1−(x1+x2))2])
事后分布 p(x1,x2∣y) 与先验分布 p(x1,x2) 和尤度函数 L(x1,x2) 成比例:
p(x1,x2∣y)∝L(x1,x2)⋅p(x1,x2)
结合先验分布和尤度函数:
p(x1,x2∣y)∝exp(−21[(−5−x1)2+(7−x2)2+(1−(x1+x2))2])⋅exp(−4(x1−x2−1)2)
取对数以简化计算:
logp(x1,x2∣y)∝−21[(−5−x1)2+(7−x2)2+(1−(x1+x2))2]−4(x1−x2−1)2
对 x1 求偏导数并设为零:
∂x1∂logp(x1,x2∣y)=(x1+5)+(x1+x2−1)−21(x1−x2−1)=0
整理得:
2x1+x2+4−21x1+21x2+21=0⇒23x1+23x2+29=0⇒x1+x2+3=0⇒x1+x2=−3(1)
对 x2 求偏导数并设为零:
∂x2∂logp(x1,x2∣y)=(x2−7)+(x1+x2−1)+21(x1−x2−1)=0
整理得:
x2−7+x1+x2−1+21x1−21x2−21=0⇒23x2+23x1−215=0⇒x1+x2=5(2)
联立方程 (1) 和 (2):
{x1+x2=−3x1+x2=5
这表明观测数据与假设模型存在矛盾。在正常情况下,如果观测数据与假设模型一致,应该能够通过 MAP 方法解出 x1 和 x2。这种矛盾可能是由于观测数据中的测量误差或模型假设不准确。
重新审视数据和模型,确保数据的一致性和模型的合理性,是解决问题的关键。