以下内容为CPT-4生成,其中有错误步骤,请尝试找出
尤度函数是统计模型中用于表示在给定参数下观测到的数据的概率的函数. 对于线性模型 y=a1x1+a2x2+e, 其中 e 是服从标准正态分布的误差项, 我们可以通过观测数据求尤度函数.
首先, 我们有三个观测:
⎩⎨⎧a1=1,a2=0,y=−5a1=0,a2=1,y=7a1=1,a2=1,y=1
观测到的 y 值分别是 −5、7 和 1.
尤度函数 L 可以表示为:
L(β1,β2)=P(y1=−5,y2=7,y3=1∣β1,β2)
由于误差 e 服从标准正态分布 N(0,1), 每个观测值的概率密度函数为:
f(yi∣β1,β2)=2π1exp(−2(yi−(β1x1i+β2x2i))2)
尤度函数是所有观测值的联合概率密度函数的乘积:
L(β1,β2)=i=1∏3f(yi∣β1,β2)
将具体的观测数据代入, 得到:
L(β1,β2)=2π1exp(−2(−5−β1)2)×2π1exp(−2(7−β2)2)×2π1exp(−2(1−(β1+β2))2)
可以简化为:
L(β1,β2)=(2π1)3/2exp(−21[(−5−β1)2+(7−β2)2+(1−(β1+β2))2])
为了找到最尤估计(MLE) , 我们需要对 β1 和 β2 求导, 并使得导数为零. 由于 L 是一个乘积的指数函数, 处理起来不方便, 我们通常取对数尤度函数(log-likelihood function) :
logL(β1,β2)=−23log(2π)−21[(−5−β1)2+(7−β2)2+(1−(β1+β2))2]
对数尤度函数的最大化等同于尤度函数的最大化. 我们分别对 β1 和 β2 求偏导数, 并设为零:
对 β1 求偏导数:
∂β1∂logL=−∂β1∂[21((−5−β1)2+(1−(β1+β2))2)]=0
对 β2 求偏导数:
∂β2∂logL=−∂β2∂[21((7−β2)2+(1−(β1+β2))2)]=0
解决这两个方程可以得到 β1 和 β2 的最尤估计.
首先对 β1 的偏导数:
∂β1∂logL=−(−5−β1)−(1−(β1+β2))=0
⇒−5−β1+1−β1−β2=0
⇒−2β1−β2−4=0
⇒2β1+β2=−4(1)
然后对 β2 的偏导数:
∂β2∂logL=−(7−β2)−(1−(β1+β2))=0
⇒7−β2+1−β1−β2=0
⇒−β1−2β2+8=0
⇒β1+2β2=8(2)
联立方程(1) 和(2) 可以解出 β1 和 β2:
2β1+β2=−4β1+2β2=8
通过解这个线性方程组, 我们得到:
β1=−6β2=7
因此, 最尤估计 β1=−6 和 β2=7.