アルファベットが {1,2,3,4} である単純マルコフ情報源の遷移確率行列が
0.500.500.50.50.50000γ00.501−γ
で与えられたとする.ここで, (i,j) 成分は遷移確率 P(j∣i) を表し, 0<γ<1 とする.以下の問いに答えよ:
- このマルコフ情報源の状態遷移図を図示せよ.
- このマルコフ情報源の定常確率分布が (1/8,1/4,1/8,1/2) であるとき, γ の値を求めよ.
- (2) が前問で求めた値となるとき、このマルコフ情報源のエントロピー率を求めよ.
- このマルコフ情報源に従う確率変数の列 X1,X2,… を考える.Xi が上述の定常確率分布 (1/8,1/4,1/8,1/2) に従う場合, (X1,X2) に対するハフマン符号化を行い, 符号的表示图を示せ.ただし符号語のアルファベットは {0,1} とする.
给定字母表为 {1,2,3,4} 的简单马尔可夫信息源, 其状态转移概率矩阵如下:
0.500.500.50.50.50000γ00.501−γ
其中 (i,j) 元素表示状态 i 转移到状态 j 的概率 P(j∣i), 0<γ<1.
- 绘制该马尔可夫信息源的状态转移图.
- 假设该马尔可夫信息源的平稳分布为 (1/8,1/4,1/8,1/2), 求 γ 的值.
- 在 γ 为前述求得的值时, 计算该马尔可夫信息源的熵率.
- 假设符号序列 X1,X2,… 服从平稳分布 (1/8,1/4,1/8,1/2), 为 (X1,X2) 执行哈夫曼编码, 并绘制编码结果的图. 假设编码字母表为 {0,1}.
下面给出在修正后转移概率矩阵下的完整解答。修正矩阵为
P=0.500.500.50.50.50000γ00.501−γ
其中P(j∣i)是从状态 i 转到 j 的概率。
题目设定:
- 状态(字母)集合为 {1,2,3,4}。
- 给定平稳(定常)分布 π=(81,41,81,21)。
- 需要回答:
- 状态迁移图
- 令该链的平稳分布正好是上述 π 时,求 γ。
- 用(2)求得的 γ 代入,计算该马尔可夫源的熵率。
- 若从该马尔可夫源出发,考虑随机变量 X1,X2,… 都具有边缘分布 π(题意里说“Xi 服从 (1/8,1/4,1/8,1/2)”),对取值 {1,2,3,4} 进行 Huffman 编码,并给出编码树(或“符号→码字”的对应)。
从矩阵的每一行(状态 i)出发,看哪些转移概率为正,即可画出如下有向图(圆圈表示状态,箭头表示可能的转移,标注相应的概率):
行 1 (i=1):
P(1→1)=0.5,P(1→2)=0.5,其余转移为 0。
即:10.51 和 10.52。
行 2 (i=2):
P(2→2)=0.5,P(2→4)=0.5,其余为 0。
即:20.52 和 20.54。
行 3 (i=3):
P(3→1)=0.5,P(3→2)=0.5,其余为 0。
即:30.51 和 30.52。
行 4 (i=4):
P(4→3)=γ,P(4→4)=1−γ,其余为 0。
即:4γ3 和 41−γ4。
可以把这几条箭头在纸上连起来,即得到状态迁移图。示意如下(用“→”画出非零概率的方向,并在箭头上标注对应的 0.5、γ 等):
(1) --0.5--> (1)
\
\--0.5--> (2) --0.5--> (2)
\
\--0.5--> (4) --(1−γ)--> (4)
^
| γ
(3) <--- 0.5 --- (3本身没有自环)
^
| 0.5
(3)
(3) --0.5--> (1)
--0.5--> (2)
(文本示意稍显杂乱,实际作图时更易看清:1 的自环、1→2、2 的自环、2→4、3→1、3→2、4→3、4 的自环。)
要让 π 成为该马尔可夫链的平稳分布,需满足
π=πP,即πj=i=1∑4πiP(i→j),j=1,2,3,4.
令 π=(π1,π2,π3,π4)=(81,41,81,21)。
π3=i=1∑4πiP(i→3).
从矩阵可知:
- P(1→3)=0,
- P(2→3)=0,
- P(3→3)=0,
- P(4→3)=γ.
因此
π3=π4γ=21γ.
但题目给出 π3=81,故
81=21γ⟹γ=41.
π4=i=1∑4πiP(i→4).
从矩阵可读出:
- P(1→4)=0,
- P(2→4)=0.5,
- P(3→4)=0,
- P(4→4)=1−γ.
所以
π4=π2⋅0.5+π4(1−γ)=(41)×0.5+(21)×(1−γ).
题目给定 π4=21,又我们已知 γ=41,代入则
左边=21;右边=41×0.5+21×(1−41)=81+21×43=81+83=21.
两边相等,一致。其余 π1,π2 对应的方程也会自动满足。由此可知:
γ=41即可让π=(1/8,1/4,1/8,1/2)成为平稳分布。
马尔可夫链(离散记忆源)的熵率公式为
H(源)=i=1∑4πiH(P(⋅∣i))=i=1∑4πi(−j∑P(i→j)log2P(i→j)),
其中对 P(i→j)=0 的项不计(或视为乘以 0)。下面逐行计算:
行 1: P(1→1)=0.5,P(1→2)=0.5。
分布 (0.5,0.5,0,0) 的熵为
H1=−(0.5log20.5+0.5log20.5)=1 bit.
行 2: P(2→2)=0.5,P(2→4)=0.5。
分布 (0,0.5,0,0.5) 的熵同上,也为
H2=1 bit.
行 3: P(3→1)=0.5,P(3→2)=0.5。
分布 (0.5,0.5,0,0),同理也是
H3=1 bit.
行 4: P(4→3)=γ=41,P(4→4)=1−γ=43。
分布 (0,0,41,43) 的熵为
H4=−(41log241+43log243)=−(41×(−2)+43log2(0.75))=21−43log2(0.75).
数值上,log2(0.75)≈−0.4150,
因此
H4≈0.5−0.75×(−0.4150)=0.5+0.3113=0.8113 bits (左右).
将它们按平稳分布加权:
H(源)=π1H1+π2H2+π3H3+π4H4=81×1+41×1+81×1+21×0.8113=(81+41+81)×1+21×0.8113=81+82+81+0.40565=84+0.40565=0.5+0.40565=0.90565 bits (近似).
如果要求精确到三位小数,可写
H(源)≈0.906 bits.
题目最后一问常见的作法:
- 视这 4 个符号(或状态)的出现概率分别为
p1=81,p2=41,p3=81,p4=21,
进行 Huffman 码的构造。
列出四个符号及其概率:
s1=1,p1=1/8;s2=2,p2=1/4;s3=3,p3=1/8;s4=4,p4=1/2.
选出两个最小概率项合并:
- 这里最小的是 s1 和 s3,各 1/8。合并得到新节点 N13,概率 1/4。
此时剩余的节点概率:
N13=1/4,s2=1/4,s4=1/2.
再次选出最小的两项合并(现在 N13 和 s2 并列最小,各 1/4),合并成新节点 N132,概率 1/2。
最后将 N132 (概率 1/2) 与 s4 (概率 1/2) 合并成根节点(概率 1)。由此生成一棵二叉树。若我们一贯约定“左分支标 0,右分支标 1”,可以得到下面的前缀码(只要保证前缀码唯一即可,小的交换并不影响平均长度)。
- 符号 4 :路径为“根 → 右”,码字可定为
1
。 - 符号 2 :从根 → 左 → 右,码字
01
。 - 符号 1 :从根 → 左 → 左 → 左右再分,实际上更简单写法是:先与 3 合并,再与 2 合并;一种典型的布置是
典型 Huffman 编码树可示意为(自上而下):
(根) (概率 1)
/ \
0 / \ 1
/ \
(N_{132}) (4)
(概率1/2) (概率1/2)
/ \
0/ \1
/ \
(N_{13}) (2)
(1/4) (1/4)
/ \
0/ \1
/ \
(1) (3)
(1/8) (1/8)
对应的码字分配(仅举一例):
- 4 :
1
- 2 :
01
- 1 :
000
- 3 :
001
这样就完成了对 {1,2,3,4} 的 Huffman 编码。在这 4 个符号的概率分布下,该码的平均长度可以算得是最优的。
- 状态图:根据修正矩阵可见
- 1→{1,2}、2→{2,4}、3→{1,2}、4→{3,4},
且相应概率如前。
- 求得 γ:令 π=(1/8,1/4,1/8,1/2) 成为不变分布,可解得 γ=41。
- 熵率:在 γ=1/4 时,用
H(源)=∑iπiH(P(⋅∣i))
计算可得约 0.906 bits。 - Huffman 编码:对出现概率 21,41,81,81 的 4 个符号,构造出的经典二叉 Huffman 码可为
4↦1,2↦01,1↦000,3↦001.