作业帮 > 数学 > 作业

求有关哈夫曼编码的问题?

来源:学生作业帮 编辑:作业帮 分类:数学作业 时间:2024/05/12 19:46:36
求有关哈夫曼编码的问题?
所列的数据表给出了在一篇有19710个的英文文章中出现最普通的15个单词的出现频度.假定一篇正文仅由上述字符数据表中的词组成,那么它们的最佳编码是什么?平均长度是多少?

频率:1192, 677 ,541, 518, 462, 450 ,242, 195, 190 ,181, 174, 157, 138, 124, 123
先编造哈夫曼树,哈夫曼树构造规则:
假设有n个权值,则构造出的哈夫曼树有n个叶子结点.n个权值分别设为 w1、w2、…、wn,则哈夫曼树的构造规则为:
(1) 将w1、w2、…,wn看成是有n 棵树的森林(每棵树仅有一个结点);
(2) 在森林中选出两个根结点的权值最小的树合并,作为一棵新树的左、右子树,且新树的根结点权值为其左、右子树根结点权值之和;
(3)从森林中删除选取的两棵树,并将新树加入森林;
(4)重复(2)、(3)步,直到森林中只剩一棵树为止
如下:( 5364 )
/ \
(2251) ( 3113 )
/ \ / \
(1059) 1192 ( 1327 ) ( 1786 )
/ \ / \ / \
518 541 ( 650 ) 677 (835) ( 951)
/ \ / \ / \
(295) (355) (385) 450 462 (489)
/ \ / \ / \ / \
138 157 174 181 190 195 242 (247)
/ \
123 124
左边默认为0,右边为1得到编码是
123:111110 124:111111 138:10000 157:10001 174:10010 181:10011
190:11000 195:11001 242:11110 450:1101 462:1110 518:000
541:001 677:101 1192:01
平均长度指所有叶子结点 频率*长度 /总频率 具体还是自己算吧.