作业帮 > 数学 > 作业

为什么在计算信息熵的时候要用log?

来源:学生作业帮 编辑:作业帮 分类:数学作业 时间:2024/05/25 17:00:31
为什么在计算信息熵的时候要用log?
熵在信息论中的定义如下:  如果有一个系统S内存在多个事件S = {E1,...,En},每个事件的机率分布 P = {p1,...,pn},则每个事件本身的讯息为   Ie = − log2pi   (对数以2为底,单位是位元(bit))   Ie = − lnpi   (对数以e为底,单位是纳特/nats)   如英语有26个字母,假如每个字母在文章中出现次数平均的话,每个字母的讯息量为   I_e = -\log_2 {1\over 26} = 4.7   ;而汉字常用的有2500个,假如每个汉字在文章中出现次数平均的话,每个汉字的信息量为   I_e = -\log_2 {1\over 2500} = 11.3   整个系统的平均消息量为   H_s = \sum_{i=1}^n p_i I_e = -\sum_{i=1}^n p_i \log_2 p_i   这个平均消息量就是消息熵.因为和热力学中描述热力学熵的玻耳兹曼公式形式一样,所以也称为“熵”.