什么是联合熵 | 集智百科
本词条由集智俱乐部众包生产,难免存在纰漏和问题,欢迎大家留言反馈或者前往对应的百科词条页面进行修改,一经修改,可以获得对应的积分奖励噢!
目录
该图表示在变量X、Y相关联的各种信息量之间,进行加减关系的维恩图。两个圆重合的区域是联合熵H(X,Y)。左侧的圆(红色和紫色)是单个熵H(X),红色是条件熵H(X ǀ Y)。右侧的圆(蓝色和紫色)为H(Y),蓝色为H(Y ǀ X)。中间紫色的是相互信息i(X; Y)。
在信息论中, 联合熵是用于对与一组变量相关的不确定性进行度量。
定义
联合熵 的定义是:以比特为单位,对于具有x和y的两个离散随机变量函数X和Y有
其中x和y分别是X和Y的特定值,P(x,y)是这些值产生交集时的联合概率,如果P(x,y)=0那么P(x,y)log2[P(x,y)]定义为0。对于两个以上的随机变量X1X2,,,,Xn,它扩展为
其中x1,x2,,,,xn分别是X1X2,,,,,Xn的特定值,P(x1,x2,,,,xn)是这些值产生交集的概率,如果P(x1,x2,,,,xn)=0那么P(x,y)log2[P(x,y)]定义为0。
属性
非负性
一组随机变量的联合熵是一个非负数。
高值性/最值性/大于或等于单个熵的最大值
一组变量的联合熵大于或等于该组变量的所有单个熵的最大值。
低值性/小于或等于单个熵的总和
一组变量的联合熵小于或等于该组变量各个熵的总和,这是次可加性的一个运用实例。即当且仅当
与其他熵测度的关系
联合熵被用于定义条件熵:
它也被用于定义交互信息:
在量子信息论中,使用的是广义化的联合熵,即联合量子熵。
应用
在这里我们提供了一个python软件包,可用于计算n个变量的数据集中的所有多元联合熵、交互信息、条件交互信息、总相关性以及信息距离。
联合微分熵
定义
上文中的定义是针对离散随机变量的,而其实对于连续随机变量,联合熵同样成立。离散联合熵的连续形式称为联合微分(或连续)熵。令X和Y分别为具有联合概率密度函数f(x,y)的连续随机变量,那么微分联合熵h(X,Y)定义为:
对于两个以上的连续随机变量X1X2,,,,Xn,其定义可概括为:
这里可以用积分处理表达 f。当然,如果微分熵没有定义,那么积分也可能不存在。
属性
与离散条件下的联合熵相似,联合微分熵也具有同样的属性,即:一组随机变量的联合微分熵小于或等于各个随机变量的熵之和:
以下链式法则适用于两个随机变量:
对于两个以上的随机变量,一般可归纳为:
联合微分熵也用于定义连续随机变量之间的交互信息:
编者推荐
集智课程
信息熵和编码
https://campus.swarma.org/course/308
本课程对常见的编码方法进行了解析,对编码的特点与性质,以及编码的相关证明方法进行了说明。
熵
https://campus.swarma.org/course/3155
在本课程中,程帆老师讲解了熵的简史及定义,介绍了相对熵、相关熵、条件熵以及链式法则。
百科项目志愿者招募
在这里从复杂性知识出发与伙伴同行,同时我们希望有更多志愿者加入这个团队,使百科词条内容得到扩充,并为每位志愿者提供相应奖励与资源,建立个人主页与贡献记录,使其能够继续探索复杂世界。
如果你有意参与更加系统精细的分工,扫描二维码填写报名表,我们期待你的加入!
来源:集智百科
编辑:王建萍
点击“阅读原文”,阅读词条联合熵原文与参考文献