ML与Information:机器学习与Information信息论之间那些七七八八、乱七八糟、剪不断理还乱的关系攻略
目录
ML与信息论
更新……
ML与熵
1、熵的基础知识
(1)、相对熵:两个KL散度的区别:
1)、绿色曲线是真实分布p的等高线;红色曲线是使用近似p(z1,z2)=p(z1)p(z2)得到的等高线。
2)、蓝色曲线是真实分布p的等高线;红色曲线是单模型近似分布q的等高线。
(2)各种熵之间的关系图
2、熵与分布的关系
(1)、两点分布的熵
(2)、三点分布的熵
3、最大熵模型与Logistic/Softmax回归
Logistic/Softmax回归的后验概率
最大熵模型的后验概率
相关文献推荐
《A Brief MaxEnt Tutorial》 Adam Berger
《A simple Introduction to Maximum Entropy Models for Natural Language Processing》Adwait Ratnaparkhi
《Learning to parse natural language with maximum entropy models》 Adwait Ratnaparkhi
《统计学习方法》李航,清华大学出版社,2012年
《Elements of Information Theory》 Cover & Thomas
《A maximum entropy approach to natural language processing 》Adam Berger