转载自 黄锦池:http://blog.youkuaiyun.com/hjimce/article/details/73770644?locationNum=4&fps=1 这篇博客里介绍了为什么最大化似然等价于最小化KL散度。