强烈建议你试试无所不能的chatGPT，快点击我

EM算法笔记

阅读量：5117 次

发布时间：2019-06-13

本文共 1593 字，大约阅读时间需要 5 分钟。

EM算法在很多地方都用使用到，比如简单的K-means算法，还有在隐马尔可夫里面，也涉及到了EM算法，可见EM算法在机器学习领域的重要地位。在这里就写一下我对于EM算法的一些理解笔记。后续有新的理解也会追加的。

EM算法的全称叫做：期望最大。EM算法的想法很简单，就像一个人有两条腿向前走，你总是需要固定一条腿动另一条腿这样交替往前走。这里面的两条腿，一个是隐变量，一个是参数

凹凸函数

这个是《最优化》里面的概念，如果它的二阶导大于0，那么就是凸函数；如果是二阶导小于0，那么就是凹函数。（我记得《最优化》数学老师说，高数的定义和最优化的定义是反着的，因为用的概念不一样，高数好像用的是前苏联的定义，最优化是用的欧洲定义。我也不知道是不是真的……）。这样可能不是很容易记住，所以就取两个很有代表性的函数，方便记忆：凸函数：

Jensen不等式

这个是EM里面，我认为最重要的一个概念，因为它其实是贯穿整个EM的算法里面的。Jensen不等式的概念也很简单，就是如果是凸函数：f(E(x)) < E(f(x));凹函数：f(E(x)) > E(f(x))。这个定义可能一开始没看明白是什么意思，主要问题可能是那个E(x)的期望。换一个简单的说法, 就是如果是凸函数

EM算法

给定的训练样本是

我们可以求出这个模型的最大似然估计：

然后取对数：

但是，在这个模型里面我们认为

之前求最大似然是很容易，取完对数求导就可以了，但是现在不行，因为有一个隐变量了。那么应该怎么做呢，我们可以固定一个参数，先求另一个参数的最大化，然后再求之前固定的参数。

但是先固定哪个呢，还是随便固定？（这个问题在K-means里面也有，后面再解释。）

这里，我们先观察上面那个式子，直接想出

我们可以把jensen的f(x)换log就是上面那个式子了。

EM算法可以写成：

EM推导

EM要解决两个问题，一个是什么时候等式相等；二是为什么一定收敛。

什么时候等式成立呢？

x=E(x)的时候，你带入就会发现两边等式是相等的。因为都是取那一个点，而且概率也一样，所以自然相等。所以就是

然后把Q乘过去，并对所有的z求和，得到:

因此我们可以知道

为什么一定收敛？

其实为什么收敛需要解决的一个问题是，是否是单调，如果是单调的话，就可以通过变化幅度来决定。

其实这两个问题，也是E与M分别需要解决的问题，E就是让等式成立，而M就是让新状态大于旧状态。

参考资料：

转载于:https://www.cnblogs.com/hsinyu/p/10792998.html

你可能感兴趣的文章

HTML+CSS学习笔记（九）

Java泛型的基本使用

1076 Wifi密码 (15 分)

noip模拟赛党

bzoj2038 [2009国家集训队]小Z的袜子(hose)

Java反射机制及其Class类浅析

Postman-----如何导入和导出

移动设备显示尺寸大全 CSS3媒体查询

图片等比例缩放及图片上下剧中

【转载】Linux screen 命令详解

background-clip,background-origin

Android 高级UI设计笔记12：ImageSwitcher图片切换器

Blog文章待看

【Linux】ping命令详解

对团队成员公开感谢博客

java学习第三天

django+uwsgi+nginx+sqlite3部署＋screen

Andriod小型管理系统（Activity，SQLite库操作，ListView操作）（源代码下载）

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-11-18 05:35:29 当前IP: 18.217.145.189 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我