前言
EM算法是一种可以求解含有隐变量的迭代算法,当我们在实际过程中收集数据的时候,并不一定会收集全部的有效信息。比如,当我们想统计全校学生的身高分布的时候,可以将全校学生的身高看作是一个正态分布,但是毕竟男生和女生之间身高的分布还是有些不同的,但是万一我们没有对性别信息进行统计,而只是统计了身高信息的话,求得的概率分布的参数肯定会有较大的误差,这个时候,我们就需要将每一个样本的性别分布也考虑进去,从而希望获得更准确的概率分布估计。
提升方法(boosting)是一种常用的机器学习方法,应用十分广泛,而且效果非常好,近几年的很多比赛的优胜选手都或多或少使用了提升方法用以提高自己的成绩。
提升方法的本质是通过对每一个训练样本赋予一个权重,并通过改变这些样本的权重,来学习多个分类器,并按照一定的算法将这些分类器组合在一起,通常是线性组合,因为单个分类器往往效果有限,因此组合多个分类器往往会提高模型的性能。
Update your browser to view this website correctly. Update my browser now