机器学习基础知识笔记（一）– 极大似然估计、高斯混合模型与EM算法

2023年4月12日下午8:35 • 机器学习

常说的概率是指给定参数后，预测即将发生的事件的可能性。拿硬币这个例子来说，我们已知一枚均匀硬币的正反面概率分别是0.5，要预测抛两次硬币，硬币都朝上的概率：

H代表Head，表示头朝上

p(HH | pH = 0.5) = 0.5*0.5 = 0.25.

这种写法其实有点误导，后面的这个p其实是作为参数存在的，而不是一个随机变量，因此不能算作是条件概率，更靠谱的写法应该是 p(HH;p=0.5)。

而似然概率正好与这个过程相反，我们关注的量不再是事件的发生概率，而是已知发生了某些事件，我们希望知道参数应该是多少。

现在我们已经抛了两次硬币，并且知道了结果是两次头朝上，这时候，我希望知道这枚硬币抛出去正面朝上的概率为0.5的概率是多少？正面朝上的概率为0.8的概率是多少？

如果我们希望知道正面朝上概率为0.5的概率，这个东西就叫做似然函数，可以说成是对某一个参数的猜想（p=0.5）的概率，这样表示成(条件)概率就是

L(pH=0.5|HH) = P(HH|pH=0.5) = （另一种写法）P(HH;pH=0.5).

为什么可以写成这样？我觉得可以这样来想：

似然函数本身也是一种概率，我们可以把L(pH=0.5|HH)写成P(pH=0.5|HH); 而根据贝叶斯公式，P(pH=0.5|HH) = P(pH=0.5,HH)/P(HH)；既然HH是已经发生的事件，理所当然P(HH) = 1,所以：

P(pH=0.5|HH) = P(pH=0.5,HH) = P(HH;pH=0.5).

右边的这个计算我们很熟悉了，就是已知头朝上概率为0.5，求抛两次都是H的概率，即0.5*0.5=0.25。

所以，我们可以safely得到:

L(pH=0.5|HH) = P(HH|pH=0.5) = 0.25.

这个0.25的意思是，在已知抛出两个正面的情况下，pH = 0.5的概率等于0.25。

如果考虑 $p H = 0.6，那么似然函数的值也会改变。$

$机器学习基础知识笔记（一）-- 极大似然估计、高斯混合模型与EM算法$

机器学习基础知识笔记（一）-- 极大似然估计、高斯混合模型与EM算法

注意到似然函数的值变大了。这说明，如果参数 $p H 的取值变成0.6的话，结果观测到连续两次正面朝上的概率要比假设 p H = 0.5时更大。也就是说，参数 p H 取成0.6 要比取成0.5 更有说服力，更为“合理”。总之，似然函数的重要性不是它的具体取值，而是当参数变化时函数到底变小还是变大。对同一个似然函数，如果存在一个参数值，使得它的函数值达到最大的话，那么这个值就是最为“合理”的参数值。$

在这个例子中，似然函数实际上等于：

$机器学习基础知识笔记（一）-- 极大似然估计、高斯混合模型与EM算法$ ，其中

$机器学习基础知识笔记（一）-- 极大似然估计、高斯混合模型与EM算法$ 。

如果取 $p H = 1，那么似然函数达到最大值1。也就是说，当连续观测到两次正面朝上时，假设硬币投掷时正面朝上的概率为1是最合理的。$

类似地，如果观测到的是三次投掷硬币，头两次正面朝上，第三次反面朝上，那么似然函数将会是：

$机器学习基础知识笔记（一）-- 极大似然估计、高斯混合模型与EM算法$ ，其中T表示反面朝上，

$机器学习基础知识笔记（一）-- 极大似然估计、高斯混合模型与EM算法$ 。

这时候，似然函数的最大值将会在 $机器学习基础知识笔记（一）-- 极大似然估计、高斯混合模型与EM算法$ 的时候取到。也就是说，当观测到三次投掷中前两次正面朝上而后一次反面朝上时，估计硬币投掷时正面朝上的概率 $机器学习基础知识笔记（一）-- 极大似然估计、高斯混合模型与EM算法$ 是最合理的。

那么最大似然概率的问题也就好理解了。

最大似然概率，就是在已知观测的数据的前提下，找到使得似然概率最大的参数值。

极大似然估计

如果总体X为离散型

假设分布率为θ时，发生x的的概率。

那么当我们的样本值为：x1,x2,...,xn时，

机器学习基础知识笔记（一）-- 极大似然估计、高斯混合模型与EM算法

其中L(θ)成为样本的似然函数。

假设

机器学习基础知识笔记（一）-- 极大似然估计、高斯混合模型与EM算法

有 θ 的极大似然估计值。

如果总体X为连续型

基本和上面类似，只是概率密度为f(x;θ)，替代p。

解法

构造似然函数L(θ)
取对数：lnL(θ)
求导，计算极值
解方程，得到θ

解释一下，其他的步骤很好理解，第二步取对数是为什么呢？

因为根据前面你的似然函数公式，是一堆的数字相乘，这种算法求导会非常麻烦，而取对数是一种很方便的手段：

由于ln对数属于单调递增函数，因此不会改变极值点
由于对数的计算法则：lnab=lna+lnb ，求导就很方便了

EM算法

https://blog.csdn.net/zouxy09/article/details/8537620 （讲得很详细）

参考资料：

[1] https://en.wikipedia.org/wiki/Likelihood_function

[2] https://www.cnblogs.com/zhsuiy/p/4822020.html(似然函数)

[3] https://blog.csdn.net/fangbingxiao/article/details/78878141(似然函数)

[4] https://blog.csdn.net/expleeve/article/details/50466602(似然函数)

[5] https://www.cnblogs.com/xing901022/p/8418894.html(极大似然估计法)

[6] https://blog.csdn.net/zouxy09/article/details/8537620(从最大似然到EM算法浅解) 非常好！！！

[7] http://www.cnblogs.com/wjy-lulu/p/7010258.html

[8] http://www.ituring.com.cn/article/497545 (一文详解高斯混合模型原理)

[9] https://blog.csdn.net/jinping_shi/article/details/59613054 (高斯混合模型（GMM）及其EM算法的理解)

[10] http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006924.html (混合高斯模型（Mixtures of Gaussians）和EM算法)

[11] https://blog.csdn.net/jasonzhoujx/article/details/81947663 (高斯混合模型(GMM)应用：分类、密度估计、生成模型)

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：机器学习基础知识笔记（一）– 极大似然估计、高斯混合模型与EM算法 - Python技术站

人工智能机器学习

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

机器学习（一）：梯度下降、神经网络、BP神经网络

上一篇 2023年4月12日

为什么要学习机器学习？如何学习

下一篇 2023年4月12日

目标检测

大话目标检测经典模型（RCNN、Fast RCNN、Faster RCNN）

2019独角兽企业重金招聘Python工程师标准>>> 目标检测是深度学习的一个重要应用，就是在图片中要将里面的物体识别出来，并标出物体的位置，一般需要经过两个步骤： 1、分类，识别物体是什么 2、定位，找出物体在哪里除了对单个物体进行检测，还要能支持对多个物体进行检测，如下图所示：这个问题并不是那么容易解决，由于物体的尺寸变化范…

2023年4月8日
000
卷积神经网络

OpenCV-C++ 图像卷积计算的边缘问题

目录卷积边缘问题卷积边缘问题图像在执行卷积计算的时候,图像边缘的像素无法被计算,边缘无法被卷积核正确覆盖; BORDER_DEFAULT BORDER_CONSTANT: 填充边缘用指定像素值; BORDER_REPLICATE: 填充边缘像素用已知的边缘像素值; BORDER_WRAP: 用另外一遍的像素来补偿填充; 使用copyMakeBorder…

2023年4月6日
000
anaconda 安装caffe,cntk,theano-未整理

一，anancona 安装https://repo.anaconda.com/archive/ conda create -n caffe_gpu -c defaults python=3.6 caffe-gpuconda create -n caffe -c defaults python=3.6 caffe 测试:import caffepython -…

Caffe 2023年4月7日
000
卷积神经网络

卷积神经网络对图片分类-中

接上篇：卷积神经网络对图片分类-上 5 池层（Pooling Layers）池层通常用在卷积层之后，池层的作用就是简化卷积层里输出的信息, 减少数据维度，降低计算开销，控制过拟合。如之前所说，一张28X28的输入图片，经过5X5的过滤器后会得到一个24X24的特征图像，继续简化这个24X24特征图像里的信息，只保留关键信息。需要加入一个池层： …

2023年4月8日
000
ubuntu下anaconda使用jupyter notebook加载tensorflow、pytorch

1.　　安装完anaconda后，其环境会为我们在base(root)这个环境下配置jupyter notebook,而我们自己配置的TensorFlow环境下是没有自动配置这个工具的，所以我们需要自己在这个环境下配置jupyter notebook工具，具体操作如下： 1 conda activate tf #首先激活自己的tensorflow环境，tf为…

PyTorch 2023年4月8日
000
Caffe

Caffe-5.2-（GPU完整流程）训练（依据googlenet微调）

上一篇使用caffenet的模型微调。但由于caffenet有220M太大，測试速度太慢。因此换为googlenet. 1. 训练迭代了2800次时死机，大概20分钟。使用的是2000次的模型。 2. 測试 2.1 測试批处理在F:caffe-master170309新建例如以下图文件test-TrafficJamBigData03292057.bat。…

2023年4月7日
000
Pytorch Tensor 维度的扩充和压缩

维度扩展 x.unsqueeze(n) 在 n 号位置添加一个维度例子： import torch x = torch.rand(3,2) x1 = x.unsqueeze(0) # 在第一维的位置添加一个维度 x2 = x.unsqueeze(1) # 在第二维的位置添加一个维度 x3 = x.unsqueeze(2) # 在第三维的位置添加一个维度 p…

PyTorch 2023年4月8日
000
pytorch打印模型结构图

import torchsummary from torchvision.models.resnet import * net = resnet18().cuda() print(net) 打印出来的结果是以文本形式显示，显示出模型的每一层是由什么层构成的，一般来说深度卷积网络是由结构类似的基本模块组成，内部参数会有区别。查看模型结构主要是为了看在某些…

PyTorch 2023年4月7日
000

合作推广

合作推广

返回顶部