Loading [MathJax]/jax/output/CommonHTML/fonts/TeX/AMS-Regular.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >ML算法(二)——贝叶斯分类算法

ML算法(二)——贝叶斯分类算法

作者头像
用户7506105
发布于 2021-08-09 07:56:11
发布于 2021-08-09 07:56:11
5610
举报
文章被收录于专栏:碎片学习录碎片学习录

在一些支持并行或大数据量或不断增量更新数据的场景比如垃圾邮件的分类,文本有害识别,异常信号的捕捉等,贝叶斯算法都应用的非常普遍,它有较多的优良特性,且本身支持多分类的任务,所以也是分类算法领域较为基础和重要的一个,也是后续概率图信念网络等算法的基础。在解释贝叶斯分类器前,先了解两个概念,生成模型和判别模型

  • 生成模型

即从已知的数据集训练集(包含自变量和标签因变量)学习到关于自变量与因变量的联合概率分布

p(x,y)

(联合概率分布的概率密度函数为

f(x,y)

),然后根据学习到的联合概率分布去求条件概率

p(y|x)

的值作为因变量的预测评判,具体求法是条件概率公式,即

p(y|x)=p(x,y)p(x)

因为它还原了联合概率分布(或者是捕捉到了变量关联性),所以收敛速度快,且在有隐变量(暂时无法观测的中间变量)存在的情况下只能是生成模型,典型代表就是本文的贝叶斯法和隐马尔可夫模型

  • 判别模型

根据数据集训练集直接学习

y=f(x)

p(y|x)

,不会再由两者联合分布求得,此方法可以直接预测,过程简化且准确率更高,典型代表是回归模型和决策树

所以既然本文所述的贝叶斯法是生成模型,那肯定就是会求自变量因变量的联合概率分布了。在进入主题前需要用一些比较重要的概念作铺垫。

一些概念

  • 先验概率和后验概率

先验概率顾名思义就是在事件得到校验前发生的概率,也即是根据历史以往的经验和分析得到的自然概率,而后验概率则是当一件事情发生以后此时的概率,举个例子,比如一个陌生人在没有任何事件发生的前提下判断他是中国人的概率约为

的概率,而如果他说了一句中文,那么他在这件事发生的前提下是中国人的概率不可能是0.2了,而这个概率就是后验概率。

  • 全概率公式和贝叶斯定理

这是概率论学科中一个非常重要的公式定理,设样本空间为E,而在该空间的每一个可能发生的事件为

,且事件之间互斥(不可能同时发生),事件总和构成样本空间,发生概率为

则一定大于等于0,若A为空间中的一个随机事件,A发生的概率就一定等于A在

事件发生时发生的概率(条件概率)乘以

事件发生时发生的概率的总合,即

而贝叶斯定理刻画的是当事件A发生了,那

事件发生的概率为多少呢,所以很显然

上式的分子表示两事件同时发生的概率

朴素贝叶斯法

做了每个自变量特征

相互独立的假设,所以才显得朴素

思想

  • 根据特征相互独立的假设学习出自变量输入与因变量输出的联合概率分布
  • 基于联合概率分布,利用贝叶斯定理求得后验概率最大的输出(往下看)

期望风险

由损失(风险)函数为

则期望风险(对损失取期望),为

朴素贝叶斯的分类标准是希望找到后验概率最大时的那个y类别,即是寻求后验概率最大化,它也可以理解为是此时的期望风险的最小化

贝叶斯估计

贝叶斯估计和朴素贝叶斯算法有所不同,贝叶斯估计可以为朴素贝叶斯提供频率估计概率的一种思想一种改进而已,即将朴素贝叶斯里面的极大似然频率估计概率换成了贝叶斯估计

半朴素贝叶斯分类

总结

贝叶斯分类法的一个重要优点就是速度很快,可以并行学习,且支持增量插入训练数据,且横向也可以避免维度特征太多的情况(不像决策树特征越多树高度一般会更高)

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-07-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 碎片学习录 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
太赞了!机器学习基础核心算法:贝叶斯分类!(附西瓜书案例及代码实现)
寄语:首先,简单介绍了生成模型和判别模型,对条件概率、先验概率和后验概率进行了总结;其次,对朴素贝叶斯的原理及公式推导做了详细解读;再次,对三种可能遇到的问题进行了解析,给出了合理的解决办法;最后,对朴素贝叶斯的sklearn参数和代码进行了详解。
Datawhale
2020/05/16
2.5K0
机器学习 | 朴素贝叶斯理论
朴素贝叶斯法是一种直接衡量标签和特征之间的概率关系的有监督学习算法,是一种专注分类的算法。
数据STUDIO
2021/06/24
5570
【机器学习基础】朴素贝叶斯的算法实现
本次我们将梳理下朴素贝叶斯(Naive Bayes)的相关内容。 本文约1.6k字,预计阅读10分钟。
黄博的机器学习圈子
2021/02/08
6770
《统计学习方法》极简笔记P4:朴素贝叶斯公式推导
朴素贝叶斯基本方法 通过训练数据集 学习联合概率分布P(X,Y),即学习先验概率分布 条件概率分布 假设条件独立 然后根据学习到的模型计算后验概率分布,根据贝叶斯定理 条件概率带入,得 于是
Ai学习的老章
2019/08/21
9440
《统计学习方法》极简笔记P4:朴素贝叶斯公式推导
机器学习21:概率图--朴素贝叶斯模型
贝叶斯决策论是概率框架下实施决策的基本方法。朴素贝叶斯属于生成式模型,即先对联合分布P(x,c)建模,然后再由此获得后验概率P(c|x),朴素贝叶斯分类的是所有属性之间的依赖关系在不同类别上的分布。
用户5473628
2019/08/08
1.1K0
机器学习21:概率图--朴素贝叶斯模型
机器学习-23:MachineLN之朴素贝叶斯
贝叶斯模型是指模型参数的推断用的是贝叶斯估计方法,也就是需要指定先验分布,再求取后验分布。
MachineLP
2022/05/09
3610
机器学习-23:MachineLN之朴素贝叶斯
算法工程师-机器学习面试题总结(2)
线性回归是一种用于建立和预测变量之间线性关系的统计模型。其基本思想是假设自变量(输入)和因变量(输出)之间存在线性关系,通过建立一个线性方程来拟合观测数据,从而进行预测和推断。
机器学习AI算法工程
2023/09/04
6090
算法工程师-机器学习面试题总结(2)
朴素贝叶斯分类算法(Naive Bayes Classification Algorithm)
朴素贝叶斯分类算法(Naive Bayes Classification Algorithm)是一种基于贝叶斯定理和特征条件独立假设的分类方法。以下是对该算法的清晰介绍:
jack.yang
2025/04/05
1550
统计学习方法:朴素贝叶斯方法
贝叶斯法则是统计学的一个基础法则,它奠定了贝叶斯估计的理论基础,为统计估计提供了一条更客观科学的新思路。在当前的机器学习的概率模型中,有很多方法都是基于贝叶斯这个框架建立的。具体的,贝叶斯法则有如下推导:
Ai学习的老章
2019/04/10
6660
朴素贝叶斯算法详解(1)
1. 引言   朴素贝叶斯算法(Naive Bayes)是机器学习中常见的基本算法之一,主要用来做分类任务的。它是基于贝叶斯定理与条件独立性假设的分类方法。对于给定的训练数据集,首先基于特征条件独立性假设学习输入/输出的联合概率分布,然后基于此模型,对于给定的输入 x 利用贝叶斯定理求出后验概率最大的输出 y。   基于以上的解释,我们知道:1. 该算法的理论核心是贝叶斯定理;2. 它是基于条件独立性假设这个强假设之下的,这也是该算法为什么称为“朴素”的原因。 本文将从以下几个角度去详细解释朴素贝
机器学习算法工程师
2018/03/06
8170
基于Spark的机器学习实践 (八) - 分类算法
贝叶斯定理(英语:Bayes' theorem)是概率论中的一个定理,描述在已知一些条件下,某事件的发生概率。
JavaEdge
2019/04/16
1.9K0
基于Spark的机器学习实践 (八) - 分类算法
《机器学习》-- 第七章 朴素贝叶斯
贝叶斯分类器是一种概率框架下的统计学习分类器,对分类任务而言,假设在相关概率都已知的情况下,贝叶斯分类器考虑如何基于这些概率为样本判定最优的类标。
fireWang
2020/08/07
1K0
基于Spark的机器学习实践 (八) - 分类算法
贝叶斯定理(英语:Bayes’ theorem)是[概率论]中的一个[定理],描述在已知一些条件下,某事件的发生概率。 比如,如果已知某癌症与寿命有关,使用贝叶斯定理则可以通过得知某人年龄,来更加准确地计算出他罹患癌症的概率。
JavaEdge
2022/11/30
1.2K0
基于Spark的机器学习实践 (八) - 分类算法
【机器学习】朴素贝叶斯算法详解与实战扩展
朴素贝叶斯算法是一种基于概率统计的分类方法,它利用贝叶斯定理和特征条件独立假设来预测样本的类别。尽管其假设特征之间相互独立在现实中往往不成立,但朴素贝叶斯分类器因其计算简单、效率高、对缺失数据不敏感等优点,在文本分类、垃圾邮件过滤、情感分析等领域有着广泛的应用。
破晓的历程
2024/08/20
3600
A.机器学习入门算法(二): 朴素贝叶斯(Naive Bayes)
朴素贝叶斯算法(Naive Bayes, NB) 是应用最为广泛的分类算法之一。它是基于贝叶斯定义和特征条件独立假设的分类器方法。由于朴素贝叶斯法基于贝叶斯公式计算得到,有着坚实的数学基础,以及稳定的分类效率。NB模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。当年的垃圾邮件分类都是基于朴素贝叶斯分类器识别的。
汀丶人工智能
2023/03/22
8840
A.机器学习入门算法(二): 朴素贝叶斯(Naive Bayes)
朴素贝叶斯深度解码:从原理到深度学习应用
朴素贝叶斯(Naive Bayes)是一种基于贝叶斯定理的分类技术,具有实现简单、易于理解、且在多种应用场景中表现优秀的特点。本节旨在介绍贝叶斯定理的基本历史和重要性,以及朴素贝叶斯分类器的应用场景。
TechLead
2023/10/21
1.1K0
朴素贝叶斯深度解码:从原理到深度学习应用
朴素贝叶斯 朴素贝叶斯原理
由于这一假设,朴素贝叶斯法的学习与预测大为简化。因而朴素贝叶斯法高效,且易于实现。其缺点是分类的性能不一定很高。
小小程序员
2023/12/09
3140
朴素贝叶斯 朴素贝叶斯原理
(数据科学学习手札30)朴素贝叶斯分类器的原理详解&Python与R实现
  要介绍朴素贝叶斯(naive bayes)分类器,就不得不先介绍贝叶斯决策论的相关理论:
Feffery
2018/05/05
1.8K3
(数据科学学习手札30)朴素贝叶斯分类器的原理详解&Python与R实现
言简意赅了解十大常见AI算法
二分类的线性分类模型,也是判别模型。 目的是求出把训练数据进行线性划分的分离超平面。 感知机是神经网络和支持向量机的基础。 学习策略:极小化损失函数。损失函数对应于误分类点到分离超平面的总距离。 基于随机梯度下降法对损失函数的最优化算法,有原始形式和对偶形式。
zenRRan
2019/11/20
1K0
朴素贝叶斯(Naive Bayes)
朴素贝叶斯法通过训练数据集学习联合概率分布P(X,Y),具体方法是通过参数估计的方法学习类标签的先验概率和对应的条件概率分布,然后利用贝叶斯公式对后验概率进行计算,将后验概率最大的类进行输出。
爱编程的小明
2022/09/05
3230
朴素贝叶斯(Naive Bayes)
推荐阅读
相关推荐
太赞了!机器学习基础核心算法:贝叶斯分类!(附西瓜书案例及代码实现)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档