Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >CS229 课程笔记之四:生成学习算法

CS229 课程笔记之四:生成学习算法

作者头像
口仆
修改于 2020-08-17 10:20:57
修改于 2020-08-17 10:20:57
3650
举报

上图表示的分布均值均为 ,对应的协方差矩阵为:

左边的图就是标准正态分布,而可以看到随着非对角线上数值的增大,分布在45度方向上压缩的幅度越大,通过下面的轮廓图可以更清楚地展现这个特点:

下面是另一组例子:

上图对应的协方差为:

用图形来表示,该算法可以表示为下图:

这与逻辑回归的形式完全相同。但一般来说,对于相同的数据集两种算法会给出不同的边界,究竟哪一个更好呢?

一个有趣的结论是:

❝如果 属于多元高斯分布(共享 ),那么 一定是逻辑函数,反之不成立。 ❞

总结一下,GDA 进行了更强的模型假设并且数据有效性更高(需要更少的数据来学习),但其前提条件是模型假设正确或近似正确;逻辑回归进行较弱的假设,对于模型假设偏离的鲁棒性更好。如果数据集实际上不是高斯分布,那么在数据有限的情况下,逻辑回归一般会表现得比 GDA 更好。因此,实际中使用逻辑回归的情况比 GDA 多得多。

3 朴素贝叶斯算法

3.1 算法概述

在高斯判别分析中,输入是连续变量。现在我们要谈谈一个不同的生成学习算法,其中 是「离散变量」。

现在我们有(以50000维度为例):

第一个等式来自于概率的基本性质;第二个等式则使用了朴素贝叶斯假设。即使这个假设在现实中不一定成立,但其实际的效果还是不错的。

在之前的例子中,输入的每一维特征都是是二元的,其对应的分布是伯努利分布。而当特征是多元时,其对应的分布应该用「多项式分布」建模。

实际上,即便一些原始的输入数据是连续值,我们可以通过一个映射表将连续值映射为离散值,然后运用朴素贝叶斯方法进行建模:

当原始连续值的数据不能很好的用多元正态分布进行建模时,将其离散化再使用朴素贝叶斯建模往往会取得更好的效果。

3.2 拉普拉斯平滑

4 思维导图

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-02-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 口仆 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
判别模型、生成模型与朴素贝叶斯方法
1、判别模型与生成模型 回归模型其实是判别模型,也就是根据特征值来求结果的概率。形式化表示为 ,在参数 确定的情况下,求解条件概率 。通俗的解释为在给定特征后预测结果出现的概率。 比如说要确定一
机器学习AI算法工程
2018/03/12
1.3K0
判别模型、生成模型与朴素贝叶斯方法
机器学习课程_笔记05
生成学习算法 logistic回归的执行过程就是要搜索这样的一条直线,能够将两类数据分隔开。 判别学习算法描述为以下公式: image.png 所以logistics回归是判别学习算法的一个例子。 一个生成学习算法给定所属的类的情况下显示某种特定特征的概率。其计算公式如下: image.png 一个生成学习算法一开始是对(P(X|y))进行建模,而不是对(P(y|X))。 高斯判别分析 推导过程: image.png image.png 生成学习算法与判别学习算法的对比 这里有几个结论: 如果(X|y
jeremyxu
2018/05/10
6100
生成模型学习笔记:从高斯判别分析到朴素贝叶斯
判别模型是一种对观测数据进行直接分类的模型,常见的模型有逻辑回归和感知机学习算法等。此模型仅对数据进行分类,并不能具象化或者量化数据本身的分布状态,因此也无法根据分类生成可观测的图像。
机器之心
2019/01/02
1K0
图解机器学习 | 朴素贝叶斯算法详解
教程地址:http://www.showmeai.tech/tutorials/34
ShowMeAI
2022/03/10
2.8K0
图解机器学习 | 朴素贝叶斯算法详解
CS229 课程笔记之九:EM 算法与聚类
为了证明 k-means 算法能否保证收敛,我们定义「失真函数」(distortion function)为:
口仆
2020/08/14
9390
机器学习(14)——朴素贝叶斯算法思想:基于概率的预测贝叶斯公式朴素贝叶斯算法示例:文本数据分类
前言:在所有的机器学习分类算法中,朴素贝叶斯和其他绝大多数的分类算法都不同。对于大多数的分类算法,比如决策树,KNN,逻辑回归,支持向量机等,他们都是判别方法,也就是直接学习出特征输出Y和特征X之间的关系,要么是决策函数Y=f(X)要么是条件分布P(Y|X)。但是朴素贝叶斯却是生成方法,也就是直接找出特征输出Y和特征X的联合分布然后用P(Y|X)=P(X,Y)/P(X)得出。 朴素贝叶斯很直观,计算量也不大,在很多领域有广泛的应用, 算法思想:基于概率的预测 逻辑回归通过拟合曲线(或者学习超平面)实现分类
DC童生
2018/04/27
14.4K0
机器学习(14)——朴素贝叶斯算法思想:基于概率的预测贝叶斯公式朴素贝叶斯算法示例:文本数据分类
因子的有效性分析基于7种机器学习算法【系列54】
今天,继续我们的机器学习应用量化投资系列。本期我们介绍一篇研究报告,详细的介绍了7中机器学习算法在因子有效性上的展现。希望给大家在写策略时做一些参考借鉴。 前言 逻辑依旧明了,机器学习并非黑箱 谈到机器学习,大家最忌讳的便是黑箱问题。其实不必,理解机器学习算法,逻辑实则简单,比如相同的因子特征将会有相同的表现。在实战中,我们发现, 该逻辑十分有效,在我们的机器学习选股模型中,该逻辑连续十几年不曾被打破。 Adaboost 最稳定,朴素贝叶斯收益最高 全市场选股,市值中性选股等权加权,行业中性选股等
量化投资与机器学习微信公众号
2018/03/20
2K0
因子的有效性分析基于7种机器学习算法【系列54】
CS229 课程笔记之十:因子分析
。因此我们无法写出该分布的概率密度函数,也就无法对其建模。我们可以将其理解为线性方程组求解,未知数的个数比方程数目多,因而无法完全求出所有未知数。原文使用了仿射空间进行解释,并不是很懂( ⊙ o ⊙ )。
口仆
2020/08/14
5630
机器学习算法中的概率方法
AI 科技评论按,本文作者张皓,目前为南京大学计算机系机器学习与数据挖掘所(LAMDA)硕士生,研究方向为计算机视觉和机器学习,特别是视觉识别和深度学习。
AI科技评论
2019/10/31
1.4K0
机器学习算法中的概率方法
机器学习-朴素贝叶斯分类器
使用贝叶斯定理,我们可以找到已知B发生,A发生的可能性。在这里,B是证据,A是假设。这里所做的假设是预测变量/特征是独立的。也就是说,一个特定功能的存在不会影响其他功能。因此,它被称为朴素。
XXXX-user
2019/09/25
7720
机器学习-朴素贝叶斯分类器
Android程序员想进大厂?算法很重要!2020年必学的 10 大算法关注一下
最近一个朋友和我反馈,他坚持刷题2个月,终于去了他梦寐以求的大厂,薪资涨幅非常可观,期间面字节跳动还遇到了原题...并表示目前国内的大厂和一些独角兽,已经越来越效仿硅谷公司的做法,通过面试给定题编程,来考察数据结构 和算法的扎实程度。
Android技术干货分享
2020/09/08
4260
Android程序员想进大厂?算法很重要!2020年必学的 10 大算法关注一下
朴素贝叶斯以及三种常见模型推导
朴素贝叶斯算法Naive Bayes定义中有两个关键定义:特征之间强假设独立和贝叶斯定理.这两个定义就是朴素贝叶斯的关键.接下来先了解一下这两个定义.
公众号-不为谁写的歌
2020/07/23
1.5K0
现代人工智能课程复习
中山大学研一上学期现代人工智能技术复习的相关资料,主要内容为神经网络基础知识,可能涉及到线性代数、概率论、线性模型、卷积神经网络和CV进展
千灵域
2022/06/17
4130
现代人工智能课程复习
[机器学习篇]机器学习知识总结篇
4、Python基础1 - Python及其数学库 解释器Python2.7与IDE:Anaconda/Pycharm Python基础:列表/元组/字典/类/文件 Taylor展式的代码实现 numpy/scipy/matplotlib/panda的介绍和典型使用 多元高斯分布 泊松分布、幂律分布 典型图像处理
Ai学习的老章
2019/04/08
9220
【机器学习】解构概率,重构世界:贝叶斯定理与智能世界的暗语
在机器学习的世界中,概率论不仅是数学的一个分支,更是理解数据分布、评估模型性能和进行决策的基石。前两篇博客中,我们分别介绍了线性代数入门和概率论入门,为大家奠定了坚实的数学基础。今天,我们将深入探讨条件概率与贝叶斯定理,这些概念在实际应用中至关重要,特别是在分类、预测和决策模型中。
半截诗
2025/01/09
1690
【机器学习】解构概率,重构世界:贝叶斯定理与智能世界的暗语
理解贝叶斯优化
贝叶斯优化是一种黑盒优化算法,用于求解表达式未知的函数的极值问题。算法根据一组采样点处的函数值预测出任意点处函数值的概率分布,这通过高斯过程回归而实现。根据高斯过程回归的结果构造采集函数,用于衡量每一个点值得探索的程度,求解采集函数的极值从而确定下一个采样点。最后返回这组采样点的极值作为函数的极值。这种算法在机器学习中被用于AutoML算法,自动确定机器学习算法的超参数。某些NAS算法也使用了贝叶斯优化算法。
SIGAI学习与实践平台
2020/06/10
8.5K0
如何推导高斯过程回归以及深层高斯过程详解
像所有其他机器学习模型一样,高斯过程是一个简单预测的数学模型。像神经网络一样,它可以用于连续问题和离散问题,但是其基础的一些假设使它不太实用。
deephub
2020/11/17
2.4K0
如何推导高斯过程回归以及深层高斯过程详解
译文 朴素贝叶斯算法总结
在所有的机器学习分类算法中,朴素贝叶斯和其他绝大多数的分类算法都不同。对于大多数的分类算法,比如决策树,KNN,逻辑回归,支持向量机等,他们都是判别方法,也就是直接学习出特征输出Y和特征X之间的关系,要么是决策函数Y=f(X),要么是条件分布P(Y|X)。但是朴素贝叶斯却是生成方法,也就是直接找出特征输出Y和特征X的联合分布P(X,Y),然后用P(Y|X) = P(X,Y)/P(X)得出。 朴素贝叶斯很直观,计算量也不大,在很多领域有广泛的应用,这里我们就对朴素贝叶斯算法原理做一个小结。 1. 朴素贝叶斯
云时之间
2018/04/11
5240
机器学习中的朴素贝叶斯算法
在处理预测相关的建模问题时你会发现朴素贝叶斯是一个简单而又强大的算法。
花落花飞去
2018/02/05
1.2K0
机器学习中的朴素贝叶斯算法
【读书笔记】之概率统计知识梳理
这篇笔记,主要记录花书第三章关于概率知识和信息论知识的回顾。概率论在机器学习建模中的大量使用令人吃惊。因为机器学习,常常需要处理很多不确定的量。不确定的量可能来自模型本身的随机性、对外在失误的不完全观测以及不完全的建模。 其实在这之前,已经有两篇文章重点介绍过概率论的部分知识:协方差&贝叶斯统计的知识。这篇笔记只是记录了花书中的重点,并不是通俗的解释相关概率论只是,想了解更多内容,下面是传送门: 【通俗理解】协方差 【通俗理解】贝叶斯统计 【机器学习】朴素贝叶斯算法分析 随机变量 随机变量(rando
用户1594945
2018/07/20
8310
推荐阅读
相关推荐
判别模型、生成模型与朴素贝叶斯方法
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档