Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >在统计学中概率分布中的概率密度函数PDF,概率质量PMF,累积分布CDF

在统计学中概率分布中的概率密度函数PDF,概率质量PMF,累积分布CDF

作者头像
学到老
发布于 2019-01-25 06:40:39
发布于 2019-01-25 06:40:39
1.8K0
举报

一. 概念解释

PDF:概率密度函数(probability density function), 在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。

PMF : 概率质量函数(probability mass function), 在概率论中,概率质量函数是离散随机变量在各特定取值上的概率。

CDF : 累积分布函数 (cumulative distribution function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。

二. 数学表示

PDF:如果XX是连续型随机变量,定义概率密度函数为fX(x)fX(x)f_X(x),用PDF在某一区间上的积分来刻画随机变量落在这个区间中的概率,即

Pr(a≤X≤b)=∫bafX(x)dxPr(a≤X≤b)=∫abfX(x)dx\Pr\left(a \leq X \leq b\right) =\int_{a}^{b} f_X(x) dx PMF:如果XX离散型随机变量,定义概率质量函数为fX(x)fX(x)f_X(x),PMF其实就是高中所学的离散型随机变量的分布律,即 fX(x)=Pr(X=x)fX(x)=Pr(X=x)f_X(x)=\Pr\left( X=x \right) 比如对于掷一枚均匀硬币,如果正面令X=1X=1\text{$X$}=1,如果反面令X=0X=0X=0,那么它的PMF就是 fX(x)={12 if x∈{0,1}0 if x∉{0,1}fX(x)={12 if x∈{0,1}0 if x∉{0,1}f_X\left( x \right) =\begin{cases} &\frac{1}{2} \text{ if } x\in\left \{ 0,1 \right \} \\ & 0\text{ if } x\notin\left \{ 0,1 \right \}\end{cases} CDF:不管是什么类型(连续/离散/其他)的随机变量,都可以定义它的累积分布函数,有时简称为分布函数。

对于连续型随机变量,显然有 FX(x)=Pr(X≤x)=∫x−∞fX(t)dtFX(x)=Pr(X≤x)=∫−∞xfX(t)dtF_X\left( x \right) =\Pr\left( X\leq x \right) =\int_{-\infty}^{x}f_X(t)dt 那么CDF就是PDF的积分,PDF就是CDF的导数。 对于离散型随机变量,其CDF是分段函数,比如举例中的掷硬币随机变量,它的CDF为 FX(x)=Pr(X≤x)=⎧⎩⎨⎪⎪0 if x<012 if 0≤x<11 if x≥1FX(x)=Pr(X≤x)={0 if x<012 if 0≤x<11 if x≥1F_X\left( x \right) =\Pr\left ( X\leq x \right )=\begin{cases}& 0\text{ if } x<0 \\ & \frac{1}{2}\text{ if } 0\leq x< 1 \\& 1\text{ if }x\geq 1\end{cases}

三.概念分析

 根据上述,我们能得到一下结论:

 1)PDF是连续变量特有的,PMF是离散随机变量特有的;  2)PDF的取值本身不是概率,它是一种趋势(密度)只有对连续随机变量的取值进行积分后才是概率,也就是说对于连续值确定它在某一点的概率是没有意义的;  3)PMF的取值本身代表该值的概率。

四.分布函数的意义

  我们从两点来分析分布函数的意义:   1.为什么需要分布函数?

  对于离散型随机变量,可以直接用分布律来描述其统计规律性,而对于非离散型的随机变量,如连续型随机变量,因为我们无法一一列举出随机变量的所有可能取值,所以它的概率分布不能像随机变量那样进行描述,于是引入PDF,用积分来求随机变量落入某个区间的概率。分布律不能描述连续型随机变量,密度函数不能描述离散随机变量,因此需要找到一个统一方式描述随机变量统计规律,这就有了分布函数。另外,在现实生活中,有时候人们感兴趣的是随机变量落入某个范围内的概率是多少,如掷骰子的数小于3点的获胜,那么考虑随机变量落入某个区间的概率就变得有现实意义了,因此引入分布函数很有必要。   2. 分布函数的意义

  分布函数F(x)F(x)在点xx处的函数值表示XX落在区间(−∞,x](−∞,x]内的概率,所以分布函数就是定义域为RR的一个普通函数,因此我们可以把概率问题转化为函数问题,从而可以利用普通的函数知识来研究概率问题,增大了概率的研究范围。

五:深度理解参考文献

http://www.dataguru.cn/thread-150756-1-1.html https://www.zhihu.com/question/23022012 https://www.zhihu.com/question/36853661 https://www.zhihu.com/question/21911186 http://wenku.baidu.com/view/823a0bb9f111f18582d05a14.html

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018年03月16日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
捋一捋PDF、PMF、CDF是什么
还记得前段时间看过一篇文章,就是调查大家疫情期间都干了什么,有一条是疫情期间终于弄清楚了PDF和CDF的区别。PDF、PMF、CDF这几个概念确实很容易混淆。今天就来捋一捋这几个概念。
张俊红
2020/07/07
3K0
概率论中 PDF,PMF,CDF的含义[通俗易懂]
PDF:概率密度函数(probability density function), 在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。
全栈程序员站长
2022/08/31
2.3K0
概率论07 联合分布
我之前一直专注于单一的随机变量及其概率分布。我们自然的会想将以前的结论推广到多个随机变量。联合分布(joint distribution)描述了多个随机变量的概率分布,是对单一随机变量的自然拓展。联合分布的多个随机变量都定义在同一个样本空间中。 对于联合分布来说,最核心的依然是概率测度这一概念。  离散随机变量的联合分布 我们先从离散的情况出发,了解多个随机变量并存的含义。 之前说,一个随机变量是从样本空间到实数的映射。然而,所谓的映射是人为创造的。从一个样本空间,可以同时产生多个映射。比如,我们的实验是连
Vamei
2018/01/18
1.4K0
概率论07 联合分布
​常用的连续概率分布汇总
在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。而随机变量的取值落在某个区域之内的概率则为概率密度函数在这个区域上的积分。
deephub
2021/11/08
1.9K0
​常用的连续概率分布汇总
统计学 入门基础PDF( Probability Density Function) 和PMF ( Probability Mass Function )
PMF( 概率质量函数 ): 是对 离散随机变量 的定义. 是 离散随机变量 在各个特定取值的概率. 该函数通俗来说,就是 对于一个离散型概率事件来说, 使用这个函数来求它的各个成功事件结果的概率.
全栈程序员站长
2022/08/31
8960
通俗理解:概率分布函数、概率密度函数
这篇文章通俗地解释了概率论的两个基石函数:概率分布函数、概率密度函数,建议不熟悉的同学,认真阅读。
double
2019/09/27
10.1K0
通俗理解:概率分布函数、概率密度函数
【机器学习】从流动到恒常,无穷中归一:积分的数学诗意
在机器学习的学习旅程中,微积分不仅仅是理论的支撑,更是实际应用的关键工具。上一篇文章中,我们探讨了极限与连续性以及导数的概念与应用,特别是在梯度下降法中的应用。本篇文章将继续深入,重点讲解积分的概念与计算,以及它在机器学习中的实际应用。
半截诗
2025/01/09
1190
【机器学习】从流动到恒常,无穷中归一:积分的数学诗意
机器学习统计概率分布全面总结(Python)
在平时的科研中,我们经常使用统计概率的相关知识来帮助我们进行城市研究。因此,掌握一定的统计概率相关知识非常有必要。
算法进阶
2023/12/26
6100
机器学习统计概率分布全面总结(Python)
概率论中的PDF,PMF,CDF区别和联系
1. PDF:概率密度函数(probability density function), 在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。本身不是概率,取值积分后才是概率。
全栈程序员站长
2022/08/31
3.4K0
概率论中的卷积公式
卷积公式在处理独立随机变量之和的分布问题时非常有用。例如,在统计学、信号处理等领域,常常需要计算两个随机变量之和的分布情况。通过卷积公式,可以直接从单个变量的密度函数推导出其和的密度函数,从而简化了复杂的计算。
用户11315985
2024/10/16
5070
Python中概率累计分布函数(CDF)分析
PDF:连续型随机变量的概率密度函数是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。
用户8949263
2022/05/25
12.9K0
Python中概率累计分布函数(CDF)分析
PDF、PMF和CDF的三角关系
好久没更新了,最近在看统计学。看了机器学习回头再看统计学总有一种怪异的感觉,不能说一模一样,只能说直接照搬,说精神续作也好,说致敬经典也好,说换皮圈钱也好,总之今天机器学习课本费劲巴拉往你脑子里塞的概念,到统计学那边一查时间搞不好已经有上百年历史。
木羊
2022/11/07
1.2K0
机器学习数学基础:常见分布与假设检验
所谓机器学习和深度学习, 背后的逻辑都是数学, 所以数学基础在这个领域非常关键, 而统计学又是重中之重, 机器学习从某种意义上来说就是一种统计学习。
Datawhale
2020/07/09
3.4K0
机器学习数学基础:常见分布与假设检验
概率论04 随机变量
我们了解了“样本空间”,“事件”,“概率”。样本空间中包含了一次实验所有可能的结果,事件是样本空间的一个子集,每个事件可以有一个发生的概率。概率是集合的一个“测度”。 这一讲,我们将讨论随机变量。随机变量(random variable)的本质是一个函数,是从样本空间的子集到实数的映射,将事件转换成一个数值。根据样本空间中的元素不同(即不同的实验结果),随机变量的值也将随机产生。可以说,随机变量是“数值化”的实验结果。在现实生活中,实验结果可以是很“叙述性”,比如“男孩”,“女孩”。在数学家眼里,这些文字化
Vamei
2018/01/18
9190
概率论04 随机变量
理解概率密度函数
概率密度函数是概率论中的核心概念之一,用于描述连续型随机变量所服从的概率分布。在机器学习中,我们经常对样本向量x的概率分布进行建模,往往是连续型随机变量。很多同学对于概率论中学习的这一抽象概念是模糊的。在今天的文章中,SIGAI将直观的解释概率密度函数的概念,帮你更深刻的理解它。
SIGAI学习与实践平台
2018/10/31
1.4K0
理解概率密度函数
理解概率密度函数
概率密度函数是概率论中的核心概念之一,用于描述连续型随机变量所服从的概率分布。在机器学习中,我们经常对样本向量x的概率分布进行建模,往往是连续型随机变量。很多同学对于概率论中学习的这一抽象概念是模糊的。在今天的文章中,SIGAI将直观的解释概率密度函数的概念,帮你更深刻的理解它。
SIGAI学习与实践平台
2018/12/06
1.1K0
【机器学习】在不确定的光影中:机器学习与概率论的心灵共舞
机器学习已经成为现代科技的核心驱动力之一,而背后支撑这一技术的基础之一就是概率论。在机器学习中,概率论帮助我们理解和处理不确定性,进而建立模型进行预测和决策。无论是在分类、回归任务,还是在强化学习与生成模型中,概率论都起着至关重要的作用。
半截诗
2025/01/09
1940
【机器学习】在不确定的光影中:机器学习与概率论的心灵共舞
11种概率分布,你了解几个?
了解常见的概率分布十分必要,它是概率统计的基石。这是昨天推送的 从概率统计到深度学习,四大技术路线图谱,都在这里!文章中的第一大技术路线图谱如下所示,图中左侧正是本文要总结的所有常见概率分布。
double
2019/10/08
20.8K0
11种概率分布,你了解几个?
数据科学16 | 统计推断-概率和条件概率
统计学一般分统计描述及统计推断两部分。统计描述是通过图表或数学方法,对数据资料进行整理后描述数据的客观规律,而统计推断则是使用从总体中随机抽取的数据样本,用样本数据总结的规律去对总体的未知特征进行推断。本章主要学习统计推断常见的概念及相关基础内容。
王诗翔呀
2020/07/03
1.1K0
数据科学16 | 统计推断-概率和条件概率
斯坦福 CS228 概率图模型中文讲义 二、概率复习
样本空间Ω:随机实验所有结果的集合。 在这里,每个结果ω ∈ Ω可以看作实验结束时真实世界状态的完整描述。
ApacheCN_飞龙
2022/12/01
4470
斯坦福 CS228 概率图模型中文讲义 二、概率复习
相关推荐
捋一捋PDF、PMF、CDF是什么
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档