Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >数据并非都是正态分布:三种常见的统计分布及其应用

数据并非都是正态分布:三种常见的统计分布及其应用

作者头像
deephub
发布于 2024-06-17 07:26:41
发布于 2024-06-17 07:26:41
8190
举报
文章被收录于专栏:DeepHub IMBADeepHub IMBA

你有没有过这样的经历?使用一款减肥app,通过它的图表来监控自己的体重变化,并预测何时能达到理想体重。这款app预测我需要八年时间才能恢复到大学时的体重,这种不切实际的预测是因为应用使用了简单的线性模型来进行体重预测。这个模型将我所有过去的体重数据进行平均处理,然后绘制一条直线预测未来的体重变化。然而,体重减轻通常不会呈线性发展,使用更复杂的数学模型,如泊松回归,可能会更加贴近真实情况。

在探讨体重减轻的模型时,我们通常会遇到各种统计分布,其中最常见的是正态分布和泊松分布。正态分布,因其钟形的概率密度函数而广为人知,常用于描述自然现象中的随机变量,比如人的体重。它假设数据围绕一个中心值(平均值)对称分布,并且数据的分散程度(标准差)决定了分布的宽窄。

在处理计数数据,如一定时间内的体重变化次数时,泊松分布则显得更为合适。泊松分布用于描述在固定时间或空间内发生的独立事件的数量,适用于预测罕见事件。这在体重管理应用中尤为重要,因为体重的减少往往是非连续和间歇性的,可能受多种因素影响,如饮食、运动习惯等。

统计分布何来?

统计分布是统计推断领域的重要工具,它为数据分析和预测提供了基础。对非统计专业的学生,我通常用“数字平均下来是如何分布的”来定义分布。例如,正态分布中,大多数样本的平均值会相同。有些平均值会与“平均的平均值”相差极远,它们出现在分布的尾部。但大多数平均值会集中在中间,给分布一个钟形的形状。

根据数据的性质和所需的分析类型,会使用不同的分布。但是并不是所有的数据都符合正态分布。本文我们研究三种常见分布以及我们如何使用它们:正态分布、泊松分布和卡方分布。

正态分布

正态分布,也称为高斯分布,是统计学中使用最广泛的概率分布之一。这种分布以高斯的名字命名,最早在18世纪被描述。正态分布以其钟形曲线为特征,由两个参数定义:均值(平均值)和标准差。

正态分布用于数据倾向于围绕一个中心值聚集,且没有左右偏差的情况。它在心理学、金融和自然科学等多个领域都有应用。例如,一个大型人群中的智商分数、身高和血压测量值通常遵循正态分布。

你可能已经看到很多人使用它,比如听说过“按曲线打分”,这是学生们在课程中担心成绩时使用的术语。

假设你想描述你所在城市的胆固醇分布。你的城市有450,000名居民,但你只能测试1,000人。你抽取了1,000名居民的样本,并进行了血液测试。平均(均值)胆固醇为145毫克/分升,标准差为35毫克/分升。

你的样本看起来是这样的,胆固醇水平在X轴(水平方向),具有该水平的人数在Y轴(垂直方向)。

根据正态分布假设,你可以推断出城市中大约有26,118人(约5.8%)的胆固醇超过200毫克/分升。而超过200毫克/分升被认为是异常的,这样就可以为你的城市中需要治疗高胆固醇的人数做准备。

这个结果来自于一个样本中的1,000人,而无需对全城进行测试。正态分布可以用于模拟人群中某些疾病的传播。但你需要确保人群中的数据遵循正态分布。

形态:正态分布是一种连续分布,其图形呈现为著名的钟形曲线,对称且单峰,中心位于平均值(均值)。

参数:由两个参数决定——均值(μ)和标准差(σ),均值决定分布的中心位置,标准差决定分布的宽度即数据的波动范围。

应用:正态分布在自然和社会科学中极为常见,用于描述误差、衡量分数、身高、血压等自然现象和人类特征。

泊松分布

泊松分布是以法国数学家泊松的名字命名,于1837年引入。这种分布描述了在固定的时间或空间间隔内,给定数量的事件发生的概率,前提是这些事件以已知的恒定平均率独立发生。

这里我们讨论的是事件的计数,而不是像胆固醇水平那样从0到无穷大的数据测量。我们使用泊松分布来预测诸如城市中的预期谋杀案数量,或某一天急诊部的访问次数等。但是计数的独立性很重要,因为并不是所有事件都是独立的。

所以我们以一个城市的心脏病发作,并假设它们彼此独立为例。也就是说,我们不会有诸如天气或呼吸道疾病这样的混杂变量贯穿一座城市,所以不会将一个心脏病发作的概率与下一个心脏病发作的概率联系起来。

再次以450,000人为例,想模拟下个月的心脏病发作数量,我们这样做的目的是为紧急医疗服务和医院的人员、药品及医疗设备的可用性做好准备。所以使用过去30年的数据(360个月),计算出平均每月有10起心脏病发作。(再次强调,这是理论上的,只是假设,没有任何意义)

你的数据在图形上看起来是这样的:

根据这30年的数据,有95%的把握认为下个月将看到4到17起心脏病发作。如果低于或高于这个范围,就可能会有什么外在的因素施加了影响,比如大量人群开始使用一种新的抗心脏病药物,或一大群有高风险因素的人同时生病。(95%是按惯例,也可以根据分析找到任何认为合适的置信水平。)

如果使用正态分布进行这个分析,下个月的心脏病发作数量将在4.5到16.4之间。这与泊松分析的结果接近,这是因为中心极限定理。但是使用泊松分布对于罕见事件的计数数据总是更好。正态分布只有在你的数据是连续的(计数不是)、符合正态分布、独立且不罕见的情况下才有帮助;或者如果你想近似泊松分布的结果时才使用。

形态:泊松分布是一种离散分布,用于描述在固定时间或空间内发生的独立事件的次数。

参数:由一个参数 λ(事件发生的平均率)决定,λ越大,分布越平滑接近对称形态。

应用:泊松分布通常用于计数数据,如某时间段内发生的交通事故数、电话来电次数、某地区一定时间内的犯罪次数等。

卡方分布

卡尔·皮尔逊在1900年首次引入卡方分布。卡方分布通常用于独立性测试和拟合优度测试。它有助于确定分类变量之间是否存在显著的关联,或者样本是否符合预期的分布。

分类变量没有合理的顺序,如眼睛颜色。它可以是棕色、蓝色、绿色或其他。不是说蓝色必须在绿色之前,或棕色在蓝色之前。它们没有顺序。

在公共卫生研究中,卡方检验可用于检查吸烟状态(吸烟者与非吸烟者)与肺癌发病率之间的关系。通过应用卡方分布,研究人员可以确定这两个分类变量之间是否存在显著的关联。

假设有450名60岁的吸烟者和450名60岁的非吸烟者。查看他们的病历,在吸烟者中450人中有202人曾被诊断出肺癌。在非吸烟者中450人中有22人被诊断出肺癌。

仅仅用“肉眼”就可以看出那些吸烟的人患肺癌的风险更高:

但如果实际上吸烟者和非吸烟者之间的肺癌发病率没有差异,看到这些结果的概率是多少?你的结果有多大可能是错误的?这是p值。

这个数字非常小:0.00000000000000022

我们无法使用线性回归,因为这是分类数据。所以就需要进行逻辑回归,将吸烟和非吸烟编码为0和1;然后类似地对癌症和无癌症进行编码。计算给定吸烟状态的癌症几率。然后将这些几率转换为自然对数,将0和1的类别转换为更连续的分布。就可以预测给定吸烟状态的癌症对数几率,包括95%的置信区间等等。

对于简单地比较两个分类变量各有两个类别的情况(流行病学中的经典2x2表),上述的卡方独立性测试已经足够好。但是当你必须考虑其他因素,如社会经济状态、年龄或种族/性别时,使用逻辑回归更好。

形态:卡方分布是一种连续分布,形态不对称,其形状随自由度的增加而逐渐接近正态分布。

参数:由自由度(df)决定,自由度通常与样本大小或检验中涉及的类别数相关。

应用:卡方分布主要用于分类数据的假设检验,如检验两个分类变量之间是否独立(卡方独立性检验)或一个观测频数分布是否符合期望频数分布(拟合优度测试)。

线性回归时为什么要假设数据是正态分布的

在线性回归分析中,假设数据符合正态分布主要是为了便于进行统计推断,特别是关于回归参数(如斜率和截距)的假设检验和置信区间的计算。这种假设主要关注模型残差(误差项)的分布。以下是这一假设的几个关键原因和其统计意义:

1、中心极限定理

中心极限定理指出,大量独立同分布的随机变量之和趋于正态分布,不论原始变量的分布如何。在线性回归中,如果样本量足够大,即使残差不是完美的正态分布,估计的参数的分布也会接近正态分布。这使得正态分布的假设在实际应用中更具弹性。

2、统计推断的简便性

正态分布假设简化了许多统计推断任务。例如,如果残差是正态分布的,那么回归系数的抽样分布也将是正态的。这使得使用标准的t检验和F检验来评估模型参数的显著性成为可能,因为这些测试依赖于正态性假设来推导其概率分布。

3、最小化估计误差

正态分布假设支持最小二乘法(OLS)估计的有效性。当残差正态分布时,OLS估计器是“最佳”的线性无偏估计器(BLUE),这意味着在所有线性无偏估计中,它具有最小的方差。

4、处理异常值

正态分布的假设有助于识别异常值。在正态分布的假设下,大多数数据点应聚集在均值周围,只有少数数据点会落在分布的尾部。如果观察到的残差远离预期的正态分布,这可能表明模型中存在异常值或模型设定错误。

5、置信区间和预测

正态分布的假设允许构建围绕回归线的置信区间和预测区间。这些区间为基于模型的预测提供了可靠性度量,使得我们可以估计模型预测的不确定性。

尽管正态分布的假设为线性回归提供了许多统计上的便利,但在实际应用中,数据可能不总是遵循这一假设。因此,进行适当的诊断检查是重要的,例如检查残差图来评估正态性、独立性和方差齐性(同方差性)。如果发现违背这些假设的证据,可能需要使用更复杂的统计模型或变换数据来适应更适合数据的模型,比如泊松回归。

总结

我们介绍了3个常见的分布,下面是它们的一些核心区别:

  • 数据类型:正态分布用于连续数据,泊松分布用于计数数据,卡方分布用于分类数据的分析。
  • 分布形态:正态分布是对称的,泊松分布和卡方分布通常是不对称的。泊松分布的偏斜度依赖于参数 λ,卡方分布的偏斜度依赖于自由度。
  • 应用场景:正态分布用于模型连续变量的自然现象,泊松分布适用于事件的计数模型,卡方分布适用于进行分类数据的统计检验。

应用场景:

正态分布是统计学中最为人熟知的分布之一,通常用于描述自然和社会科学中的现象,如人类的身高、血压、考试成绩,以及工程产品的尺寸等。它的特点是数据在均值周围对称分布,形成著名的钟形曲线。由于中心极限定理,即使原始数据不符合正态分布,大量独立随机变量的平均值也会趋近于正态分布,这使得正态分布在金融模型中也广泛应用于描述例如股票回报率等。

泊松分布用于描述特定时间或空间内发生的离散事件次数,如电话呼入次数、网站点击量或某病种的发病率。这种分布适用于事件独立随机发生,且平均发生率相对稳定的情况。例如,在交通领域,泊松分布可以用来预测一定时间内通过某一点的车辆数。

卡方分布则主要用于分类数据的统计测试,如拟合优度测试和独立性测试。这使得卡方分布在社会科学研究中尤为重要,用于分析不同人群间的行为或特征的差异。例如,卡方分布可以用来检验吸烟与肺癌之间的关联性,或者分析不同广告对不同性别观众的影响是否存在显著差异。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DeepHub IMBA 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
因果推理的春天系列序 - 数据科学家们这些Paradox你们碰到过[分析对]么?
序章嘛咱多唠两句。花了大半个月才反反复复,断断续续读完了图灵奖得主Judea Pearl的The Book of WHY,感觉先读第四章的案例会更容易理解前三章相对抽象的内容。工作中对于归因问题迫切的需求,以及这两年深度学习在,都让我对因果推理在未来几年的爆发心怀希望。它最大的优势就是能回答'为什么'以及'假如这样做会怎样'等对实际业务有着根本意义的问题。对于这个领域我也是新人,所以只能抛出一些观点来供大家讨论。
风雨中的小七
2019/12/10
1.1K0
因果推理的春天系列序 - 数据科学家们这些Paradox你们碰到过[分析对]么?
动态 | 谷歌大脑医疗影像研究新进展,通过视网膜影像预测心脑血管疾病风险
AI 科技评论按:Google Brain 团队近日发现一种使用机器学习来评估心脑血管疾病风险的新方法。这种方法通过分析病人的眼睛影像,能够精确地推断出包括病人年龄、血压、是否吸烟等的相关因素,通过这些因素可以预测病人遭受重大心脑血管疾病的风险——比如心脏病发作。 这种方法与当前最先进的方法相比具有大致相同的准确度,而其优点在于,可以为医生提供快速、便捷的方法来分析病人的心脑血管疾病,并且不需要血液测试。可能更为重要的是,这项工作代表了科学发现的一种新方法。 相关的工作(Prediction of card
AI科技评论
2018/03/06
1.1K0
动态 | 谷歌大脑医疗影像研究新进展,通过视网膜影像预测心脑血管疾病风险
数据分享|逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化|附代码数据
世界卫生组织估计全世界每年有 1200 万人死于心脏病。在美国和其他发达国家,一半的死亡是由于心血管疾病
拓端
2023/04/26
8290
【谷歌AI以眼识心】超越人类医生,从视网膜图像识别心脏病
新智元报道 来源:Google blog、DeepMind 编辑:闻菲、常佩琦、艾霄葆 【新智元导读】谷歌大脑研究人员刚刚在官博上宣布了他们的最新研究成果,使用深度学习分析视网膜图像,以此预测心血管疾病突发的风险。使用深度学习来获得人体解剖学和疾病变化之间的联系,这是人类医生此前完全不知道的诊断和预测方法,不仅能帮助科学家生成更有针对性的假设,还可能代表了科学发现的新方向。 谷歌AI发现了人类医生尚未发现的诊断方法:用深度学习找到视网膜图像与心血管疾病联系 心脏病发作、中风和其他心血管疾病仍是最重要
新智元
2018/03/20
1.5K0
【谷歌AI以眼识心】超越人类医生,从视网膜图像识别心脏病
R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析|附代码数据
最近我们被客户要求撰写关于预测心脏病数据的研究报告,包括一些图形和统计输出。 本报告是对心脏研究的机器学习/数据科学调查分析。更具体地说,我们的目标是在心脏研究的数据集上建立一些预测模型,并建立探索性和建模方法。但什么是心脏研究?
拓端
2022/12/23
8790
【视频】R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险|数据分享
最近我们被客户要求撰写关于逻辑回归的研究报告,包括一些图形和统计输出。 本文介绍了逻辑回归并在R语言中用逻辑回归(Logistic回归)模型分类预测病人冠心病风险数据
拓端
2022/12/12
1.6K0
R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析|附代码数据
本报告是对心脏研究的机器学习/数据科学调查分析。更具体地说,我们的目标是在心脏研究的数据集上建立一些预测模型,并建立探索性和建模方法。但什么是心脏研究?(点击文末“阅读原文”获取完整代码数据)
拓端
2022/11/04
8320
统计计量 | 吸烟的人更长寿?冰淇淋销量越好溺亡人数越多?——相关分析概述
所谓联,这里指的就是事物之间的相互影响、相互制约、相互印证的关系。而事物这种相互影响、相互关联的关系,在统计学上就叫做相关关系,简称相关性。
Ai学习的老章
2021/10/11
1.5K0
数据分享|逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化|附代码数据
世界卫生组织估计全世界每年有 1200 万人死于心脏病。在美国和其他发达国家,一半的死亡是由于心血管疾病
拓端
2023/01/11
1.3K0
【视频】R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险|数据分享|附代码数据
本文介绍了逻辑回归并在R语言中用逻辑回归(Logistic回归)模型分类预测病人冠心病风险数据
拓端
2023/02/28
6790
数据分享|逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化|附代码数据
世界卫生组织估计全世界每年有 1200 万人死于心脏病。在美国和其他发达国家,一半的死亡是由于心血管疾病
拓端
2023/02/09
1.2K0
斯坦福 Stats60:21 世纪的统计学:第十章到第十四章
在上一章中,我们讨论了如何使用数据来检验假设。这些方法提供了一个二元答案:我们要么拒绝要么未能拒绝零假设。然而,这种决定忽略了一些重要的问题。首先,我们想知道答案有多大的不确定性(无论结果如何)。此外,有时我们没有一个明确的零假设,因此我们想看到与数据一致的估计范围。其次,我们想知道效应实际上有多大,因为正如我们在上一章中的减重示例中看到的,统计上显著的效应未必是实际上重要的效应。
ApacheCN_飞龙
2024/01/16
3890
斯坦福 Stats60:21 世纪的统计学:第十章到第十四章
从零开始统计学 01 | 假设检验
假设指的是当我们没有足够的证据支持一个结果时,先可以假定一个结果。这个事先给出的假定结果,就叫做原假设(或零假设, H0),同时提出与之相对应的假设,叫做备择假设(H1)。
白墨石
2021/01/13
9340
从零开始统计学 01 | 假设检验
业界 | 通过分析视网膜图像诊断心脑血管疾病:谷歌大脑团队取得医疗深度学习新进展
选自Google Blog 作者:Lily Peng 机器之心编译 参与:许迪、黄小天 近日,Jeff Dean 在其推特上说:「谷歌大脑团队在机器学习+医疗上再次取得新进展;我们有了令人鼓舞的新发现:非侵入式视网膜图像上含有机器学习模型可以介入的确诊心脑血管疾病的微妙指标,之前医生都不知道有这种迹象。」 心脏病、中风和其他心脑血管疾病一直是人类健康的头号杀手。评估这类风险是未来降低患者罹患心脑血管疾病的关键性第一步。为此,医生要考虑多种风险因子—比如遗传(性别或年龄)、生活习惯(抽不抽烟,血压等)。大部分
机器之心
2018/05/10
8760
【Science重磅】自学习人工智能在预测心脏病发作上击败人类医生
【新智元导读】Science 今日报道,科学家使用能够自学习的人工智能技术,让计算机在预测心脏病的发作上击败了人类医生。一旦投入使用,这一新的诊疗手段每年将拯救数以千计甚至百万计的生命。 医生可以借助大量的工具来预测病人的健康状况。但是,这些工具也远远不能应对人类身体的复杂性。例如,心脏病的发作就很难预测。现在,科学家证明,自我学习的计算机,相比较标准的医疗诊断程序而言,能够显著提高心脏病预测率。一旦投入使用,这一新的诊疗手段每年将拯救数以千计甚至百万计的生命。 “其意义之重大无法言喻”,斯坦福大学血管外科
新智元
2018/03/28
1.1K0
【Science重磅】自学习人工智能在预测心脏病发作上击败人类医生
因果图模型:理解因果关系的强大工具
在科学研究中,理解变量之间的因果关系至关重要。因果关系帮助我们不仅了解事物之间的关联,还能解释为什么这些关系存在。例如,医生想知道某种药物是否能有效治疗疾病,政策制定者想知道新的教育政策是否能提高学生成绩。因果图模型(Causal Graph Model)为我们提供了一种系统的方法来表示和推理这些因果关系。本文将详细介绍因果图模型的基本概念、组成部分、建立方法、因果推理和实际应用,帮助读者理解和使用这一强大工具。
theskylife
2024/07/31
1.5K0
统计学和大数据如何帮助我们认知世界?
你发现没有,如果你在网上买过东西,商家就会根据你的网购经历,给你推荐很多相关的商品。比方说你买了婴儿奶粉,商家除了给你再推荐奶粉,还会给你推荐婴儿车、婴儿床。还有,你可能也听过,很多互联网公司都会基于后台收集到的各种数据,做出自己产品的“用户画像”,让分散在整个互联网上的用户,从无数抽象的数据,变成一个或者几个具象化的人物,然后再有目的地优化自己的产品。那你知道支撑大数据和算法科技的,是哪一门学科呢?可能你也想到了,对,就是专门处理数据的统计学。
黄成甲
2019/01/03
1.1K0
前沿 | Science:自学习式人工智能可协助预测心脏病发作
选自Science 作者:Matthew Hutson 机器之心编译 参与:蒋思源、黄小天 近年来,将人工智能应用于医疗健康已经在蓬勃发展,机器之心也曾报道过医疗方面的文章,变革的开始,深度学习将如何改变医疗成像领域?和 纽约客特稿 | 把癌症诊断交给机器,医疗服务会更好吗? 《科学》的这篇文章注重于使用机器学习算法解决最难以预测的心脑血管疾病,希望能有助于心脑血管疾病的预防。 即使医生有很多工具可以预测患者的健康,但是他们仍会告诉你这些工具远远不能应对人体的复杂性。而心脏病发作就特别难以预测。现在,科学家
机器之心
2018/05/07
8220
前沿 | Science:自学习式人工智能可协助预测心脏病发作
数据科学家需要掌握的10项统计技术,快来测一测吧
摘要: 本文给出了数据科学应用中的十项统计学习知识点,相信会对数据科学家有一定的帮助。 无论你是不是一名数据科学家,都不能忽视数据的重要性。数据科学家的职责就是分析、组织并利用这些数据。随着机器学习技术的广泛应用,深度学习吸引着大量的研究人员和工程师,数据科学家也将继续站在技术革命的浪潮之巅。 虽然编程能力对于数据科学家而言非常重要,但是数据科学家不完全是软件工程师,他应该是编程、统计和批判性思维三者的结合体。而许多软件工程师通过机器学习框架转型为数据科学家时,没有深刻地思考并理解这些框架背后的统计理论,
IT派
2018/03/28
6590
数据科学家需要掌握的10项统计技术,快来测一测吧
Excel正态分布函数简介
引言:Excel提供了几个工作表函数来处理正态分布或“钟形曲线”,这里介绍Excel的正态分布函数为统计上的挑战所提供的帮助。本文学习整理自exceluser.com,供有兴趣的朋友参考。
fanjy
2021/08/31
5.8K0
Excel正态分布函数简介
推荐阅读
因果推理的春天系列序 - 数据科学家们这些Paradox你们碰到过[分析对]么?
1.1K0
动态 | 谷歌大脑医疗影像研究新进展,通过视网膜影像预测心脑血管疾病风险
1.1K0
数据分享|逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化|附代码数据
8290
【谷歌AI以眼识心】超越人类医生,从视网膜图像识别心脏病
1.5K0
R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析|附代码数据
8790
【视频】R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险|数据分享
1.6K0
R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析|附代码数据
8320
统计计量 | 吸烟的人更长寿?冰淇淋销量越好溺亡人数越多?——相关分析概述
1.5K0
数据分享|逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化|附代码数据
1.3K0
【视频】R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险|数据分享|附代码数据
6790
数据分享|逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化|附代码数据
1.2K0
斯坦福 Stats60:21 世纪的统计学:第十章到第十四章
3890
从零开始统计学 01 | 假设检验
9340
业界 | 通过分析视网膜图像诊断心脑血管疾病:谷歌大脑团队取得医疗深度学习新进展
8760
【Science重磅】自学习人工智能在预测心脏病发作上击败人类医生
1.1K0
因果图模型:理解因果关系的强大工具
1.5K0
统计学和大数据如何帮助我们认知世界?
1.1K0
前沿 | Science:自学习式人工智能可协助预测心脏病发作
8220
数据科学家需要掌握的10项统计技术,快来测一测吧
6590
Excel正态分布函数简介
5.8K0
相关推荐
因果推理的春天系列序 - 数据科学家们这些Paradox你们碰到过[分析对]么?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档