首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >幸存者偏差

幸存者偏差

作者头像
纯洁的微笑
发布于 2019-05-06 07:19:20
发布于 2019-05-06 07:19:20
8380
举报
文章被收录于专栏:纯洁的微笑纯洁的微笑

幸存者偏差(英语:survivorship bias),另译为“生存者偏差”,是一种认知偏差。其逻辑谬误表现为过分关注于目前人或物“幸存了某些经历”然而往往忽略了不在视界内或无法幸存这些事件的人或物。

幸存者偏差最早来源于第二次世界大战期间,美国哥伦比亚大学统计学亚伯拉罕·沃德教授接受美国海军要求,运用他在统计方面的专业知识给出关于“飞机应该如何加强防护,才能降低被炮火击落的几率”的建议。

通过统计发现主要受损部位集中在机翼,所以结论是应当减少机腹的装甲加强机翼的装甲?这个结论显然是可笑的,造成这种偏差的原因是机腹中弹的灰机大多数都坠毁了,统计结论产生了偏差,这个偏差被命名为“幸存者偏差”。

再举一个非常简单的例子:

一名记者来到火车站台上,随机询问:“请问你买到火车票了吗?” 一位大妈微微一愣,回答:“买到了” 记者又转向一位精瘦精瘦的年轻人,问:“请问你买到火车票了吗?” 年轻人回答:“买到了” 随后记者又问了5个人,大家都回答:“买到了” 最后记者对着镜头说:“今年虽然火车票难买,但是通过采访我们发现,大家都买到了火车票,现在正满怀希望地赶回家乡,过个团圆年!”

幸存者偏差,就是忽略了筛选条件,把经过筛选的结果当成随机结果。

生活中我们大多数人所认为的事情,其实都是错的,举两个例子。

随着参加高考的人数越来越多,高考的录取率也越来越高,2018年的参加高考的人数是975万,前六年的录取率都在74%以上,也就意味着每年100个人参加高考就会有74个同学可以考上大学,如果算上一些民营或者专科类高校,可以说只要参加高考了就可以上大学。

大家现在身边经常会流行这么一句:现在满大街都是大学生了。但其实根据统计本科生占据总人口的比例是3.69%,换句话说,只要你是本科生,你的学历就碾压了97%的中国人!

关注我公号的读者们都在IT行业,工作两三年之后,月收入几乎都可以轻松突破1万+,所以好多程序员都称自嘲为IT民工,身边朋友也普遍认为一线月入一万都是门槛级别的收入。

但其实2018年,国家统计局公布了中国人可支配收入的中位数:2028元/月。这个数据是不是超出大多数人的预期?

  • 可支配收入的定义,可以理解为在缴纳税/险/金之后的到手收入;
  • 中位数的定义,可以理解为一半的人在此收入之上,一半的人在此收入之下,在统计学里被认为比平均数要更加客观。

如果我说中国有些地方的年轻人,竟然听不懂普通话,一辈子没有走出过他们县城,大家是不是觉得很夸张。

2018年我国农村还有5000万贫困人口。如何定义为贫困人口呢?2016年的标准是年收入少于3026元,请注意这里是年收入而不是月收入

我们常常都喜欢把自己身边人的情况,当成了世界的普世情况,比如我老婆总说美国很美好,其实她也只是认识一个美国的姑姑而已,认识一个人移民美国的人并不能代表美国很美好。

不要认为马云成功了就去模仿马云,可能淘宝也是幸存者偏差的一种现象。存活下来的企业往往被视为“传奇”,它们的做法被争相效仿,而其实有些也许只是因为偶然原因幸存下来了而已。。

普通人都喜欢基于自己所熟悉的情况做出判断,那么这个判断难免会具有很大的误差,有时候明明有科学的数据放在那里,大家不去参考借鉴,偏偏却喜欢问身边一个半拉子不懂的人。

这也是为什么某些中药、阿胶、保健品等产物,可以在中国这片神奇的土地上大肆流行的原因之一。中国其实还需要更多的大学生,更多具有理性、独立思考的人,只有这样随着时间推移这些产物才会慢慢淘汰掉。

-END-

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-02-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 纯洁的微笑 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
lncRNA组装流程的软件介绍之Stringtie
该软件的官网:https://ccb.jhu.edu/software/stringtie/index.shtml。
生信技能树
2021/07/06
1.8K0
RNA-seq(5):序列比对:Hisat2
1 HISAT2官网下载 人类和小鼠的索引有现成的,HISAT2官网可以直接下载进行序列比对。如下图所示:选择hg19和mm10的index,文章中RNA-Seq测序数据,可以包括人类和小鼠的数据,因此需要小鼠和人类的索引。
Y大宽
2018/09/10
5.6K0
RNA-seq(5):序列比对:Hisat2
软件介绍之Samtools
SAMtools是一个用于操作sam和bam文件的工具合集。能够实现二进制查看、格式转换、排序及合并等功能,结合sam格式中的flag、tag等信息,还可以完成比对结果的统计汇总。同时利用linux中的grep、awk等操作命令,还可以大大扩展samtools的使用范围与功能。包含有许多命令,我这里主要介绍几个:
生信技能树
2021/07/06
2.7K0
转录组分析 | 使用Hisat2进行序列比对
转录组分析 | 使用trim-galore去除低质量的reads和adaptor
DoubleHelix
2020/09/23
28.3K2
转录组分析 | 使用Hisat2进行序列比对
转录组分析 | 使用Hisat2进行序列比对
(http://daehwankimlab.github.io/hisat2/download/),我测序的组织来自小鼠,所以我这里下载的是小鼠的。
用户11744890
2025/07/14
1990
lncRNA芯片的探针到底该如何注释到基因组信息呢
这个,当然没有问题,就是需要时间来实现,主要是因为lncRNA芯片的探针设计的时候并不是依据基因组设计,而是mRNA和lncRNA本身序列设计的,所以探针是会跨越外显子的,这一点在官网问答也说的很清楚:
生信技能树
2019/12/05
1.9K0
一个RNA-seq数据分析的Snakemake流程
但是如果RNA-seq数据分析项目非常多,或者说每个项目里面的样品非常多, 这个时候我们会推荐流程化管理我们的脚本,我个人的数据分析生涯主要是shell脚本,因为并不是企业级项目管理,能跑十几个项目还是因为要去给粉丝帮忙。对企业生产实践来说,Snakemake流程化管理各个NGS数据分析流程是一个很好的选择,恰好看到了一个最新的 Snakemake workflow, 推荐给大家。
生信技能树
2021/12/17
1.3K0
一个RNA-seq数据分析的Snakemake流程
看优秀本科生如何一周内学会Linux进而搞定RNA-seq上游分析
我是武汉大学基础医学专业第一届的学生,2016年9月刚进大学的时候就选了导师进入实验室接受科研训练。虽然我们实验室不是专门做生物信息学的,但第一次和导师正式交流的时候,她就建议我要学点生信。(巧合的是2016年9月也是生信菜鸟团转型生信技能树的时间点,如果所有的导师都如此明智就好了)
生信技能树
2020/04/14
9K1
看优秀本科生如何一周内学会Linux进而搞定RNA-seq上游分析
转录组——上游分析
FastQC主页:http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
青柠味
2025/06/12
1940
转录组——上游分析
转录组分析 | 使用STAR进行比对
前几期,小编已经教大家完成了RNA-seq数据的质控,下面就要正式开始转录组分析啦!
生信小王子
2020/08/10
4.2K0
转录组分析 | 使用STAR进行比对
鉴定lncRNA流程全套代码整理
前两期周更我们通过一篇文章的复现整理了mRNA和lncRNA分析基本流程,但并没有涉及新lncRNA的鉴定,本周的推文本质上是我个人学习鉴定lncRNA的全套流程笔记,整合了我们公众号往期的资源,对代码进行了勘误更新,内容非常详实。
生信菜鸟团
2023/08/23
3.9K1
鉴定lncRNA流程全套代码整理
转录组—上游分析_如何拿到count矩阵
本文档记录GSE149638数据集中下载SRR11652578和SRR11652615原始数据
sheldor没耳朵
2024/08/12
6551
转录组—上游分析_如何拿到count矩阵
生信技能树-day18 转录组上游分析-比对、定量
今天的是三周合计15天的数据挖掘授课学员一点一滴整理的授课知识点笔记哦,还有互动练习题哈,欢迎大家点击文末的阅读原文去关注我们学员的公众号哦!
生信菜鸟团
2024/06/25
5670
生信技能树-day18 转录组上游分析-比对、定量
转录组测序分析专题——比对/定量
NCBI:https://www.ncbi.nlm.nih.gov/projects/genome/gu ide/human/index.shtml
yurric
2023/10/26
1.1K0
全长转录组 | 三代全长转录组分析流程(PacBio & ONT )-- Flair
今天我们介绍一款使用三代全长转录本数据进行转录本校正,聚类,可变剪切分析,定量和差异分析为一体的工具 - FLAIR。来自加利福尼亚大学圣克鲁斯分校(University of California,Santa Cruz)的Angela Brooks团队(图1)开发的全长可变转录本(isoform)分析工具FLAIR (Full-Length Alternative Isoform analysis of RNA),于2020年03月18号发表在《Nature Communications》杂志上,题目为 Full-length transcript characterization of SF3B1 mutation in chronic lymphocytic leukemia reveals downregulation of retained introns。该工具可用来鉴定高可信度转录本,差异剪切事件分析和差异转录本异构体(isoform)分析。
三代测序说
2024/04/12
3.4K1
全长转录组 | 三代全长转录组分析流程(PacBio & ONT )-- Flair
癌症样本全转录组数据的融合基因鉴定
前几期转录组周更学习分享了lncRNA和mRNA联合分析的一般套路和鉴定新lncRNA的基本流程,接下来的两周我会带大家一起学习之前一位老师对癌症样本全转录组数据进行融合基因和变异鉴定的推文 老程的全转录组,解决遇到的各种问题
生信菜鸟团
2023/09/09
1K0
癌症样本全转录组数据的融合基因鉴定
scRNA-seq数据处理—文件格式小结
FastQ是您将遇到的最原始形式的scRNASeq数据。所有scRNASeq方案都使用配对末端测序进行测序。Barcode序列可以在一个或两个reads中发生,这取决于所采用的protocol 。然而,使用独特分子标识符(UMI)的protocol 通常包含一个带有细胞和UMI barcode 和 adapters 但没有任何转录序列的read。因此,尽管实际上是成对末端测序,但reads将被比对为好像它们是单端测序的。
生信技能树jimmy
2020/03/27
2.1K0
基于bam文件做可变剪切的软件leafcutter和rMATS的比较
可变剪接(Alternative Splicing,AS)是指从一个mRNA前体中通过不同的剪接方式,对外显子和内含子进行组合,产生不同的mRNA剪接异构体的过程。高等真核生物中的可变剪接极大地拓展了基因功能的多样性,是调节基因表达和产生蛋白质组多样性的重要机制。
生信技能树
2019/11/18
4.9K0
转录组上游分析流程(四)
环境部署——数据下载——查看数据(非质控)——数据质控——数据过滤(过滤低质量数据)——数据比对及定量
凑齐六个字吧
2024/10/26
3260
转录组上游分析流程(四)
转录组分析 | 使用Stringtie对数据进行下游处理
StringTie 是用于 RNA-seq 的转录本组装和定量软件,StringTie 可以看做是cufflinks软件的升级版本,其功能和Cufflinks是一样的,包括下面两个主要功能:转录本组装和定量;相比Cuffinks, 其运行速度更快。该软件的官网:https://ccb.jhu.edu/software/stringtie/index.shtml。
DoubleHelix
2020/09/23
15.1K2
转录组分析 | 使用Stringtie对数据进行下游处理
推荐阅读
相关推荐
lncRNA组装流程的软件介绍之Stringtie
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档