Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >质量较差样本的QC

质量较差样本的QC

作者头像
生信技能树jimmy
发布于 2020-05-18 09:05:09
发布于 2020-05-18 09:05:09
7020
举报
文章被收录于专栏:单细胞天地单细胞天地

Cell counts

细胞计数由检测到的唯一细胞条形码的数量确定。在基于液滴的实验方案中,细胞条形码存在于水凝胶中,并与单个细胞和裂解/反应混合物一起包裹在液滴中。虽然每个水凝胶都应该有一个与之相关的细胞条形码,但有时一个水凝胶可以有多个细胞条形码。从而导致细胞中的细胞条形码数量更多。

由于某些水凝胶具有多个细胞条形码,所以期望中唯一的细胞条形码的数量通常会大于seuqenced的细胞的数量。下面的黄色样本的细胞条形码数量似乎至少是其他样本的两倍。

UMI counts per cell

对于Unsorted的样品(黄色),每个细胞的UMI数量往往非常低。其他样本每个细胞的UMI数量都很多,这表明只有Unsorted的样本有问题。使用此截止值,我们将丢失大部分Unsorted cells。

Genes detected per cell

在InDrop/10X分析中,发现基因检测在500-5000范围内是正常的。然而,根据实验中细胞的复杂性,期望可能会有所不同。对基因检测的期望值与对UMI检测的期望值情况相似。

除Unsorted的样本外,所有样本都检测到大量的基因(中位数在1,000-3,000个基因之间),这与每个样本的每个细胞的UMI数量相对应。然而,Unsorted的样本每个细胞的基因中位数非常低,这表明样本失败。

UMIs vs. genes detected

质量差的细胞很可能每个细胞的基因和UMI都很低。因此,较差的样本的细胞很可能在图形的左下角。好的细胞通常会表现为每个细胞有更多的基因和更高数量的UMI。我们也希望所有样品都有相似的斜率。

Unsorted的样本中有很多细胞是,只有很少的UMIs,并且每个细胞的基因数量较少。其他样品看起来都没问题。

Mitochondrial counts ratio

线粒体计数的质量较差的样品将在0.1线粒体比率标记之上出现较大的峰,除非是实验样品本身就是高线粒体比率类型。

未分类样品中检测到的基因数量非常少,因此线粒体表达似乎较高,主要是由于这一事实。未分类样品的质量差似乎不是由于细胞死亡或垂死。由于预计hPSC样品的线粒体表达水平较高,因此建议不要对该标准使用阈值。

在Unsorted的样本中检测到的基因数量非常少,因此线粒体的表达似乎更高。未分选样本的质量差似乎不是由于死亡或濒临死亡的细胞造成的。尽管hPSC样本比Sorted样本多一点,但其他样本的线粒体表达却很少。由于预期hPSC样本的细胞类型具有更高水平的线粒体表达,因此不使用该指标的阈值可能是明智的。

Novelty

我们可以看到,我们对每个细胞测序较少的样本具有更高的整体复杂性,这是因为我们还没有开始对这些样本的任何给定基因进行饱和测序。这些样本中的异常值细胞可能是RNA种类比其他细胞简单的细胞。有时,我们可以通过此指标检测低复杂度的细胞类型(如红细胞)的污染。

除未排序的样本外,所有样本的复杂度都很好,因此这些样本中不太可能存在低复杂度的细胞类型的污染。未分类的样本的肩部比预期的大,但按此指标还不错。

除了Unsorted样本外,所有样本的复杂性看起来都很好,因此在这些样本中不太可能存在低复杂性细胞类型的污染。Unsorted的样本具有比预期更大的shoulder ,但按此指标并不算差。

筛选结果

确定过滤标准成功与否的一个主要图表是细胞计数。预期的细胞数量取决于文库制备方法,对于inDrops,我们看到每个样本大约能测到上样细胞的80%或更少,而对于10X,这通常是~50%或更少。

此外,最好为过滤后的数据探索所有质量图。所有的图都应该在每个细胞的读数、检测到的基因、每个细胞的UMI、线粒体比率和novelty方面都有很大的改进。

由于Unsorted样品质量较差,因此过滤器会除去该样品的大量细胞。在这种情况下,除1个细胞外的所有细胞都被过滤掉了。


注:以上内容来自哈佛大学生物信息中心(HBC)_的教学团队的生物信息学培训课程。原文链接:https://hbctraining.github.io/scRNA-seq/schedule/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-05-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 单细胞天地 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
scRNA-seq—质量控制
单细胞RNA-seq分析介绍 单细胞RNA-seq的设计和方法 从原始数据到计数矩阵 差异分析前的准备工作 scRNA-seq—读入数据详解
生信技能树jimmy
2020/05/19
3.2K0
单细胞系列教程:质控实战(五)
当数据加载到 Seurat 并创建初始对象时,会为计数矩阵中的每个单元组装一些基本元数据。要仔细查看此元数据,查看存储在 merge_seurat对象的 meta.data中的数据帧:
数据科学工厂
2023/01/25
1.7K0
单细胞上游分析/cellranger流程学习(三)
在上一步对数据进行Cellranger count分析之后,接下来可以简单看一下每个样本得到的结果文件和Summary内容,既往推文可见 单细胞上游分析/cellranger流程学习(二):https://mp.weixin.qq.com/s/649AtykVmBRz2IjlRH9MUQ
凑齐六个字吧
2025/04/30
2160
单细胞上游分析/cellranger流程学习(三)
单细胞RNA-seq数据分析最佳实践(上)
Luecken MD, Theis FJ. Current best practices in single-cell RNA-seq analysis: a tutorial. Mol. Syst. Biol. 2019, 15: e8746.
生信技能树jimmy
2020/03/30
2.7K0
单细胞系列教程:质控(四)
在基因表达定量后,需要将这些数据导入到 R 中,以生成用于执行 QC(质控)。下面将讨论定量数据的格式,以及如何将其导入 R,以便可以继续工作流程中的 QC 步骤。
数据科学工厂
2023/01/25
1.2K0
10X Genomics单细胞免疫组库VDJ分析必知必会
我们生活着的世界并非只有我们自己,而是有很多小于或大于我们的生物不断与我们交互着,有的让我们开心,有的使我们伤心。这就关系到一个本质的问题:
生信技能树jimmy
2020/05/29
7.7K0
10X Genomics单细胞免疫组库VDJ分析必知必会
单细胞数据中到底应该如何处理线粒体基因
线粒体是参与细胞凋亡启动和执行的主要细胞器之一。线粒体基因在大多数细胞中表达,其表达水平是细胞类型特异性的。也就是说这个也是和细胞类型及其状态有关系的。
生信技能树jimmy
2020/08/11
2.9K0
单细胞数据中到底应该如何处理线粒体基因
scRNA-seq—读入数据详解
在量化基因表达之后,我们需要将该数据导入R,以生成用于执行QC的矩阵。在本课中,我们将讨论盘点数据可以采用的格式,以及如何将其读入R,以便我们可以继续工作流程中的QC步骤。我们还将讨论我们将使用的数据集和相关的元数据
生信技能树jimmy
2020/05/26
4.5K0
scRNA-seq—读入数据详解
重要的并不是整合与否,而应该是质量控制
是2024年9月30日,浙江省肿瘤医院程向东教授团队联合北京大学生物医学前沿创新中心白凡教授团队合作在Nature Communications上发表了题为The estrogen response in fibroblasts promotes ovarian metastases of gastric cancer的研究成果,该研究发现雌激素调节卵巢成纤维细胞会促进胃癌的卵巢转移,可能是胃癌卵巢转移好发于年轻女性的重要原因。对应的数据集链接是:https://ngdc.cncb.ac.cn/gsa-human/browse/HRA004702
生信技能树
2024/11/21
960
重要的并不是整合与否,而应该是质量控制
单细胞系列教程:计数矩阵是如何生成的?(二)
根据所使用的文库制备方法,RNA 序列(也称为读数或标签)将来自转录本(10X Genomics、CEL-seq2、Drop-seq)的 3' 末端(或 5' 末端) , inDrops) 或来自全长转录本 (Smart-seq)。
数据科学工厂
2023/01/25
8890
21天精通单细胞数据分析Day01: 单细胞测序简介 (内附 62 页精美 PPT)
从今天开始,用 21 天精通单细胞数据分析。我们将理论联系实际,边学边练,本文先从理论开始。
简说基因
2024/05/30
5430
21天精通单细胞数据分析Day01: 单细胞测序简介 (内附 62 页精美 PPT)
The next generation of single cell RNA-seq(GEM-X)
追风少年i
2024/05/18
4560
The next generation of single cell RNA-seq(GEM-X)
单细胞测序原理
单细胞测序主要包括以下四个步骤。其中非常关键的一点就是如何进行单细胞的捕获/分选,这是决定单细胞检测成本和通量的关键步骤。
生信喵实验柴
2022/10/25
1.7K0
单细胞测序原理
Hemberg-lab单细胞转录组数据分析(九)- Scater包单细胞过滤
查看每个样品(细胞)检测到的总分子数 (UMI count)或总reads数 (reads count),拥有很少的reads或分子数的样品可能是细胞破损或捕获失败,应该移除。
生信宝典
2019/10/14
1.5K0
单细胞核测序在人类肾脏上的应用
当你的才华还撑不起你的野心时,请潜下心来,脚踏实地,跟着我们慢慢进步。不知不觉在单细胞转录组领域做知识分析也快两年了,通过文献速递这个栏目很幸运聚集了一些小伙伴携手共进,一起成长。
生信技能树jimmy
2020/03/30
7250
Python 单细胞分析教程(一):质量控制
目前,国内对于单细胞测序分析的教程五花八门,百花齐放,一个合适且准确的pipeline对于分析是很有价值的。2023年在 Nat Rev Genet上发表的一篇论文“Best practices for single-cell analysis across modalities”,详细介绍了单细胞最佳实践的流程。但是,其在国内的推广有两个不足:(一)全英文教程;(二)R语言与Python混合。二者限制了其在国内的推广,故笔者在原教程的基础上,结合自身的单细胞测序分析经验。将其译至中文版,并且只使用Python完成所有分析。环境参考此前安装的omicverse环境。
生信技能树jimmy
2023/08/31
2.3K0
Python 单细胞分析教程(一):质量控制
单细胞时代 || NGS技术实现
Single-Cell RNA Sequencing and Its Combination with Protein and DNA Analyses
生信技能树jimmy
2021/03/10
1.8K0
单细胞时代 || NGS技术实现
提供超全面代码,看看顶刊 Nat Med 是如何用单细胞和空间转录组研究癌症的
生信菜鸟团
2024/11/28
1850
提供超全面代码,看看顶刊 Nat Med 是如何用单细胞和空间转录组研究癌症的
高维单细胞转录组数据处理最新(2020年3月)综述(万字长文)
看到隔壁《单细胞天地》公众号翻译了一个最新的单细胞数据处理综述,很精彩,所以申请转载到生信技能树平台以飨读者:
生信技能树
2020/05/14
2.7K0
高维单细胞转录组数据处理最新(2020年3月)综述(万字长文)
表达矩阵处理—表达质量的控制
一旦基因的表达被定量了,就将其概括为表达矩阵,其中每行对应于基因(或转录物),并且每列对应于单个细胞。通过检查该矩阵,去除在读取QC或mapping QC步骤中未检测到的劣质细胞。在此阶段未能移除低质量细胞可能会增加技术noise,这可能会模糊下游分析中感兴趣的生物信号。
生信技能树jimmy
2020/03/31
2.3K0
表达矩阵处理—表达质量的控制
推荐阅读
相关推荐
scRNA-seq—质量控制
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档