暂无搜索历史
函数格式:Series.sort_values(ascending=True, inplace=False)
本次演示我们以R自带的数据集diamonds为例进行绘图,由于数据量比较大我们使用tidyverse随机抽取1000条数据进行演示。
Anaconda:https://www.anaconda.com/(此处请留意安装路径)
上一期我们介绍了如何人工进行亚群注释,本期我们来介绍单细胞转录组数据的自动注释方法:SingleR。
前几期我们确定了我们想要的cluster,接下来就需要进入标志物识别阶段,此步骤可以帮助我们验证某些类群的身份,推测未知类群的身份,即:细胞亚群注释。
本次我们介绍Pandas数据统计函数,如针对数值类型的统计(获取样本个数、平均值、标准差、极值等);针对非数值类型的统计(获取每个类型的个数)以及计算相关系数和...
在数据分析时,原始数据往往不能满足我们的需求,经常需要按照一定条件创建新的数据列或者修改原有数据列,然后进行后续分析。
本文框架 0. 导入Pandas 1. 数据读取与预处理 2. 使用单个label值筛选数据 3. 使用列表名批量筛选 4. 使用区间进行范围筛选 5. 使用...
上一期介绍了将文件加载到Pandas对象,这个对象就是Pandas的数据结构。本次我们就来系统介绍一下Pandas的数据结构。
本文框架 0.导入Pandas 1.读取csv文件 1.1 查看读取前的csv数据 1.2 读取数据 1.3 初步数据探索 2. 读取txt文件 2.1 查看...
上期推文单细胞转录组 | 多样本处理与锚定法整合介绍了使用锚定法进行多个样本整合,本期我们来介绍另一个多样本整合的主流方法:Harmony。
前几期我们介绍了对单个样本进行处理,本次我们介绍如何处理多个样本以及如何对多样本进行整合矫正。
单细胞测序的细胞数目成千上万,在后续分析中需要对其进行注释,但是对每一个细胞都进行注释不现实,因此我们需要对这些细胞进行聚类,这样只需要对聚类生成的cluste...
假设一共1000个细胞,每个细胞只有一个基因(基因Ⅰ)的表达,那么这些细胞会分布在以基因Ⅰ为x轴的一维坐标轴上;如果每个细胞有两个基因(基因Ⅰ、基因Ⅱ)表达,那...
细胞周期一般包括G1(DNA合成前期)、S(DNA合成期)、G2(DNA合成后期)以及M(细胞分裂期)。
BUSCO能利用单拷贝同源基因数据库对基因组序列的完整性进行分析。BUSCO的核心原理是调用hmmsearch将待分析的基因组(转录组序列或蛋白序列)和单拷贝同...
原核生物的基因没有内含子,其基因预测相对真核生物简单。本期将以大肠杆菌基因组为例,讲解如何使用GeneMarks对原核基因组进行预测。
本期将演示如何使用FastQC对二代测序数据进行质控以及对质控报告进行全方位的解读。
三代测序错误率比较高,一般组装后需要进行纠错来提高准确度。本次介绍使用racon来对三代基因组进行纠错优化。
三代测序错误率比较高,一般组装后需要进行纠错来提高准确度。本次介绍使用Pilon通过引入二代测序数据来对三代基因组进行纠错,此外Pilon还支持对二代测序数据拼...
暂未填写公司和职称
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市