完成了前面的基础质控、过滤以及去除细胞周期的影响后,我们可以开始SCTransform normalization
。😘
SCTransform normalization
的优势:👇
SCTransform
函数即可替代NormalizeData
, ScaleData
, FindVariableFeatures
三个函数;log
标准化(10万以内的细胞都建议使用SCT
);SCTransform
,可用于矫正线粒体、细胞周期等因素的影响,但不能用于批次矫正;rm(list = ls())
library(Seurat)
library(tidyverse)
library(SingleR)
library(celldex)
library(RColorBrewer)
library(SingleCellExperiment)
library(ggsci)
这里我们还是使用之前建好的srat
文件,我之前保存成了.Rdata
,这里就直接加载了。
load("./srat1.Rdata")
srat
这次我们用新版的细胞周期基因集。🤩
cc.genes.updated.2019
s.genes <- cc.genes.updated.2019$s.genes
g2m.genes <- cc.genes.updated.2019$g2m.genes
srat <- CellCycleScoring(srat, s.features = s.genes, g2m.features = g2m.genes)
table(srat[[]]$Phase)
这里我们用一个函数就可以完成。😘
srat <- SCTransform(srat,
method = "glmGamPoi",
ncells = 8824,
vars.to.regress = c("percent.mt","S.Score","G2M.Score"),
verbose = T)
srat
我们这里进行一下的标准降维
、聚类
,这里的dims
推荐大家尽可能设置的大一些。🧐
srat <- RunPCA(srat, verbose = F)
srat <- RunUMAP(srat, dims = 1:30, verbose = F)
srat <- FindNeighbors(srat, dims = 1:30, verbose = F)
srat <- FindClusters(srat, verbose = F)
table(srat[[]]$seurat_clusters)
可视化一下吧。🥳
ncluster <- length(unique(srat[[]]$seurat_clusters))
mycol <- colorRampPalette(brewer.pal(8, "Set2"))(ncluster)
DimPlot(srat, label = T,
cols = mycol)
接着我们探索一下血小板
和树突状细胞
的marker
,分别为PPBP
和LILRA4
。🤜
这里我们可以发现在PPBP
在一个极小的细胞群中没有被标注出来。
FeaturePlot(srat,c("PPBP","LILRA4"),
label = T,
cols = colorRampPalette(brewer.pal(11, "Spectral"))(10)
)
我们可以通过提高FindClusters
函数中的resolution
选项来提高聚类数量。🥰
当然最简单的办法就是手动标记啦,这里就不演示啦。
srat <- FindNeighbors(srat, dims = 1:30, k.param = 15, verbose = F)
## Leiden algorithm即algorithm = 4, 需要配置python环境
srat <- FindClusters(srat, verbose = F, algorithm = 4, resolution = 0.95)
看一下现在有多少个聚类吧。👀
table(srat[[]]$seurat_clusters)
可视化一下吧!~
ncluster <- length(unique(srat[[]]$seurat_clusters))
mycol <- colorRampPalette(brewer.pal(8, "Set2"))(ncluster)
DimPlot(srat, label = T,
cols = mycol)
最后祝大家早日不卷!~