文章标题:《Single-cell transcriptome atlas of the human corpus cavernosum》
发表日期和杂志:2022年发表在Nature communications上
在线阅读链接:https://doi.org/10.1038/s41467-022-31950-9
从penile carcinoma resection的肿瘤边缘获得3个正常组织标本,所有患者都报告良好的刺激erections和清晨erections。
5例erections功能障碍(ED)的海绵体(CC)组织均取自人工海绵体植入活检标本,经nocturnal penile tumescence (NPT) 和intracavernosal injection (ICI)试验确诊为器质性ED而非精神性ED。DMED患者至少有10年的1型糖尿病病史,手术前血糖控制良好。
文章分析了来自3名正常erections的男性和5名器质性erections功能障碍患者的64,993个人类海绵体单细胞转录组。
数据链接是:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE206528
数据情况:
GSM6255907 Normal_1
GSM6255908 Normal_2
GSM6255909 Normal_3
GSM6255910 non-DM_1
GSM6255911 non-DM_2
GSM6255912 non-DM_3
GSM6255913 Diabetes_1
GSM6255914 Diabetes_2
提供的是csv.gz格式的压缩文件
GSM6255907_Normal_1_gene_martix.csv.gz 21.0 Mb
GSM6255908_Normal_2_gene_matrix.csv.gz 16.3 Mb
GSM6255909_Normal_3_gene_matrix.csv.gz 27.2 Mb
GSM6255910_non-DM1_gene_matrix.csv.gz 16.5 Mb
GSM6255911_non-DM2_gene_matrix.csv.gz 9.6 Mb
GSM6255912_non-DM3_gene_matrix.csv.gz 28.1 Mb
GSM6255913_Diabetes_1_gene_matrix.csv.gz 24.5 Mb
GSM6255914_Diabetes_2_gene_martix.csv.gz 25.8 Mb
下载数据后使用fread函数读取,再创建seurat对象即可
#指定文件存放位置
dir='GSE206528_RAW/'
samples=list.files( dir )
samples
#读取数据
sceList = lapply(samples,function(pro){
# pro=samples[1]
print(pro)
ct=fread( file.path(dir,pro ) ,data.table = F)
ct[1:4,1:4]
rownames(ct)=ct[,1]
ct=ct[,-1]
sce =CreateSeuratObject(counts = ct ,
project = pro ,
min.cells = 5,
min.features = 300 )
return(sce)
})
#数据整合
do.call(rbind,lapply(sceList, dim))
sce.all=merge(x=sceList[[1]],
y=sceList[ -1 ],
add.cell.ids = samples )
names(sce.all@assays$RNA@layers)
sce.all[["RNA"]]$counts
LayerData(sce.all, assay = "RNA", layer = "counts")
sce.all <- JoinLayers(sce.all)
dim(sce.all[["RNA"]]$counts )
#查看数据情况
as.data.frame(sce.all@assays$RNA$counts[1:10, 1:2])
head(sce.all@meta.data, 10)
table(sce.all$orig.ident)
对读取进来的数据进行质控、harmony整合以及单细胞细分亚群定义等。
小tips:这个数据集是使用singleR基于自建数据库来自动化注释单细胞转录组亚群中,使用singleR自动注释和手动注释对比分析的数据集,大家可以试试看。
根据已知的细胞类型特异性标记的表达,在整个细胞群中发现了七个主要簇,包括ECs、FBS、周细胞(PC)、巨噬细胞(MACs)、SMCs、施万细胞(SWCs)和T细胞(Ts)。所有簇都包含正常细胞和ED患者细胞,但正常细胞和ED CC在t-SNE图上显示出显著的异质性
使用BioinfoArk提供的中国区chatGPT查询到各个细分亚群的解释和常见Marker基因
以下是每个细胞类型的简要介绍和一些常见的Marker基因:
对每个细胞簇的前30个差异基因进行GO富集分析,结果与之前对这些细胞类型的生物学特性的理解一致。
成纤维(FB)簇在7个簇中表现出最强的信号输出能力,表明了它们在CC微环境中的重要调控功能。
为了进一步探索海绵体FB(CCFB)及其在成纤维细胞谱系框架下的生物学功能,首先将CCFB与来自9项不同研究的成纤维细胞数据集相结合,包括心脏、骨骼肌、结肠、肝脏、肾脏、皮肤和肺在正常和疾病状态下。比较了来自每个组织的成纤维细胞之间的相似性,发现CCFB与心脏和骨骼肌的相似性更相似
参考了Buechler研究的分类标准后,分析发现CCFB主要由PI16+、APOC1+和COMP+ FB三个簇组成。
PI16 被预测在参与心肌细胞发育的细胞生长的上游或负调控范围内起作用,并且该簇被认为是成纤维细胞分化轨迹的根源。这三个簇可以根据一些CCFB特异性标记进一步分为6个亚簇:
在这6个CCFB亚簇中,分别鉴定出212、151、71、429、254和442个DEGs
与ED患者相比,非DM和DMED患者中APOC1+ FB尤其是FB1亚簇的比例增加
使用独创性通路分析(IPA)来分析每个亚簇的细胞死亡和增殖,发现增殖和存活相关的术语,如“细胞周期进程”、“上皮细胞增殖”、“细胞活力”和“细胞存活”,在FB1亚簇中被显著激活。
关于能量代谢的异质性,发现FB1表达的糖酵解相关基因水平较低,而FB1和FB2表达的甘油三酯代谢相关基因水平较高。