也就是说 pbcmc其实是想使用 genefu 包的内置数据pam50这个变量,我看了看,这个变量是存在的:
教程略微有点复杂:https://rdrr.io/bioc/genefu/f/inst/doc/genefu.pdf
这个时候我们就需要想办法加大正常组织测序样本量,既然TCGA数据库没有,我们就从其他数据库着手。
2年前,考虑到科研路的艰难,我组建了文献阅读小组,广邀粉丝参与,从自身做起,开始学习及分享!感兴趣可以点击下面的链接跳转去了解详情:
取出PAM50基因,根据这些基因的表达了绘制热图,并添加分组信息,与原始分组(TNBC,noTNBC)进行对比。
今天继续跟大家分享文献解读专题,这次给大家解读一篇18年发表在Frontiers in Genetics的文章,题目为:Association Analysis of Somatic Copy Number Alteration Burden With Breast Cancer Survival。
首次接触这个名词肯定很蒙,因为它是乳腺癌领域的分类名词,需要看许多资料才能了解,我也一样,看了一些推文、英文资料、文章,才做了一些总结
当然准备把这些基因跟ensembl数据库的ID对应的时候我发现少了3个,然后我搜索发现它们的symbol其实被修改了,可以说变化比较快啦,才几年时间,3 of 50的基因就变了。
生存分析指根据试验或调查得到的数据对生物或人的生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度大小的方法,也称生存率分析或存活率分析。常用于肿瘤等疾病的标志物筛选、疗效及预后的考
https://www.nature.com/articles/s41587-022-01440-w#data-availability
英文标题:Unravelling triple-negative breast cancer molecular heterogeneity using an integrative multiomic analysis
拿到超级VIP入场券的学徒,就可以无限制参与全部生信技能树举办的线下课程,包括LINUX,R,GEO和TCGA数据挖掘,各种NGS线下大课,所以如果你想参加3个以上课程还不如直接报名学徒啦。
乳腺癌可以根据雌激素受体(estrogen receptor, ER)、孕激素受体(progesterone receptor, PR)的表达以及人表皮生长因子受体2(HER2)的过度表达或HER2基因ERBB2的扩增,分为三种广泛的亚型:luminal (ER+,PR+/−);HER2+(HER2+,ER+/−,PR+/−);和三阴性乳腺癌(TNBC;ER−PR−HER2−)。乳腺癌还根据使用PAM50分为五种“内在”分子亚型:luminal(LumA和LumB)、HER2富集(HER2E)、基底样basal-like和正常样normal-like。
为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在:TCGA知识图谱视频教程(B站和YouTube直达)
「英文标题:Multi-omics profiling of younger Asian breast cancers reveals distinctive molecular signatures」
上一次说到通过PAM50基因进行乳腺癌分型,利用的就是自己的表达矩阵和PAM50基因比较,看表达量变化进行分类。细胞周期分类和PAM50类似,也是利用基因来推断G、S、M期(https://en.wikipedia.org/wiki/Cell_cycle)
In addition to cell of origin and somatic mutation events, studies over the past 10 years have demonstrated that genetic polymorphism can significantly affect gene expression.
原文是:For probesets that map to identical Entrez gene names, select the one with highest IQR (for Affy, select mean for Agilent),也就是四分位间距IQR,这个概念主要是在boxplot图表里面显示出来。当然了,不同芯片平台也是有一些细微的差别。
首先在UCSC Xena数据库下载TCGA计划的所有BRCA相关数据分析结果来进行下游挖掘。
乳腺癌总是伴随着高度的肿瘤内异质性,是女性最常被诊断出的癌症之一。传统上,根据ER(雌激素受体)、PR(孕激素受体)和 HER2 的免疫组化特征,乳腺癌患者可分为管腔A(LumA)、管腔B(LumB)、人表皮生长因子受体2+(HER2+)和基底样亚型。四种亚型的病理特征和预后结果存在较大差异。大多数基底样乳腺癌表现出三阴性表型。三阴性乳腺癌(TNBC)总是比其他亚型具有更高的转移概率和更差的预后。
14年高考没考好,阴差阳错读了某二本的生物信息学专业,是我们学校生物信息学专业的第一届(xiao)学(bai)生(shu),记得刚进校门整个班的同学围着老师问生物信息学到底是干啥的,出来能干什么样的工作。但是老师们至今也没回答出个所以然来。因此大学浑浑噩噩过了两年,混社团混学生会,想着毕业之后去当个销售了事。
英文标题:Intrinsic Subtypes and Gene Expression Profiles in Primary and Metastatic Breast Cancer
本期文章题目是:A Targetable EGFR-Dependent Tumor-Initiating Program in Breast Cancer
发表于:Clin Cancer Res. 2015 Apr 文章题目是:Comprehensive Genomic Analysis Identifies Novel Subtypes and Targets of Triple-negative Breast Cancer 主要是考虑到TNBC是异质性较大的一种乳腺癌,而且预后非常差,所以临床用药指导急需对TNBC本身更加细致的分类,研究团队通过贝勒医学院分两次 收集了 198个TNBC病人, (discovery set: n=84; validation set: n=114) 比较稳定的把TNBC分成了4个亚型,而且还分析了7个公共数据集来验证其结论。作者整理的4个亚型以及其可能的靶点:
其中652个样品进行了Agilent基因表达芯片检测,使用PAM50进行分类: (luminal A, luminal B, HER2-enriched, basal-like, normal-like)
大家好,今天布丁和大家分享的是一篇6+分的学习笔记;文末阅读原文可获得学习笔记。
在美国,有超过310万有乳腺癌病史的女性。今年,预计将有超过266,000名女性被诊断患有浸润性乳腺癌。为了帮助医生更好地检测和治疗这种疾病,研究人员开始寻求AI的帮助。在北卡罗来纳大学最近发表的一项研究中,研究人员描述了一种基于深度学习的系统,他们开发这种系统来分析乳腺癌数字病理图像并对肿瘤进行分类,结果准确度高。
本次文献解读涉及到三篇文章。这里要解读的第一篇是创建数据集的文章,后面的两篇文章在第一篇文章的数据集基础上进行了探索。
当你的才华还撑不起你的野心时,请潜下心来,脚踏实地,跟着我们慢慢进步。不知不觉在单细胞转录组领域做知识分析也快两年了,通过文献速递这个栏目很幸运聚集了一些小伙伴携手共进,一起成长。
降维聚类分群是一个非常普遍的信息提炼方式,在TCGA多组学领域都有应用,众所周知,TCGA数据库是目前最综合最全面的癌症病人相关组学数据库,包括:
前列腺癌仍然是全世界最普遍的男性恶性肿瘤。惰性患者可以存活数年而无进展,而侵袭性患者可能迅速转移并变得无法治愈。尽管近年来总体上前列腺癌的发病率有所下降,但同时观察到晚期或转移性前列腺癌患者稳步增加,主张改善治疗策略。因此,迫切需要进一步了解前列腺癌的异质性。以前的研究是基于批量测序的,它代表了来自肿瘤和微环境(TME)的信号集体平均反映,可能忽略了可能推动疾病发展的特异细胞群。单细胞RNA测序可以解开细胞建立协通信互作网络和了解不同肿瘤以及TME关键进化成分。
这里仅仅是针对一个数据集,就是r包airway并且通过assay函数拿到其表达矩阵。
函数名称 描述 colDataPrepare Create samples information matrix for GDC samples gaiaCNVplot Creates a plo
回首年前开创的单细胞天地公众号,再看看单细胞转录组知识星球的精华资源,一年时间就这样过去了,感慨万千!
这里我们使用一下scran包的 mutual nearest neighbors (MNNs)方法吧,主要就是读文档而已:https://bioconductor.org/packages/release/bioc/vignettes/scran/inst/doc/scran.html
同一癌症的不同亚型通常表现出不同的基因组特征,需要靶向治疗。不同癌症亚型中肿瘤微环境细胞和分子水平的差异对肿瘤发病机制和预后结果具有显著影响。
An independent poor-prognosis subtype of breast cancer defined by a distinct tumor immune microenvironment
首先给大家介绍一下主成分分析(PCA)的定义,PCA是一种通过正交变换将一组可能存在相关性的变量转换为不相关的变量的统计方法,这些转换后的变量就被称为主成分(来自维基百科)。而PCA的主要作用包括但不限于:方便数据可视化、数据降维等等。
GSVA对数据库中的每一个通路在每个样本中算了一个值,相当于GSEA的enrichment score, 如果得分越高,说明这个通路在该样本中被改变的越严重。
为了充分利用组学技术的进步,更全面地了解人类疾病,需要新的计算方法对多种类型的组学数据进行综合分析。2021年6月《Nature Communications 》发表了一个有监督的多组学数据分析新方法:MOGONE,它是第一个利用图卷积网络(GCNs) 进行组学数据学习以对新样本进行有效类别预测的有监督的多组学集成方法。
可以使用 dry.run 控制是否真的下载,因为如果是下载甲基化信号值矩阵或者表达量矩阵,会耗时很长。
基于超几何分布检验的富集分析做KEGG数据库的时候,它总共只有七千多个基因,人类总的背景基因有两万多个,被KEGG记住的只有6500个(一直在增加),假设一条通路有117个基因参与,我们的差异基因中有10个与之重合,这已经是很多了,超几何分布检验会判定是统计学显著。
文章发表于:Cell. 2018 May。题目是:Chemoresistance Evolution in Triple-Negative Breast Cancer Delineated by Single-Cell Sequencing.
据悉,华为中国官方微博发文称,由华为、LightCounting、光迅科技、住友、索尔思、思博伦以及颖飞等产业链上下游合作伙伴联合发起的第三届50G PAM4技术和产业论坛已经在深圳举行,以推进相关合作。
以太网由IEEE标准化为IEEE 802.3。而以太网物理层的发展经历了相当长的时间跨度,包含多种物理介质接口和多个速度等级。速度范围从1Mbit/s到400 Gbit/s,物理介质范围从笨重的同轴电缆到双绞线和光纤。
“铜”进“光”退的需求 伴随着云业务的快速发展,数据中心互联硬件对高运行稳定性和低成本的诉求也越来越强烈。以25G速率的服务器到交换机互联方案为例,主要的连接方式有两种,DAC和AOC。 DAC(direct attach cable)顾名思义,由于是直连方案,高速通信信号在设备之间传递,处于透传状态,而常用的AOC(active optical cable)由于需要将电信号转换成光信号,再转换成电信号,存在多次信号转换的过程,会引入相应的适配问题,而数据中心互联硬件故障里面因为信号或者协议匹配导致的适
所以,他就和小白约定:考试的时候,自己会吹泡泡,吹大泡泡代表1(对),吹小泡泡代表0(错)。
领取专属 10元无门槛券
手把手带您无忧上云