第三期理论教程结尾时讲到蛋白质三大元素整合以及搜库过程是理论谱图和实际谱图的匹配过程
对于蛋白质谱的差异表达数据分析,我们之前介绍过 [[ProVision-蛋白质谱分析工具]] 这个基于的 MaxQuant 软件定量之后的 proteinGroup 数据来进行差异分析的工具。在 ProVision 当中提供了详细的数据处理和可视化的选项。但是如果只是想进行简单的差异分析并不想设置那么多选项的话。就显得有一些繁琐了。所以今天就介绍另外一个相对操作检索的分析工具:LFQ-Analyst: https://bioinformatics.erc.monash.edu/apps/LFQ-Analyst/
《The Primary Effect on the Proteome of ARID1A-mutated Ovarian Clear Cell Carcinoma is Downregulation of the Mevalonate Pathway at the Post-transcriptional Level》
基于文章主图,我们将临床蛋白质组的处理步骤分为的实验处理,质谱分析和生信分析共9步,分别进行简单介绍:
上周我们公布了,蛋白质组学习小组起飞啦! 短短几天就获得了250多小伙伴的支持,让我们也更有信心的带领大家掌握一个蛋白质组学数据处理的实战,前面两期我们分享的是:
一 .上期教程方法输出的结果1.上期的教程输出的结果2. 文件夹较多3.重要的文件夹是 combined4. txt 文件夹5. proteinGroup 文件二. 发现上期结果错误1.错误分析2.文章方法再次解析三. 正确的实验设置1)细胞一:OVCA4292)细胞二: OVISE3)注意四 输出结果基本认识summaryproGroupspeptidemodificationSpecificPeptides
对于蛋白质谱的数据,之前介绍过两个储存蛋白质谱公共数据的平台: [[iProX_ProteomeXchange-蛋白质谱原始数据检索数据库]]。在这两个平台当中,储存的主要是质谱的原始数据。如果想要使用里面的公共数据的话,就要对其进行重新分析。所以今天就给大家介绍一个用来发分析质谱数据的平台:ProVision: https://provision.shinyapps.io/provision/
都非常成功,培养了非常多的技能树优秀小伙伴,形成了华语圈最大的生物信息学交流社群,而且这些组学实战,我都录制了完整视频在B站免费发布供十万人学习:
知识回顾定量蛋白质组学一、无标定量(相对定量)1.概念2.原理参考文献3.理论基础方法一方法二4.流程5.特点二、有标定量1.概念2.原理3.种类4. ITRAQ1)参考文献2)原理3)ITRAQ4)实验流程5)峰谱结果6)特点5、SILAC1)基本原理和流程2)参考文献3)优势
关于非编码RNA的分类,之前在 [[非编码RNA分类总结]] 当中提到过里面的Long-Non Coding RNA是不编码蛋白的。但是随着研究的越来越深入,尤其是质谱技术的发展,也发现有些LncRNA可以编码肽段来发挥作用。这个也进一步丰富了LncRNA的功能。因此今天就来介绍一个用来检索肿瘤相关LncRNA编码肽段的数据库:SPENCER | A comprehensive database for small peptides encoded by ncRNA in cancer patients: http://spencer.renlab.org/#/home
可以看到,有两个技术:25 groups( 125 samples ) for TMT proteomics, and 31 paired samples were subjected to lable-free phosphoproteomics.
但是在高通量测序大行其道的这10年,困扰大家的问题在于如何从繁多的基因定位到少量的几个基因,这也就是数据挖掘的核心,缩小目标基因!各种数据挖掘文章本质上都是要把目标基因集缩小,比如表达量矩阵通常是2万多个蛋白编码基因,不管是表达芯片还是RNA-seq测序的,采用何种程度的差异分析,最后都还有成百上千个目标基因。如果是临床队列,通常是会跟生存分析进行交集,或者多个数据集差异结果的交集,比如:多个数据集整合神器-RobustRankAggreg包 ,这样的基因集就是100个以内的数量了,但是仍然有缩小的空间,比如lasso等统计学算法,最后搞成10个左右的基因组成signature即可顺利发表。
今天介绍的技术方法来源于DO-MS: Data-Driven Optimization of Mass Spectrometry Methods 这篇文章,发表于2019年9月11日的Journal of Proteome Research(蛋白质组研究期刊)。液相色谱-串联质谱法(LS-MS/MS)的蛋白质定量结果取决于一系列相关的参数,而参数之间的相关性对解决LS-MS/MS中的特定问题提出了挑战。DO-MS是针对于单细胞蛋白质定量过程中优化参数的工具方法,并能够诊断定量过程中出现的问题并提出相应的解决方案。这篇文章的作者团队同样也开发了基于LS-MS/MS的单细胞蛋白质定量方法SCoPE-MS(见单细胞蛋白质组学| ScoPE-MS)。关于DO-MS的详细介绍,可以进入官网https://do-ms.slavovlab.net/
这篇跟之前的一篇博文Bioconductor的DNA甲基化芯片分析流程一样,主要简单的记录下如何基于bioconductor的R包对蛋白组质谱数据进行分析。在看到这篇biocondutor官网文档Mass spectrometry and proteomics data analysis之前,我一直以为质谱数据的分析过程就是用一些商业化软件或者开源软件将谱图转化为肽段/蛋白的表达谱,由于蛋白组应用未如NGS数据那般热门,所以就未去搜索过是否能用R包来对质谱数据进行一定程度的分析。还好biocondutor将
领取专属 10元无门槛券
手把手带您无忧上云