前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >生信分析网站(免疫浸润分析)

生信分析网站(免疫浸润分析)

作者头像
芒果先生聊生信
发布于 2020-08-12 06:32:38
发布于 2020-08-12 06:32:38
7.1K0
举报

生信论文的套路

  1. ONCOMINE从全景、亚型两个维度做表达差异分析;
  2. 临床标本从蛋白水平确认(或HPA数据库),很重要;
  3. Kaplan-Meier Plotter从临床意义的角度阐明其重要性;
  4. cBio-portal数据库做基因组学的分析(机制一);
  5. STRING互作和GO/KEGG分析探讨可能的信号通路(机制二);
  6. TISIDB/TIMER分析肿瘤免疫特征(机制三)。

在差异分析的前提下,表型分析成为重点内容,也是可以玩出花样的地方。

生存分析是非常常见的表型分析。与生存分析相比,相关性分析是另外一个常见的表型分析。相关性包括表达与病理分期、治疗手段、年龄、种族、吸烟、突变、性别、共表达等因素的相关情况,通常用相关系数R表示,其差异也是用p值判断。

此外,免疫浸润分析是近两年的热点,尤其是免疫治疗获得诺奖之后。免疫浸润分析比生存分析、差异分析和相关性分析难度更大,因为免疫学是不断延伸、拓展的学科,并不断从理论走向应用、临床,兼有科学性和技术性,比如实验中已经普遍应用的免疫印迹(WB),流式分析,免疫组化和免疫荧光等等。免疫浸润涉及的内容广泛而深入,有果友留言说对免疫浸润多做介绍,芒果还在准备中,以后会分享给果友。

肿瘤微环境中有很多细胞,包括肿瘤细胞、成纤维细胞、免疫细胞、各种信号分子和细胞外基质等,肿瘤微环境显著影响着肿瘤的诊断、生存结局和临床治疗敏感性。其中免疫浸润也是近几年肿瘤研究的一个重要方向。所以,我们要清楚一个概念那就是肿瘤组织中并不是100%的细胞是肿瘤细胞,不同肿瘤组织的微环境都有着各自的特点

肿瘤组织中存在着不同类型的细胞,但是传统的转录组测序方法(也叫Bulk RNA-seq)是将组织整体的RNA表达水平进行检测,我们并不能有效区分究竟哪些细胞表达了哪些基因。生信分析中,有一种算法叫反卷积分析,英文名叫Deconvolution。生信开发人员可以先通过预设一个优秀的数据训练集(训练集主要包含了每种不同免疫细胞的基因表达特征),然后通过反卷积算法推算出这个整体样本中究竟有哪些免疫细胞。目前已公开发表的在线数据库中,包括TIMER、CIBERSORT、ImmuneCellAI、ABIS、EPIC等,通过机器学习和反卷积算法对样本中各类免疫细胞的免疫浸润情况进行分析。

免疫分析数据库

TIMER(免疫浸润分析首选)

https://cistrome.shinyapps.io/timer/

TISIDB(全景式反应与免疫分子的关系,与TIMER呼应,次选)

http://cis.hku.hk/TISIDB/

Kaplan-Meier Plotter(结合TIMER分析肿瘤微环境中的免疫细胞浸润情况)

http://kmplot.com/analysis/

CIBERSORT(注册和R语言基础)

https://cibersort.stanford.edu/

EPIC(上传数据,R语言基础)

https://gfellerlab.shinyapps.io/EPIC_1-1/

Immune CellAI(上传数据,R语言基础)

http://bioinfo.life.hust.edu.cn/web/ImmuCellAI/

ABIS(上传数据,最好有R语言基础)

https://giannimonaco.shinyapps.io/ABIS/

相关性分析数据库

Kaplan-Meier Plotter(临床相关性分析权威数据库,推荐)

http://kmplot.com/analysis/

GEPIA(病理分期相关性分析)

http://gepia.cancer-pku.cn/detail.php?gene=&clicktag=survival

UALCAN(种族、年龄、吸烟、突变等相关性分析,与km plotter的结果呼应)

http://ualcan.path.uab.edu/

Coexpedia数据库(共表达分析)

http://www.coexpedia.org/search.php

TIMER数据库(免疫细胞分子共表达分析)

https://cistrome.shinyapps.io/timer/

STRING(相互作用分子的分析)

https://string-db.org/cgi/input.pl?sessionId=iCNtss66oYVc&input_page_show_search=on

cBioPortal(Top50临近基因的相互作用分析)

https://www.cbioportal.org/

生存分析数据库

Kaplan-Meier Plotter数据库(生存分析经典数据库,首选)

http://kmplot.com/analysis/

PrognoScan数据库(生存分析信息最全面的数据库,次选)

http://dna00.bio.kyutech.ac.jp/PrognoScan/index.html

GEPIA(国人之光,相关性分析是特色)

http://gepia.cancer-pku.cn/detail.php?gene=&clicktag=survival

UALCAN(甲基化是特色)

http://ualcan.path.uab.edu/

Oncolnc数据库(连mRNA, miRNA, or lncRNA也可以做生存分析)

http://www.oncolnc.org/

cBioPortal(组学分析神器也能做生存分析)

https://www.cbioportal.org/

差异分析数据库

oncomine数据库(差异分析首选)

https://www.oncomine.org/resource/main.html

GEPIA数据库(共表达是特色)

http://gepia.cancer-pku.cn/index.html

TIMER(免疫浸润分析是特色)

https://cistrome.shinyapps.io/timer/

HCCDB(肝癌数据库)

http://lifeome.net/database/hccdb/home.html

UALCAN(甲基化是特色)

http://ualcan.path.uab.edu/

CCLE(基因在细胞系的表达)

https://portals.broadinstitute.org/ccle/

THE HUMAN PROTEIN ATLAS (人类蛋白图谱)

https://www.proteinatlas.org/

Gene Expression Omnibus (基因表达数据库,R语言基础)

https://www.ncbi.nlm.nih.gov/geo/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-08-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 芒果先生聊生信 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
HanLP中的人名识别分析详解
分词:给定一个字的序列,找出最可能的标签序列(断句符号:[词尾]或[非词尾]构成的序列)。结巴分词目前就是利用BMES标签来分词的,B(开头),M(中间),E(结尾),S(独立成词)
IT小白龙
2018/10/29
9250
HanLP中的人名识别分析详解
hanlp自然语言处理包的人名识别代码解析
HanLP发射矩阵词典nr.txt中收录单字姓氏393个。袁义达在《中国的三大姓氏是如何统计出来的》文献中指出:当代中国100个常见姓氏中,集中了全国人口的87%,根据这一数据我们只保留nr.txt中的100个常见词语的姓氏角色,其他词语去掉其姓氏角色状态。过滤后,nr.txt中具有姓氏角色的单字共计97个。
IT小白龙
2019/08/02
9570
hanlp自然语言处理包的人名识别代码解析
NLP系列学习:命名实体识别(一)
在自然语言处理中,分词,词性标注,命名实体识别和句法情感分析是非常关键的分支,因为最近需要对此有一些应用,便去了解了一下特定领域目前使用的方法以及一些困难,特此进行总结。
云时之间
2018/07/24
8900
NLP系列学习:命名实体识别(一)
中文NLP笔记:14. 中文命名实体提取
  一般包括三大类(实体类、时间类和数字类)和七小类(人名、地名、机构名、时间、日期、货币和百分比)
杨熹
2019/03/06
1.6K0
OCR 【技术白皮书】第一章:OCR智能文字识别新发展——深度学习的文本信息抽取
信息抽取 (Information Extraction) 是把原始数据中包含的信息进行结构化处理,变成表格一样的组织形式。输入信息抽取系统的是原始数据,输出的是固定格式的信息点,即从原始数据当中抽取有用的信息。信息抽取的主要任务是将各种各样的信息点从原始数据中抽取出来。然后以统一的形式集成在一起,方便后序的检索和比较。由于能从自然语言中抽取出信息框架和用户感兴趣的事实信息,无论是在信息检索、问答系统还是在情感分析、文本挖掘中,信息抽取都有广泛应用。随着深度学习在自然语言处理领域的很多方向取得了巨大成功,循环神经网络(RNN)和卷积神经网络(CNN)也被用于信息抽取研究领域,基于深度学习的信息抽取技术也应运而生。
合合技术团队
2022/08/15
1.3K0
OCR 【技术白皮书】第一章:OCR智能文字识别新发展——深度学习的文本信息抽取
做项目一定用得到的NLP资源【分类版】
原文链接:https://github.com/fighting41love/funNLP
流川疯
2022/09/20
2.1K0
NLP学习路线总结
自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究人与计算机之间用自然语言进行有效通信的理论和方法。融语言学、计算机科学、数学等于一体的科学。旨在从文本数据中提取信息。目的是让计算机处理或“理解”自然语言,以执行自动翻译、文本分类和情感分析等。自然语言处理是人工智能中最为困难的问题之一。
全栈程序员站长
2022/11/10
1.3K0
NLP学习路线总结
HMM,MEMM和CRF
概率图模型(probabilistic graphical model, PGM)指用图表示变量相关(依赖)关系的概率模型,主要分为两类:
故事尾音
2019/12/18
1.6K0
HMM,MEMM和CRF
达观数据如何打造一个中文NER系统
1 NER简介 NER(Named Entity Recognition,命名实体识别)又称专名识别,是自然语言处理中常见的一项任务,使用的范围非常广。命名实体通常指的是文本中具有特别意义或者指代性非常强的实体,通常包括人名、地名、机构名、时间、专有名词等。NER系统就是从非结构化的文本中抽取出上述实体,并且可以按照业务需求识别出更多类别的实体,比如产品名称、型号、价格等。因此实体这个概念可以很广,只要是业务需要的特殊文本片段都可以称为实体。以下将详细介绍达观数据在文本语义理解过程中是如何构建中文NER系统
达观数据
2018/03/30
2.2K0
达观数据如何打造一个中文NER系统
NER | 命名实体识别及相关经验
每天给你送来NLP技术干货! ---- 编辑:AI算法小喵 写在前面 之前我们曾分享过几篇 NER 的相关论文,大家应该还有点印象。这次小喵看到一篇比较系统的 NER 相关文章,特别适合小白。作者从什么是命名实体讲到为什么要做命名实体,然后讲到了 NER 数据处理、建模的经验,内容非常丰富,所以这次打算跟大家分享一下。 1. 什么是NER 1.1 什么是实体 根据百度百科定义,实体[1]是指客观存在、并可相互区别的事物。实体可以是具体的人、事、物,也可以是概念。 1.2 什么是命名实体 命名实体 就是以名称
zenRRan
2022/06/29
2K0
NER | 命名实体识别及相关经验
HanLP《自然语言处理入门》笔记--1.新手上路
自然语言处理(Natural Language Processing,NLP)是一门融合了计算机科学、人工智能及语言学的交叉学科,它们的关系如下图所示。这门学科研究的是如何通过机器学习等技术,让计算机学会处理人类语言,乃至实现终极目标–理解人类语言或人工智能。
mantch
2020/02/18
1.4K0
基于分布式的短文本命题实体识别之----人名识别(python实现)
据统计:未登录词中中文姓人名在文本中一般只占2%左右,但这其中高达50%以上的人名会产生切分错误。在所有的分词错误中,与人名有关的错误占到了将近90%,这中国人名都是根据人的想法起的名字,有很大的随意性,并且数量巨大,规律也不尽相同。
流川疯
2019/01/18
3.8K0
【一文讲解深度学习】语言自然语言处理(NLP)第一篇
NLP(Nature Language Processing,自然语言处理)是计算机及人工智能领域的一个重要的子项目,它研究计算机如何处理、理解及应用人类语言。是人类在漫长的进化过程中形成的计算机语言复杂的符号等系统(类似C/Java的符号等系统)。以下是关于自然处理的常见定义:
苏州程序大白
2022/04/14
1.7K0
【一文讲解深度学习】语言自然语言处理(NLP)第一篇
自然语言处理(NLP)学习路线总结
NLP是自然语言处理(Natural Language Processing)的缩写,它是计算机科学领域中专注于研究如何使计算机理解、生成和处理人类语言的学科。NLP涉及的技术包括但不限于分词、词性标注、句法分析、语义分析、机器翻译、情感分析、信息抽取、文本生成等。通过NLP,计算机可以处理和分析大量的文本数据,帮助人们更好地理解和应用语言信息。
机器学习AI算法工程
2024/07/04
9110
自然语言处理(NLP)学习路线总结
一文读懂命名实体识别
本文对自然语言基础技术之命名实体识别进行了相对全面的介绍,包括定义、发展历史、常见方法、以及相关数据集,最后推荐一大波 Python 实战利器,并且包括工具的用法。
用户1737318
2019/04/30
2K0
一文读懂命名实体识别
【智能】自然语言处理概述
1 什么是文本挖掘? 文本挖掘是信息挖掘的一个研究分支,用于基于文本信息的知识发现。文本挖掘的准备工作由文本收集、文本分析和特征修剪三个步骤组成。目前研究和应用最多的几种文本挖掘技术有:文档聚类、文档分类和摘要抽取。 2 什么是自然语言处理? 自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究人与计算机之间用自然语言进行有效通信的理论和方法。融语言学、计算机科学、数学等于一体的科学。 自然语言处理原理:形式化描述-数学模型算法化-程序化-实用化 语音的自动合成与识别、机器翻译、自然语言理解、
陆勤_数据人网
2018/04/18
1.5K0
【智能】自然语言处理概述
读书笔记 | 《Python自然语言处理实战:核心技术与算法》| (1)
对词的词性标注,词性:动词、名词、形容词等,例如:我/r爱/v北京/ns天安门/ns。其中,ns代表名词,v代表动词,ns、v 都是标注,以此类推。
yiyun
2022/04/01
5400
读书笔记 | 《Python自然语言处理实战:核心技术与算法》| (1)
必看!一文了解信息抽取(IE)【命名实体识别NER】
信息抽取(information extraction),简称IE,即从自然语言文本中,抽取出特定的事件或事实信息,帮助我们将海量内容自动分类、提取和重构。这些信息通常包括实体(entity)、关系(relation)、事件(event)。信息抽取主要包括三个子任务:关系抽取、命名实体识别、事件抽取。
ShuYini
2020/08/17
3K0
必看!一文了解信息抽取(IE)【命名实体识别NER】
8.HanLP实现--命名实体识别
笔记转载于GitHub项目:https://github.com/NLP-LOVE/Introduction-NLP
mantch
2020/02/21
2.8K0
【NLP】一文了解命名实体识别
1991年Rau等学者首次提出了命名实体识别任务,但命名实体(named entity,NE)作为一个明确的概念和研究对象,是在1995年11月的第六届MUC会议(MUC-6,the Sixth Message Understanding Conferences)上被提出的。当时的MUC-6和后来的MUC-7并未对什么是命名实体进行深入的讨论和定义,只是说明了需要标注的实体是“实体的唯一标识符(unique identifiers of entities)”,规定了NER评测需要识别的三大类(命名实体、时间表达式、数量表达式)、七小类实体,其中命名实体分为:人名、机构名和地名 。MUC 之后的ACE将命名实体中的机构名和地名进行了细分,增加了地理-政治实体和设施两种实体,之后又增加了交通工具和武器。CoNLL-2002、CoNLL-2003 会议上将命名实体定义为包含名称的短语,包括人名、地名、机构名、时间和数量,基本沿用了 MUC 的定义和分类,但实际的任务主要是识别人名、地名、机构名和其他命名实体 。SIGHAN Bakeoff-2006、Bakeoff-2007 评测也大多采用了这种分类。
黄博的机器学习圈子
2020/09/14
1.9K0
推荐阅读
相关推荐
HanLP中的人名识别分析详解
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文