前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >hypothetical protein假设蛋白

hypothetical protein假设蛋白

作者头像
Y大宽
发布于 2018-09-30 02:42:24
发布于 2018-09-30 02:42:24
3.4K0
举报
文章被收录于专栏:Y大宽Y大宽

Wiki

在生物学中,hypothetical protein是这样一种蛋白,其存在已经被预测,但是缺乏体内表达的实验证据。基因组测序预测了众多的开放阅读框(open reading frame)但其功能仍然未知。这些蛋白质,无论是孤儿还是保守的假设蛋白质,占每个新测序基因组中编码的蛋白质的约20%至40%。虽然像微阵列或质谱这样的技术可以确定gene是表达的,但是因为其与具有注释生化功能的蛋白质序列缺乏同一性,因此难以赋予其功能。

如今,大多数蛋白质序列是从基因组DNA测序的计算分析推断而来的。假设蛋白是在基因组分析过程中由基因预测软件产生。生物信息学工具在基因鉴定过程中,发现一个大的ORF,而这个ORF在蛋白质数据库中并没有同源序列,那么它就会把这个序列归为“hypothetical protein”。

假设蛋白质的功能可以通过域同源性(domain homology)搜索来进行预测,并且这种预测有不同的期望值。通过把hypothetical protein与已知的家族domains进行比较,可以获得保守结构域,进而可以把这些假设蛋白归类到某一蛋白质家族中,即使它们还没有被体内实验证实。

hypothetical protein的功能也可以通过同源建模进行预测,在这种预测中,假设蛋白要与已知三维结构的蛋白序列进行对齐,并且,通过这种方法,如果结构被预测,那么假设蛋白的功能也可以由计算来确定。此外,注释假设蛋白功能的方法包括通过 结构基因组学方法对这些蛋白进行三维结构确定,理解辅基/金属结合的本质和模式,与已知功能和已注释的可能的催化位点和调节位点的蛋白的折叠相似性等。通过筛选各种底物进行生化功能评估的结构预测方法是注释假设蛋白功能的另一种有前景的方法。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018.09.25 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Nature Methods | 蛋白质序列的深度嵌入和比对
这次为大家报道的是nature methods 上一篇题为” Deep embedding and alignment of protein sequences” 的文章,来自法国巴黎Google Research的Brain Team团队。
DrugAI
2023/02/13
6900
Nature Methods | 蛋白质序列的深度嵌入和比对
Nature:原核生物基因的生物地理学研究
文章导读:近十几年来,随着测序技术的飞速发展与快速应用,生物信息学数据得到大量积累。以往研究多集中于新数据的挖掘,在系统化分析上仍然存在很大不足。接下来很可能会进入“后组学”时代,系统化分析生物数据以解决核心科学问题为大势所趋。本篇文章系统地整理了全球不同生境的微生物组数据,并以此分析基因的生物地理。
SYSU星空
2022/05/05
7640
Nature:原核生物基因的生物地理学研究
生化小课 | 蛋白质序列有助于阐明地球上生命的历史(含蛋白质的结构:一级结构 小结)
表示蛋白质氨基酸序列的简单字母串包含惊人的丰富信息,通过将生物信息学工具应用于基因组和蛋白质序列数据,可以解锁这些信息。
尐尐呅
2023/09/06
9340
生化小课 |  蛋白质序列有助于阐明地球上生命的历史(含蛋白质的结构:一级结构 小结)
如何预测蛋白质三维结构(SWISS-MODEL)
根据对天然蛋白质结构与功能分析建立起来的数据库里的数据,可以预测一定氨基酸序列肽链空间结构和生物功能;也可以通过分子动力学、分子热力学等,根据能量最低、同一位置不能同时存在两个原子等基本原则分析计算蛋白质分子的立体结构和生物功能。
用户1359560
2020/06/16
5.6K0
如何预测蛋白质三维结构(SWISS-MODEL)
Nat. Biotechnol. | 利用深度学习进行蛋白质同源性检测和结构比对
今天为大家介绍的是来自Kyunghyun Cho和Richard Bonneau团队的一篇论文。在生物技术领域,挖掘序列(sequence)、结构(structure)和功能(function)之间的关系,需要更好的方法来比对那些与已经标注的蛋白质序列相似度较低的蛋白质。作者开发了两种深度学习方法来解决这一难题,即TM-Vec和DeepBLAST。TM-Vec允许在大型序列数据库中搜索结构-结构的相似性。它经过训练,能够直接从序列对预测TM分数,作为结构相似性的度量,无需中间计算或解析结构。一旦识别出结构相似的蛋白质,DeepBLAST就可以仅使用序列信息来结构性地比对蛋白质,识别蛋白质之间的结构同源区域。
DrugAI
2023/11/22
1.2K0
Nat. Biotechnol. | 利用深度学习进行蛋白质同源性检测和结构比对
Nat.Commun.| 使用图卷积网络的基于结构的蛋白质功能预测
今天给大家介绍的是Vladimir Gligorijević等人在nature communication上发表的文章《Structure-based protein function prediction using graph convolutional networks》。序列数据库中蛋白质数量的快速增加及其功能的多样性对自动功能预测的计算方法提出了挑战。作者提出了DeepFRI,一个利用从蛋白质语言模型和蛋白质结构中提取的序列特征来预测蛋白质功能的图卷积网络。它的性能优于当前领先的方法和基于序列的卷积神经网络,并可扩展到当前序列存储库的规模。使用同源性模型增强实验结构的训练集允许作者显著扩展预测函数的数量。DeepFRI具有显著的去噪能力,当实验结构被蛋白质模型取代时,性能只有轻微的下降。类激活图允许以前所未有的分辨率进行功能预测,允许在残基级别上进行特定位点的注释。作者通过注释来自PDB和SWISS-MODEL的结构,展示了此方法的实用性和高性能。
智能生信
2021/09/14
1.6K0
Nat.Commun.| 使用图卷积网络的基于结构的蛋白质功能预测
circRNA蛋白编码能力预测
我们知道很多circRNA其实是由exon构成的,exon是有编码能力的,因此我们可以推测很多circRNA应该是有编码蛋白能力的。下图所示的circRNA的其中一个功能就是编码蛋白。
生信交流平台
2022/09/21
4180
circRNA蛋白编码能力预测
Cell重磅综述:关于人类转录因子,你想知道的都在这
转录因子(Transcription Factors, TFs)指能够以序列特异性方式结合DNA并且调节转录的蛋白质。转录因子通过识别特定的DNA序列来控制染色质和转录,以形成指导基因组表达的复杂系统。尽管众多科学家对理解转录因子如何控制基因表达有着浓厚的兴趣,精准定位转录因子在基因组上的特异性结合位点,以及转录因子结合后最终如何参与转录调节仍然具有挑战性。
生信宝典
2018/12/24
12.4K0
eLife | 利用进化信息预测蛋白质界面间残基-残基相互作用
导语:蛋白质在进化过程中,会发生氨基酸突变,破坏了残基之间的相互作用而导致蛋白质结构不稳定,若此时与突变残基具有相互作用的残基也随之发生突变,且构成新的相互作用,使蛋白质结构保持稳定,称这种变化为蛋白质共进化。本次介绍一篇由美国华盛顿大学霍华德休斯医学院研究团队于2014年5月发表在eLife上的一篇文章,该文章利用共进化信息实现了对蛋白质间残基-残基相互作用的鲁棒且准确的预测。
DrugAI
2021/02/01
1.3K0
eLife | 利用进化信息预测蛋白质界面间残基-残基相互作用
ensemble database_oracle数据库执行计划怎么看
原文来源:x2yline在生信进化树上的评论,http://www.biotrainee.com/thread-626-1-1.html
全栈程序员站长
2022/09/20
1.4K0
AromaDeg:细菌好氧降解芳香族化合物的系统发育基因组学数据库
Journal: Database: The Journal of Biological Databases and Curation
Listenlii-生物信息知识分享
2020/06/01
9580
AromaDeg:细菌好氧降解芳香族化合物的系统发育基因组学数据库
热点综述 | 利用宏基因组数据促进蛋白质结构预测和新功能蛋白的发现
在过去的十年中,宏基因组测序技术以惊人的速度提供了越来越多的蛋白序列数据,这些数据已被用于各研究领域,如研究肠道微生物群在人类疾病和衰老中的作用。然而,在收集的所有宏基因组序列中,只有一小部分在功能或结构上进行了表征,其中大部分尚未被探索。近日《Computational and Structural Biotechnology Journal》发表了一篇Mini review,回顾了宏基因组数据如何被用于蛋白质结构预测和蛋白质发现。
尐尐呅
2022/04/01
1.3K0
热点综述 | 利用宏基因组数据促进蛋白质结构预测和新功能蛋白的发现
机器学习遇见生物学:详解蛋白质折叠预测中的算法
蛋白质折叠问题一直是一个耗费巨大的难题,但是这个难题的解决又对人类具有巨大的意义。于是各个研究机构都开始寻找蛋白质折叠问题的不同解,希望找到一种高效、准确的方式来解决这一难题。
机器之心
2019/12/24
1.1K0
万字综述|一文掌握深度学习与语言模型在微生物组研究中的应用
近年来,深度学习技术尤其是大型语言模型(LLM)的发展,为微生物组和宏基因组学研究带来了重大变革。微生物蛋白和基因组序列,如同自然语言一样,构成了生命的“语言”,使得LLMs能够从复杂的微生物生态中提取有价值的信息。
实验盒
2025/02/05
3530
万字综述|一文掌握深度学习与语言模型在微生物组研究中的应用
scRNA分析之后,如何看待结果和进行实验验证?这篇文章告诉你
生信菜鸟团
2025/01/16
2330
scRNA分析之后,如何看待结果和进行实验验证?这篇文章告诉你
(宏)基因组编码基因预测
基因预测是指通过对组装的基因组序列进行分析,根据已知生物的基因结构知识或数据库序列来识别其所包含的基因等功能区域。编码基因预测,就是识别基因组序列上所包含的蛋白质编码区域(Coding sequence,CDS),通过在基因组序列上寻找开放阅读框(Open Reading Frame,ORF)实现。
SYSU星空
2022/05/05
2.9K0
(宏)基因组编码基因预测
使用refGenome加上dplyr玩转gtf文件
当然,这个gtf是有非常多的值得探索的地方,比如可以完成http://www.biotrainee.com/thread-626-1-1.html 我在生信技能树»生信技能树›互动作业›脚本能力实践›生信人必练的200个数据处理任务›生信编程直播第三题:hg38每条染色体基因,转录本的分布 !
生信技能树
2018/12/24
1.8K0
Nat. Genet. | 深度蛋白质语言模型在基因组范围内预测疾病变异效应
今天为大家介绍的是来自Chun Jimmie Ye和Vasilis Ntranos团队的一篇关于语言模型应用的论文。预测编码变异的效应是一个重大挑战。尽管最近的深度学习模型在变异效应预测准确性方面取得了改进,但由于依赖于近源同源物或软件限制,它们无法分析所有编码变异。在这里,作者开发了一个工作流程,使用ESM1b,一个拥有6.5亿参数的蛋白质语言模型,来预测人类基因组中约4.5亿个可能的错义变异效应。ESM1b在将约15万个ClinVar/HGMD错义变异分类为致病性或良性,并在28个深度突变扫描数据集中预测测量方面优于现有方法。
DrugAI
2023/09/26
3380
Nat. Genet. | 深度蛋白质语言模型在基因组范围内预测疾病变异效应
ORFipy如何精准定位开放阅读框:原理、应用与实践
ORFipy是一种基于Python的工具,用于从基因组和转录组序列中快速、灵活地搜索开放阅读框(ORFs)。该工具由Urminder Singh和Eve Syrkin Wurtele开发,已发表在《Bioinformatics》杂志上。
简说基因
2025/02/20
2900
ORFipy如何精准定位开放阅读框:原理、应用与实践
一文极速读懂UniProt数据库
Uniprot (Universal Protein )是包含蛋白质序列,功能信息,研究论文索引的蛋白质数据库,整合了包括EBI( European Bioinformatics Institute),SIB(the Swiss Institute of Bioinformatics),PIR(Protein Information Resource)三大数据库的资源。
白墨石
2021/01/13
3K0
一文极速读懂UniProt数据库
推荐阅读
相关推荐
Nature Methods | 蛋白质序列的深度嵌入和比对
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档