前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Motif和domain的区别

Motif和domain的区别

作者头像
Y大宽
发布于 2018-09-10 03:57:56
发布于 2018-09-10 03:57:56
3.6K0
举报
文章被收录于专栏:Y大宽Y大宽
Protein domain:

结构域的概念由Wetlaufer于1973年首次提出,他定义结构域为可以自动折叠的稳定的蛋白质结构单位。过去,结构域被描述为,折叠单位,致密结构单位,功能和进化单位。每个定义都是有效的并且经常重叠。紧密结构单位结构域在很多不同的蛋白质中被发现,它在结构环境内容易独立折叠。自然界经常把几个domains结合在一起形成多结构域和多功能蛋白质。在一个多结构域蛋白质中,每一个结构域可以独立行使它自己的功能,或者和它的临近蛋白协调一致的方式行驶。Domains既可以作为模块构建大的复合体像病毒颗粒或肌纤维,也可以提供特定的催化或结合位点,这些都在酶或调节蛋白中被发现。

Solenoid-domain-examples.png

Motif和domain的区别

完全不同的两个概念,但有时还有联系。

Motif:在生物学中是一个基于数据的数学统计模型,典型的是一段sequence也可以是一个结构,是特定的group的序列预测,例如一个DNA sequence可以定义为转录因子结合位点,也就是序列倾向于被这种factor结合。对蛋白质来说,sequence motifs可以被定义为蛋白质(蛋白质序列)属于一个给定的蛋白质家族。一个简单的motif可以是,例如,一个模式pattern,而这个模式被这个group中的所有成员共享。例如WTRXEKXXY(这里,X代表任何氨基酸)。当然也有更复杂的motif模型。Motif有时和特定的功能联系一起。

moti.png

protien motif.jpg

the DNA-binding helix-turn-helix motif of the CAP family.png

Protein domains:是一种结构实体,通常代表蛋白质结构中独立折叠和行驶功能的一部分。因此,蛋白质经常是这些结构域的不同的组合构建起来的。

那,motif和domains之间有什么联系?当你考虑蛋白质家族的时候,不仅要看整个序列,还有关注单独结构域。因为,它们是一个基本的功能结构单位,因此找到单个结构域domain的序列motif是很有意义的。因此,你经常会发现一个蛋白质包含多个结构域,每个结构域都有一个与它所属的家族motif匹配的序列。

motif to domain.jpg

domians and motif.jpg

最主要的区别是,domain是独立的稳定的,motif不是。

参考:2008.2:Disease candidate gene identification and prioritization using protein interaction networks

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018.08.11 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Nat. Commun. | 蛋白序列建模新方式?贝叶斯流模型生成蛋白优于自回归与离散扩散模型
今天为大家介绍的是来自英国InstaDeep公司的一篇论文。探索广阔且大部分尚未被探索的氨基酸序列领域对于理解复杂蛋白质功能和设计新型治疗蛋白质至关重要。虽然生成式机器学习已经推进了蛋白质序列建模,但现有方法在无条件和条件生成方面都不够精通。在本研究中,作者提出贝叶斯流网络(BFNs)——一个最近引入的生成建模框架,可以解决这些挑战。作者提出了ProtBFN,一个在UniProtKB蛋白质序列数据上训练的6.5亿参数模型,它能生成类自然、多样、结构连贯且新颖的蛋白质序列,明显优于领先的自回归和离散扩散模型。此外,作者在来自观测抗体空间的重链上微调ProtBFN,得到了一个特定于抗体的模型AbBFN,用于评估零样本条件生成能力。研究发现,当应用于预测单个框架或互补决定区域时,AbBFN与特定于抗体的BERT风格模型相比具有竞争力或更优。
DrugAI
2025/05/08
890
Nat. Commun. | 蛋白序列建模新方式?贝叶斯流模型生成蛋白优于自回归与离散扩散模型
6️⃣蛋白质序列的功能信息分析1:基于蛋白质基序motif
蛋白质具有多种生物学功能,具体可参照《生物化学》。蛋白质若发挥生物学功能,须以空间结构形式。而蛋白质多肽链一旦合成,即可在其他物质协助下,自然折叠,形成一定的空间构象。
Y大宽
2019/03/05
5.2K0
Science | 通过结构域分类探究蛋白质宇宙的结构多样性
AlphaFold系列结构预测算法的出现极大地拓展了已知的蛋白质结构空间,其中AlphaFold2算法为超过2.14亿条蛋白序列提供了预测结构,构成了庞大的AlphaFold蛋白结构数据库(AFDB)。AFDB的数据规模对传统的结构域发现工具带来了挑战。近日,伦敦大学学院(UCL)的David T. Jones课题组运用深度学习方法,对AlphaFold蛋白结构数据库中的结构数据进行结构域检测和划分,构建了“结构域百科全书(The Encyclopedia of Domains,TED)。他们共检测到3.65亿个结构域,比基于序列的方法多检测出1亿个,其中77% 的非冗余结构域与已知超家族相似,极大地扩展了结构域空间的代表性。此外,他们还发现了超过 1 万个新的超家族间结构相互作用和上千个新折叠。
DrugAI
2024/11/23
2200
Science | 通过结构域分类探究蛋白质宇宙的结构多样性
Pfam:蛋白质家族数据库简介
在蛋白质分子中,包含多个结构特异并且功能区里的区域,这些区域称之为domain, domain 可以看做蛋白质功能的基本单位,蛋白质的功能由包含的多个domain共同决定。研究domain, 可以更好的研究蛋白质功能。
生信修炼手册
2020/05/08
6.5K0
Pfam:蛋白质家族数据库简介
6️⃣蛋白质序列的功能信息分析2:基于蛋白质结构域domain和功能位点分析
结构域domain比较抽象,属于蛋白质构象中二级结构和三级结构之间的一个层次,一般每个结构域有100-300个氨基酸残基组成,有特定的空间构象,并有不同的生物功能。
Y大宽
2019/03/04
2.8K0
6️⃣蛋白质序列的功能信息分析2:基于蛋白质结构域domain和功能位点分析
上海瑞金医院方海团队自主开发dcGO——蛋白结构域语义注解在线数据库
随着AI工具AlphaFold2的问世,已解析了约2亿个蛋白质的结构,几乎覆盖了地球上已知的蛋白质。现如今,蛋白结构解析已变得可行,但大多数可用的蛋白序列缺乏相应的生物学注解。相比于全长的蛋白,其结构域在语义注解方面所受关注却较少。
生信技能树
2023/09/04
3220
上海瑞金医院方海团队自主开发dcGO——蛋白结构域语义注解在线数据库
查询蛋白结构域
蛋白质三级结构的基本结构单位是结构域。一个蛋白质可以只包含一个结构域也可以由 几个结构域组成,故结构域是能够独立折叠为稳定的三级结构的多肽链的一部分或全部。结构域也是功能单位,通常多结构域蛋白质中不同的结构域是与不同的功能相关联的。许多已知的例子表明,某个种属的多个独立的多肽链完成的几种生物学功能可以由另一个种属的一个蛋白质中的不同结构域来完成。例如,脂肪酸的合成需要七种不同的催化反应,在植物的叶绿体中,这些反应由七种不同的酶所催化,而在哺乳动物中,这些反应则由一条多肽链的七个结构域来完成。
用户1359560
2020/06/05
1.9K0
查询蛋白结构域
cytoscape十大插件之九 - 转录调控王者 iRegulon
结果主要分三个部分:Motifs,Tracks,Transcription Factors
生信技能树
2021/07/29
6.1K0
hypothetical protein假设蛋白
在生物学中,hypothetical protein是这样一种蛋白,其存在已经被预测,但是缺乏体内表达的实验证据。基因组测序预测了众多的开放阅读框(open reading frame)但其功能仍然未知。这些蛋白质,无论是孤儿还是保守的假设蛋白质,占每个新测序基因组中编码的蛋白质的约20%至40%。虽然像微阵列或质谱这样的技术可以确定gene是表达的,但是因为其与具有注释生化功能的蛋白质序列缺乏同一性,因此难以赋予其功能。
Y大宽
2018/09/30
3.4K0
4️⃣ 核酸(蛋白)序列特征分析(5):序列motif的查找和可视化工具
模体Motif,指DNA或蛋白质序列中局部的保守区域,或者是一组序列中共有的一小段序列模式。这些motif很可能具有分子功能,结构性质或家族成员相关的任何序列模式。
Y大宽
2019/02/26
2.7K0
TBtools基因家族分析详细教程(1)
一共分为4个部分 TBtools基因家族分析详细教程(1) TBtools基因家族分析详细教程(2)基因家族成员的基本分析 TBtools基因家族分析详细教程(3)基因家族成员的进化分析1 TBtools基因家族分析详细教程(3)基因家族成员的进化分析2
Y大宽
2018/10/08
32.8K1
TBtools基因家族分析详细教程(1)
一文读懂相分离(图文详解)
相分离 (phase separation) 本身是一个物理化学概念,二元或多元混合物会在一定的条件下分离为不同的相。
白墨石
2022/11/12
4.7K0
一文读懂相分离(图文详解)
引起相变的无序结构域(IDRs)怎么预测?跟踪热点,提升文章档次!
蛋白研究过程中,一般认为氨基酸的序列决定了蛋白的结构,结构决定功能(一般指蛋白的三维结构)。然而,近50年的研究中,有一种没有特定三维结构的蛋白不断被研究人员发现,由于这类蛋白无法折叠成稳定的三维结构而称为固有无序蛋白(intrinsically disordered regions,IDRs)。这类蛋白虽然缺乏稳定结构且高度可变,但是研究却发现他们在生物体内行驶着重要的生物学功能。
生信宝典
2018/09/21
2.9K0
引起相变的无序结构域(IDRs)怎么预测?跟踪热点,提升文章档次!
关于motif你需要知道的事
在chip_seq数据分析中,motif分析是一项重要的分析内容。通过motif分析,我们可以对转录因子结合位点的序列模式有进一步的了解,那么什么是motif呢?
生信修炼手册
2019/12/19
4.8K1
关于motif你需要知道的事
Nat Commun|PLMSearch:蛋白质语言模型支持精确快速的远程同源序列搜索
2024年3月30日,山东大学数学与交叉科学研究中心杨建益教授、复旦大学类脑智能科学与技术研究院朱山风研究员等人在Nature Communications上发表研究PLMSearch:Protein language model powers accurate and fast sequence search for remote homology。
智药邦
2024/04/03
4150
Nat Commun|PLMSearch:蛋白质语言模型支持精确快速的远程同源序列搜索
单细胞个性化分析之转录因子篇
转录因子(Transcription Factors,TFs),是指能够以特定序列与基因专一性结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子。转录因子通过识别特定的DNA序列来控制染色质和转录,以形成指导基因组表达的复杂系统。许多转录因子充当着主调节因子和选择基因的角色,控制着细胞类型的决定、发育模式和特定途径控制(如免疫反应)的过程。
追风少年i
2023/03/06
2K0
单细胞个性化分析之转录因子篇
深度学习驱动的蛋白质设计--从蛋白质结构到药物候选物的全方位
在生物信息学、合成生物学、药物研发、生物材料制备等领域,深度学习技术的革新正在重塑蛋白质设计工具的边界,使其从单纯的结构预测跃升至具有创造性的设计层面。
Tom2Code
2024/05/09
9560
深度学习驱动的蛋白质设计--从蛋白质结构到药物候选物的全方位
ToppGene Suite中文使用指南
2007.12:Improved human disease candidate gene prioritization using mouse phenotype 2008.2:Disease candidate gene identification and prioritization using protein interaction networks 2009.9:ToppGene Suite for gene list enrichment analysis and candidate gene prioritization 2010.2:ToppCluster: a multiple gene list feature analyzer for comparative enrichment clustering and network-based dissection of biological systems
Y大宽
2018/09/10
3.5K0
ToppGene Suite中文使用指南
Google Research进军蛋白质结构预测:为Pfam数据库新增680万标注数据
---- 新智元报道   编辑:LRS 【新智元导读】用深度学习模型来预测蛋白质的结构和功能已经取得了不小的进展,但还缺乏优质的数据。最近Google开源了一个模型ProtENN,提供了680万条蛋白质结构数据Pfam-E,约等于之前十年的工作量。 蛋白质是所有生物体中的重要分子,在我们身体的结构和功能中都发挥着核心作用。并且从药物到洗衣粉等日常生活用品中,蛋白质也无处不在。 虽然每个蛋白质都是由氨基酸构成的链,但不同的氨基酸序列导致了不同的蛋白质结构,也导致了不同蛋白质具有不同的功能。 了解蛋白质的
新智元
2022/03/09
6890
一文极速读懂UniProt数据库
Uniprot (Universal Protein )是包含蛋白质序列,功能信息,研究论文索引的蛋白质数据库,整合了包括EBI( European Bioinformatics Institute),SIB(the Swiss Institute of Bioinformatics),PIR(Protein Information Resource)三大数据库的资源。
白墨石
2021/01/13
3K0
一文极速读懂UniProt数据库
推荐阅读
相关推荐
Nat. Commun. | 蛋白序列建模新方式?贝叶斯流模型生成蛋白优于自回归与离散扩散模型
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档