分析植物适应环境变化和胁迫反应的分子机制对植物生物技术至关重要。其中关键方法包括生物信息学方法、高通量测序和后基因组技术。测序和系统生物学方法提供了从分子到细胞、器官和种群水平的植物生长的全面视图。基因组学和生物信息学促进了植物细胞中蛋白质-蛋白质和基因调控相互作用的建模,为更好的作物生产和可持续性提供了基础。同时,植物-病原体相互作用研究补充了这一领域的网络建模。
本篇主要参考了2022和2023年两篇特刊(https://www.mdpi.com/journal/ijms/special_issues/PlantBi_Biology;https://www.mdpi.com/journal/ijms/special_issues/Plant_Biotechnology),总结了包含MDPI的国际分子科学杂志上题为“基因调控和结构的生物信息学”的一系列关于生物信息学、基因表达调控和测序分析的研究课题(https://www.mdpi.com/journal/ijms/special_issues/Bioinformatics_Genomics),及在俄罗斯-bgrs举行的一系列生物信息学会议之后发表的相关期刊(https://bgrssb.icgbio.ru/2022/)和关于基因表达生物信息学的一系列最新杂志期刊(https://www.mdpi.com/journal/ijms/special_issues/0LGA6103S5;https://www.mdpi.com/journal/life/special_issues/computational_genomics_life;https://www.frontiersin.org/research-topics/54136/applications-of-artificial-intelligence-machine-learning-and-deep-learning-in-plant-breeding),Journal of Integrative Bioinformatics,以及关于植物遗传学、基因组学、生物信息学和生物技术的PlantGen2023会议(https://plantgen2023.ofr:su/)的相关研究。
基于总结概述当前植物生物信息学面向转录组测序数据分析和机器学习方法应用的趋势。利用新的生物信息学工具,集中研究了植物基因表达调控以及植物发育和胁迫反应的潜在分子机制。通过八个研究阐述其生物信息学解决方案或基因组应用于给定的植物模型,本篇阐述其中前4篇。
Yan等人对DNA结合调控基因表达的分子机制进行研究(https://doi.org/10.3390/ijms24044078)分析了大麻sativa L.在冷处理下二酰基甘油酰基转移酶(DGAT)家族成员的基因表达,该家族在催化植物三酰基甘油生物合成中起关键作用。大麻二酰基甘油酰基转移酶基因在冷胁迫下表达上调。
CsDGAT基因家族系统发育分析
对大麻的基因组分析发现了 10 个候选 DGAT 基因,根据不同异构体的特征将其分为四个家族(DGAT1、DGAT2、DGAT3、WS/DGAT)。为了帮助提高大麻籽油的产量和质量,分析了四类不同同工型的基因组结构,并与其他植物物种的基因组结构进行了比较。对与这些 CsDGAT 相关的基因结构、保守结构域、跨膜结构域、染色体定位和共线性、系统发育关联、亚细胞定位和顺式作用元件进行了表征。利用 qPCR 和转录组学方法评估了已鉴定的 CsDGATs 在不同组织中的表达情况以及对冷胁迫条件的响应。
家族成员染色体分布和共线性分析
研究发现,CsDGAT家族成员与大量顺式作用启动子元件有关,包括植物响应元件、植物激素响应元件、光响应元件和胁迫响应元件,这表明这些基因在发育、环境适应和非生物胁迫响应等关键过程中发挥作用。通过对这些基因在不同组织和品种中的表达谱分析,发现 CsDGAT 表达动态的空间模式各不相同,而且不同品种的 CsDGAT 表达也存在差异,这表明该基因家族的成员可能发挥着不同的功能调控作用。为了解 CsDGAT 基因家族的进化和这些基因的特性提供了新的视角,从而为进一步研究它们在 C. sativa 生长发育过程中的生物学功能、改善大麻籽油成分奠定基础。
蛋白结构及保守域分析
Serafima Novikova等人(https://doi.org/10.3390/ijms24054530)研究了林木对高海拔的遗 传适应,以西伯利亚落叶松(Larix sibirica Ledeb.)为研究对象,以其他关于森林树木长寿的遗传和表观遗传机制研究为基础。在参与大分子细胞代谢和有机生物合成过程以及生物体应激反应的基因中,发现了与西伯利亚落叶松适应性相关的单核苷酸多态性。
主成分分析环境因素
研究利用全基因组基因分型和景观基因组学方法识别西伯利亚落叶松种群局部适应的迹象。研究了西伯利亚落叶松种群与对海拔梯度气候条件的适应相关的遗传分化,基于对六个生物气候变量和双重酶切位点关联DNA测序(ddRADseq)数据的联合分析。分析了西伯利亚落叶松种群结构、遗传多样性和对阿尔泰-萨彦山系统内的生长条件的遗传适应特征。
四种方法寻找显著异常SNPs
研究首次展示了西伯利亚落叶松种群的遗传分化研究结果,这些分化与对气候条件海拔梯度的适应有关,基于对海拔和六个其他生物气候变量的联合分析,以及从双重酶切位点关联DNA测序(ddRADseq)获得的大量遗传标记,即单核苷酸多态性(SNP)。总共在231棵树中基因分型了25143个SNP。此外,通过选择位于西伯利亚落叶松基因组编码区外的SNP并映射到不同的片段上,组装了761个假定为选择性中性的SNP数据集。使用四种不同的方法(PCAdapt、LFMM、BayeScEnv和RDA)分析,发现了550个异常SNP,包括207个SNP的变异与某些环境因子的变异显著相关,并可能与局部适应有关,其中67个SNP与海拔相关(基于LFMM或BayeScEnv),23个SNP基于这两者。
基于所有SNPs分析基因和地理距离之间关系
20个SNP位于基因的编码区,其中16个代表非同义核苷酸置换。它们位于涉及大分子细胞代谢和有机物合成的基因中,这些过程与繁殖和发育有关,以及对压力的有机体反应。在这20个SNP中,9个可能与海拔有关,但只有一个被所有四种方法确定为与海拔相关的,即在scaffold_31130第28092位点的非同义SNP,一个编码功能不确定的细胞膜蛋白的基因。在研究的种群中,根据三种SNP数据集(761个假定为选择性中性的SNP、所有25143个SNP和550个适应性SNP)的任何一种,至少两个主要群体(簇),阿尔泰种群和所有其他种群在遗传上显著不同。
对显著不同的SNPs进行GO注释
Yuexia Wang等人(https://doi.org/10.3390/ijms24065226)利用转基因拟南芥模型研究了小 麦的干旱胁迫响应。Psb28是光系统II复合体中的可溶性蛋白,由于其上调最有可能与减轻植物叶绿体超微结构损伤和光合作用有关,因此被早期定义为最重要的胁迫应基因之一。
植物Psb28家族多序列比对
研究对 TaPsb28 基因进行了功能性鉴定,发现它正向调控小麦的耐旱性。当全长 546 bp 的 TaPsb28 cDNA 被转入拟南芥 (Arabidopsis thaliana) 后,定位于守卫细胞叶绿体周围的基质中。TaPsb28 的过表达赋予了植物耐旱性,表现为存活率的提高。转基因植物通过诱导叶绿素合酶 (ChlG) 基因的转录,维持了较低的丙二醛 (MDA) 含量和较高的叶绿素含量。在干旱胁迫下,野生型 (WT) 植物中脱落酸 (ABA) 和玉米素 (zeatin) 的含量显著增加,RD22、二氢黄酮醇 4-还原酶 (DFR) 和花青素还原酶 (ANR) 基因的转录表达水平被诱导,从而增强了内源性矢车菊素、翠雀素和原花青素的含量。然而,在转基因植物中,尽管花青素进一步聚集,ABA 的增加被抑制,玉米素在干旱胁迫下恢复到对照水平,并促进了气孔闭合。
植物Psb28家族系统发生树
这些发现表明,在 TaPsb28 介导的耐旱过程中,ABA 和玉米素具有相反的协同作用,只有在玉米素的作用被缓解后,ABA 才能更好地发挥其促进花青素积累和气孔闭合的作用,从而增强转基因植物的耐旱性。
OE-TaPsb28在拟南芥中亚细胞定位
研究结果表明,TaPsb28 的过表达通过影响内源性激素的功能代谢在干旱响应中发挥了积极作用。为进一步深入研究 TaPsb28 在小麦耐旱性中的功能,尤其是其与花青素积累的关系奠定了基础。
干旱处理下拟南芥幼苗TaPsb28过表达的表型效应
Wen Duan等人(https://doi.org/10.3390/ijms24087189)分析了水稻(Oryza属)DIR基因家族成员的表达模式。Dirigent (DIR) 成员在植物的生长、发育和适应环境变化中起着重要作用。越来越多的证据表明,许多 DIR 基因的表达受到各种非生物刺激的强烈影响。仍需探索野生稻中某些对产量、抗逆性和抗感染性有贡献的基因或等位基因。稻属中 DIR 成员的全基因组分析对于获取有益的 DIR 基因并改善作物育种具有重要意义。RNA测序和PCR分析证实了这些基因对矿质元素供应不足、重金属过量和植物侵染的响应性。
9种水稻DIR蛋白的系统发育分析
研究分析了两种栽培稻和七种野生稻中 DIR 基因家族的系统发育关系、染色体定位、重复事件和选择力。然后分析了 DIR 基因对矿物元素不足、重金属过量和稻瘟病菌感染的响应模式。此外,通过酵母双杂交系统证实了许多 DIR 蛋白的相互作用。
基因选择压力和分化时间分析
研究从九个稻种中鉴定了 420 个具有保守 DIR 结构域的基因。栽培稻种 Oryza sativa 比野生稻种拥有更多的 DIR 家族成员。基于系统发育分析,稻属中的 DIR 蛋白可以分为六个亚家族。
基于 RNA-seq 数据的 OsjDIR 基因在根、旗叶、茎和花中的表达模式
基因重复事件分析表明,全基因组/片段重复和串联重复是Oryza中 DIR 基因进化的主要驱动力,而串联重复是DIR-b/d和DIR-c亚家族基因家族扩展的主要机制。RNA测序数据分析表明,OsjDIR基因对多种环境因素有响应,大多数OsjDIR基因在根部具有较高的表达水平。定量逆转录PCR实验证实了 OsjDIR基因对矿物元素不足、重金属过量和稻瘟病菌感染的响应。此外,DIR 家族成员之间存在广泛的相互作用。
OsjDIR基因在缺乏营养元素和高CdCl2胁迫下的表达模式
研究结果为进一步探索水稻中的 DIR 基因提供了研究基础。
酵母双杂交实验鉴定OsjDIR蛋白之间的相互作用
以上研究对于植物生物信息学的新研究具有启发性,通过测序分析方法研究多种植物物种,来探索基因表达调控,机器学习模型和人工智能应用在植物科学中呈现出新的趋势。
Orlov, Y. L., & Chen, M. (2023). Special Issue on "Plant Biology and Biotechnology: Focus on Genomics and Bioinformatics 2.0". International journal of molecular sciences, 24(24), 17588. https://doi.org/10.3390/ijms242417588
Yan, B.; Chang, C.; Gu, Y.; Zheng, N.; Fang, Y.; Zhang, M.; Wang, G.; Zhang, L. Genome-Wide Identification, Classification, and Expression Analyses of the CsDGAT Gene Family in Cannabis sativa L. and Their Response to Cold Treatment. Int. J. Mol. Sci. 2023, 24, 4078. https://doi.org/10.3390/ijms24044078.
Novikova, S.; Sharov, V.; Oreshkova, N.; Simonov, E.; Krutovsky, K. Genetic Adaptation of Siberian Larch (Larix sibirica Ledeb.) to High Altitudes. Int. J. Mol. Sci. 2023, 24, 4530; https://doi.org/10.3390/ijms24054530.
Wang, Y.; Zhang, M.; Li, X.; Zhou, R.; Xue, X.; Zhang, J.; Liu, N.; Xue, R.; Qi, X. Overexpression of the Wheat TaPsb28 Gene Enhances Drought Tolerance in Transgenic Arabidopsis. Int. J. Mol. Sci. 2023, 24, 5226; https://doi.org/10.3390/ijms24065226.
Duan, W.; Xue, B.; He, Y.; Liao, S.; Li, X.; Li, X.; Liang, Y. Genome-Wide Identification and Expression Pattern Analysis of Dirigent Members in the Genus Oryza. Int. J. Mol. Sci. 2023, 24, 7189. https://doi.org/10.3390/ijms24087189.