首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >如何从遗传力的角度来看待提升育种效率

如何从遗传力的角度来看待提升育种效率

作者头像
邓飞
发布2025-11-19 16:18:32
发布2025-11-19 16:18:32
560
举报

家好,我是邓飞。最近翻遗传力相关的资料时突然想到:咱们研究任何概念,最终都是为了 “用起来”。那遗传力这东西,到底怎么帮咱们提升育种效率?

其实咱们常说的 “提升育种效率”,背后藏着不同的策略 —— 而这些策略,全和 “遗传力的类型” 挂钩:比如用 MAS 找大效应位点,靠的是h²_GWAS;用 GBLUP 做全基因组选择,靠的是h²_SNP;甚至现在比较火的泛基因组、多组学 GS,本质也是为了 “找全遗传力”。

今天就从 “消失的遗传力” 这个角度,跟大家掰扯清楚:怎么把 “丢了的遗传力” 找回来,让育种选择更准、更快。

1,先看张 Nature 图:遗传力为啥会 “消失”?

https://www.nature.com/news/2008/081105/pdf/456018a.pdf

咱们可以把 “找消失的遗传力” 比作悬疑片:

  • 消失的遗传力 = 悬疑片里 “消失的子弹”;
  • 科学家就是侦探,手里的工具是生物统计、基因测序、数量遗传;
  • 目标只有一个:搞清楚 “遗传力到底丢在哪了”。

所以,育种中的数据分析师的形象是这样的:

要是能找到 “消失的遗传力”,报酬可不是小数 —— 育种里的选择准确性、选择响应会直接提升,相当于给育种装上 “加速器”!

2,举个身高的例子:啥是 “丢失的遗传力”?

先通俗解释下核心概念:“遗传力丢失”(Missing heritability)是数量遗传学里的经典问题 —— 简单说就是:实际的遗传力(比如家系里测出来的),比 GWAS 找的显著 SNP、芯片 SNP 能解释的遗传力,要大得多

给大家举个直观的例子:比如人类身高的 “总遗传力”(家系里测的,h²_family)大概是 0.8(意思是 80% 的身高差异由遗传决定)。但 GWAS 分析后,那些 “显著相关的 SNP” 只能解释 35% 的变异(对应h²_GWAS=0.35)—— 这就丢了 45% 的遗传力;后来用基因组选择(GBLUP),拿芯片全 SNP 算,能解释 64% 的变异(对应h²_SNP=0.64)—— 但还是丢了 16%。

这 “丢了的部分”,就是咱们要找的 “消失的遗传力”。

3,再拆细点:消失的遗传力,其实分两种

参考:

Witte JS, Visscher PM, Wray NR. The contribution of genetic variants to disease depends on the ruler. Nat Rev Genet. 2014 Nov;15(11):765-76. doi: 10.1038/nrg3786. Epub 2014 Sep 16. PMID: 25223781; PMCID: PMC4412738.

遗传力细分:

  • Total heritability,是实际的遗传力,主要是从家系群体(比如同卵双胞胎、全同胞)估计的遗传力,对应的是family遗传力, h2_family
  • Chip heritability,(SNP 遗传力,也称为 “基于芯片的遗传力”)是指全基因组关联分析(GWAS)芯片上所有 SNP 变异共同解释的表型方差比例,反映 “芯片可检测的遗传变异” 对表型的加性遗传贡献(属于狭义遗传力范畴)。其核心计算方法是基于基因组关系矩阵(GRM)的约束最大似然(GREML)方差组分估计是通过REML估计的遗传力,使用的是全部SNP数据,比如GCTA、asreml中的GBLUP,估计的遗传力都属于此,对应的是SNP遗传力. h2_snp
  • Heritability due to known variants,是GWAS分析中显著的SNP估计的遗传力,对应的是PVE(解释百分比),对应的是GWAS遗传力,h2_gwas

一般我们认为消失的遗传力为:

h^2_{family} - h^2_{GWAS}

但是它还可以进一步剖分为两部分:

  • 第一部分:Still-missing heritability,是依旧消失的遗传力,它的计算公式是,它的来源是GWAS无法捕捉到的变异,比如CNV,SV等,以通过增加变异来源(CNV,SV,PVA),稀有变异来解决,(泛基因组的应用)。
  • 第二部分:Hiding heritability,是隐藏的遗传力,它的计算公式是,它主要是由于目前的统计方法导致一些效应小的位点没有检测出来(假阴性),可以通过增加样本量来降低这部分的值。

4, 关键问题:怎么用这两类 “消失的遗传力” 提升育种效率?

育种里有个核心逻辑:遗传力的 “可利用程度”,直接决定选择策略。先给大家划个基础准则:

  • 高遗传力(比如百粒重,=0.95):不用分子标记、不用 GS,直接表型选择就行 —— 这就是 “老子英雄儿好汉”,表型准得很;
  • 中高遗传力:靠家系 / 系谱选择(ABLUP),比如用半同胞、全同胞的表型辅助判断;
  • 中低遗传力:靠 MAS(MA-BLUP),找几个大效应位点辅助;
  • 低遗传力:必须靠 GS(GBLUP、ssGBLUP),用全基因组信息堆准确性。

而 “找回来消失的遗传力”,本质是把 “不可利用的遗传力” 变成 “可利用的”—— 这样选择准确性会提升,选择效率自然就高了。

具体怎么做?对应前面两类 “消失的遗传力”,有两个核心方向:

方向一:降低 “依旧消失的遗传力”—— 找更多变异

比如用泛基因组、图泛基因组,把之前芯片没覆盖的 SV、CNV、稀有变异都挖掘出来。

  • 用在 MAS 上:能找到更准的 “因果位点”,辅助选择更有效;
  • 用在 GS 上:把这些新变异加进 GRM(基因组关系矩阵),GBLUP 的估计准确性会更高。

方向二:降低 “隐藏的遗传力”—— 堆更多数据

比如 GS 里扩大参考群的数量(从 1000 份扩到 5000 份),GWAS 里增加样本量(从 2000 个加到 1 万个)。数据量上去了,统计方法能 “抓” 到更多小效应位点,假阴性减少,h²_GWAS会更接近h²_SNP—— 选择时能用到的遗传信息就更多了。

最后说句实在话

《三体》里说 “锁死科技”,靠的是卡住微观物理的进展;而育种里 “提升效率”,靠的就是把 “消失的遗传力” 一步步找回来 —— 先拆清楚 “丢在哪”,再针对性解决(找变异、堆数据),这才是科学的思路。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-10-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 育种数据分析之放飞自我 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1,先看张 Nature 图:遗传力为啥会 “消失”?
  • 2,举个身高的例子:啥是 “丢失的遗传力”?
  • 3,再拆细点:消失的遗传力,其实分两种
  • 4, 关键问题:怎么用这两类 “消失的遗传力” 提升育种效率?
  • 方向一:降低 “依旧消失的遗传力”—— 找更多变异
  • 方向二:降低 “隐藏的遗传力”—— 堆更多数据
  • 最后说句实在话
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档