http://nce.ads.uga.edu/wiki/lib/exe/fetch.php?media=singlestepblupf90.pdf
传统ABLUP与SSGBLUP的区别在于,原来的A逆矩阵变为了H逆矩阵
根据系谱计算A矩阵,然后使用Henderson方程组计算BLUP(EBV值)
主要作用:
G矩阵中,某些个体对角线有较高的值, 有可能这个个体不是群体内的个体, 可能来源其它群体或者家系, 或者call rate值较低.
如果某两个个体的亲缘关系大于0.9, 则表明这两个个体可能是重复样本
G矩阵和A22矩阵是相同个体构建的G矩阵和A矩阵, 他们应该是由很高的相似性. 如果对角线和非对角线相似度较低, 表明是有一些问题的. 需要引起重视, 可能是测序个体ID错误, 可能是数据量较少等等
可以看出, 构建A22矩阵时, 使用57000系谱数据, 6500测序个体, Tabular用了311s, 内存占用12G, 而Colleau method用了45s, 内存占用322Mb. 使用Colleau方法更合适
如果想要使用DMU, ASREML或者WOMBAT利用blupf90构建好的H逆矩阵, 需要输出Original ID的形式. 然后转化为DMU和ASREML的格式即可.
基因组选择:
育种数据分析中,表型选择,方差分析,混合线性模型的BLUP育种值是学科的枝干,MAS,GWAS是花苞, GS则是盛开的花朵,其依赖于常规的数量遗传理论,但青出于蓝而胜于蓝,具有光明的前景,由于GS的应用,分子育种的落地又大大提前了一步。现在GS在动物育种中,特别是牛,猪,鸡,羊中正在大规模落地,以后再玉米,水稻,小麦,大豆的应用也将落地。冬天来了,春天还会远么? 这个章节有文献解析,SNP数据清洗,G矩阵及H矩阵构建,模拟数据,软件使用,理论介绍等等。