vcf 转为 ped/map
vcftools --vcf snp.vcf --plink --out snp
plink --vcf snp.vcf --recode --out snp ped和map文件是Plink的基本格式。
ped文件包含以下几列:
第一列:Family ID。
第二列:Individual ID。自然群体这列和Family ID是一样的。
第三列:Paternal ID。未提供信息的话这列为0。
第四列:Maternal ID。未提供信息的话这列为0。
第五列:Sex。未提供信息的话这列为0。
第六列:Phenotype。一般来说,直接拿vcf转换的话这列为-9,也就是缺失。
第七列开始就是个体在每个标记位点的基因型。
map文件包含以下几列:
第一列:染色体编号。
第二列:SNP编号。
第三列:遗传距离。未提供信息的话这列为0。
第四列:物理位置。
ped/map 与 tped/tfam 格式互换
plink --file snp --recode --transpose --out snp_test
plink --tfile snp_test --recode --out snp ped/map 与 bed/bim/fam互换
plink --file snp --make-bed --out snp_test
plink --bfile snp_test --recode --out snp tped/tfam 与 bed/bim/fam互换
plink --tfile snp --make-bed --out snp_test
plink --bfile snp_test --recode --transpose --out snp bed/bim/fam 转为 vcf
plink --bfile snp --export vcf --out snp_test 常用的Plink格式转换就是这些,大家可以根据自己实际需要相互转换。
因为PLINK默认的设置是人的染色体, 所以动物中,我们应该设置 --chr-set 19 # 猪 已有的选择: --cow --dog --horse --mouse --rice --sheep
本文系转载,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文系转载,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。