dbNSFP,用于对人类基因组中所有潜在的非同义单核苷酸变异 (nsSNV) 进行功能注释和预测,前者提供与其潜在功能间接相关的突变的定性或描述性注释,例如突变是否为非同义SNV;后者通常基于统计模型提供突变的直接定量或是或否有害性预测。目前该数据库更新到了 v4 版本(每更新一个版本就发一篇文章),共包括了 84,013,490 个 nsSNV 和 ssSNV。主要使用 38 种预测算法来对突变位点进行功能预测 和 9 种保护打分算法:



该数据库提供了一个网页界面给用户访问:http://database.liulab.science/dbNSFP。不过区别于学术版和商业版,前者注释更为全面。


如果是小规模的数据,可以使用 web 服务进行突变的注释,只需要输入突变位点所在的基因组坐标(染色体、位置、参考和替代碱基),支持单个位点、多个位点或者上传 vcf 文件进行注释。


如果是大规模的数据,则需要下载数据库文件进行注释,在 https://sites.google.com/site/jpopgen/dbNSFP 提供了多种下载方式 ftp、Google drive and Box,注释文件分学术版(v4.2a)和商业版(v4.2c),有 30G 左右,国内用户访问或下载较为困难。该链接还说明了不同更新版本的修改内容(即历史更新)。 也可以不下载该数据库,因为很多注释工具也会将该数据库的部分内容注释上,如 variant tools, ANNOVAR, KGGSeq, VarSome, UCSC Genome Browser's Variant Annotation Integrator, Ensembl Variant Effect Predictor, SnpSift and HGMD。