基因组所开发完成犬类SNP数据库—DoGSD
家犬作为人类生活和工作中的伙伴,其进化研究一直是遗传学领域中的热点之一。然而目前使用的家犬参考SNP数据集,不仅数量少,采样地不够广泛,而且测序覆盖度差异大,SNP数据主要只来源于两个品种的两个犬只,并不利于家犬的群体遗传研究。
目前,二代测序产生了大量高质量的家犬和其祖先物种灰狼的全基因数据。为了弥补参考SNP数据集的不足及满足大数据复用的需求,中国科学院北京基因组研究所赵文明课题组和中国科学院昆明动物所张亚平实验室的工作人员共同建立了第一个犬类SNP数据库—DoGSD (the Dog and wolf Genome SNP Databae),该成果于2014年11月在国际生物信息学领域期刊Nucleic Acids Research在线发表。
DogGSD包含了参考SNP数据集,69个家犬及8个灰狼的全基因组SNP数据,所包含的SNP数量是原参考数据集的7倍,弥补了原数据集采样地少,覆盖度差异大的问题,并且第一次在SNP数据集加入了中国土狗的数据。DoGSD为用户提供了友好的检索、查询及下载页面,其中的同义/非同义SNP检索页面,比较查询功能将为用户检索基因相关SNP及观察个体间SNP的差异提供很大的方便。此外,DoGSD第一次在数据库中提供了重要的群体遗传学参数的计算结果:Fst和等位基因频率,方便用户筛选和进一步分析有选择信号的SNP。
该项研究得到了中国科学院、科技部的资助,也得到了中国科学院北京基因组研究所高性能计算平台和大数据存储平台的大力支持。
数据库页面
附件下载: