不同筛选方法的低密度SNP集合填充准确性比较

文献类型: 中文期刊

第一作者: 林雨浓

作者: 林雨浓;王泽昭;陈燕;朱波;高雪;张路培;高会江;徐凌洋;蔡文涛;李英豪;李俊雅;高树新

作者机构:

关键词: 填充准确性;低密度SNP芯片;华西牛;连锁不平衡;最小等位基因频率

期刊名称: 中国农业科学

ISSN: 0578-1752

年卷期: 2023 年 008 期

页码: 1585-1593

收录情况: 北大核心 ; CSCD

摘要: 【目的】尝试通过在华西牛参考群高密度标记芯片位点中,使用两种标记筛选方法挑选具有代表性的且密度梯度不同的SNP位点集合,后利用基因组填充策略在相同填充参数下将低密度芯片数据填充至高密度继而进行后续基因组研究,从而达到降低华西牛基因型分型成本的目的。研究分别比较了不同标记集合填充准确性和填充一致性的差异,阐述了标记筛选方法、标记密度、最小等位基因频率和参考群体数量等4个因素对填充结果的影响,为华西牛低密度SNP填充芯片设计提供参考。【方法】将质控后剩余的1 233头华西牛群体随机分为参考群(986头)和验证群(247头)。使用等间距法(equidistance,EQ)和高MAF法(high MAF,HM)两种标记筛选方法分别从华西牛参考群体的Illumina Bovine HD芯片位点集合中筛选出16种不同密度的SNP集合,共生成32种不同SNP梯度密度集合。随后在验证群体中利用Beagle(v5.1)软件将各低密度集合填充至770 k密度水平,计算填充准确性和填充一致性并对填充性能影响因素进行分析。【结果】32种低密度SNP集合的标记数量在100—16 000之间,窗口最大为24 176 kb,最小151 kb。随着标记密度升高,EQ和HM两种筛选方法填充一致性和准确性不断提升,但填充准确性和填充一致性增加的幅度越来越小。当标记集合密度超过12 k后均趋于平稳。SNP密度在16 k时两种方法的填充准确性达到最高(r~2EQ=0.8801,r~2MAF=0.8696)。当标记密度低于11 k时,不同标记密度梯度下HM方法填充一致性均高于EQ方法。然而当SNP集合密度超过11 k时,EQ筛选方法较表现出填充优势。与填充一致性结果趋势相似,在SNP集合密度低于10 k时,HM方法仍然具有较高的填充准确性,但当SNP集合密度高于10 k时,EQ方法的填充准确性则较高,且在SNP密度集合大于12 k后,EQ填充准确性趋于稳定。同时研究发现与低MAF标记位点相比,高MAF位点的填充准确性更高。填充过程中发现,填充一致性和填充准确性随着参考群体增大而提高。当参考群体数量在600—800时,位点填充准确性和一致性较高。【结论】在华西牛群体中,填充一致性和填充准确性随标记密度递增而上升,在标记密度为10 k—12 k区间,可获得较好的填充效果。当标记密度小于10 k时优先选择HM方法,更高密度时EQ方法较好。高MAF标记位点填充准确性更高。采用填充策略进行低密度标记填充时,参考群体数量在400头以上时填充效果较为理想。

分类号: S823

  • 相关文献

[1]利用SNP标记估计西门塔尔牛亲缘关系系数的准确性. 张静静,高会江,吴洋,朱波,齐欣,高雪,张路培,陈燕. 2016

[2]基于DNA池测序法筛选奶牛高信息量SNP标记的可行性. 初芹,李东,侯诗宇,石万海,刘林,王雅春. 2014

[3]华西牛胴体及原始分割肉块重量性状遗传参数估计与全基因组关联分析. 李柯安宁,杜丽丽,安炳星,邓天宇,梁忙,曹晟,杜悦莹,徐凌洋,高雪,张路培,李俊雅,高会江. 2023

[4]育肥期华西牛蛋白质与能量需要量研究. 张莹,吴兆海,卜登攀. 2022

[5]华西牛与雪龙黑牛背最长肌重量的全基因组关联分析. 杜悦莹,安炳星,邓天宇,杜丽丽,梁忙,李柯安宁,曹晟,高会江,闵令江. 2024

[6]小麦taf1位点的连锁不平衡分析. 朱晓滨,窦秉德,侯北伟,徐海风,杨晋彬,刘福霞,顾正中. 2009

[7]单核苷酸多态性在作物遗传及改良中的应用. 杜春芳,刘惠民,李润植,李朋波,任志强. 2003

[8]小麦雌性育性与SSR分子标记的关联分析. 窦秉德,朱晓滨,张新玲,徐海明,侯北伟,徐海风,杨晋彬,高爱农. 2009

[9]绵羊微卫星3DDU和FecB基因的多态及连锁分析. 张宝云,储明星,王凭青,方丽,狄冉. 2009

[10]山西谷子核心资源群体结构及主要农艺性状关联分析. 王海岗,温琪汾,穆志新,乔治军. 2019

[11]海南短日照条件下谷子穗部性状的全基因组关联分析. 贾小平,张博,董志平,全建章,王永芳,张小梅,袁玺垒,李剑峰,戴凌峰. 2018

[12]半滑舌鳎有效群体大小估计. 王伟峰,崔瑜,蒋丽,王悦玲,王焕岭,李恒德. 2019

[13]关联分析在植物种质资源研究中的应用. 王秀全,何丹,庞启华,税红霞,卢庭启,蒋晓芳. 2014

[14]陆地棉种质资源群体结构与抗旱、耐盐性状的关联分析. 孙君灵,潘兆娥,何守朴,王立如,庞保印,杜雄明. 2013

[15]绵羊心脏脂肪酸结合蛋白基因单核苷酸多态性分析. 谢秀兰,梁小军,马青,马小明,马丽娜,岳彩娟,杨炜迪,额尔和花. 2018

[16]猪十二号染色体上多个SNP与经济性状的关联分析. 杨述林,王恒,任红艳,李奎. 2006

[17]东北春大豆花荚脱落性状与SSR标记的关联分析. 王欢. 2014

[18]小尾寒羊微卫星座位LSCV043与FecB基因的连锁分析. 张林,李春苗,储明星,陈宏权,李学伟,方丽,狄冉,马月辉,李奎. 2009

[19]绵羊微卫星OarJL36和FecB基因的多态及连锁分析. 储明星,张宝云,王凭青,方丽,狄冉,马月辉,李奎. 2009

[20]引进陆地棉种质材料的遗传多样性、群体结构与连锁不平衡. 杨洋,马君,李波,胡文冉,王玉晶. 2015

作者其他论文 更多>>