PCA与随机森林相结合筛选高信息量SNP位点——应用于羊的品种鉴别

文献类型: 中文期刊

第一作者: 刘月丽

作者: 刘月丽;覃锡忠;贺三刚;李文蓉;王悦;贾振红;刘明军

作者机构:

关键词: 主成分分析(PCA);随机森林;高信息量SNP位点;品种鉴别

期刊名称: 计算机工程与应用

ISSN: 1002-8331

年卷期: 2018 年 16 期

页码: 235-240

收录情况: 北大核心 ; CSCD

摘要: 针对品种鉴别中面临的SNP(Single Nucleotide Polymorphisms)数据高维小样本的难点,研究利用少数高信息量SNP位点正确鉴别品种的方法,提出了一种新的SNP位点筛选方法。先利用PCA提取SNP主要位点,随后使用随机森林方法,根据平均精度下降和Gini指数下降对主位点的重要性进行评估,训练分类模型。最后分别选取重要度排名前48和96的位点,以这些位点为分类特征,建立分类模型进行品种鉴别。将该模型应用于6种绵羊Illumina Ovine SNP50的SNP数据。实验表明,可以从46 013个位点中分别筛选出49、96个高信息量位点用于品种鉴别,鉴别准确率达到97%以上。该方法减少了用于品种鉴别的SNP位点个数,降低了品种鉴别成本。

分类号: S826`TP301.6

  • 相关文献

[1]冬小麦冻害胁迫高光谱分析与冻害严重度反演. 王慧芳,王纪华,董莹莹,顾晓鹤,霍治国. 2014

[2]基于主成分分析的叶面积指数尺度效应. 董莹莹,王纪华,李存军,杨贵军,徐新刚,王慧芳,黄文江. 2012

[3]基于数据分割与主成分分析的LAI遥感估算. 董莹莹,王纪华,李存军,杨贵军,宋晓宇,顾晓鹤,黄文江. 2011

[4]化学计量学模式识别方法结合近红外光谱用于大米产地溯源分析. 李勇,严煌倩,龙玲,余向阳. 2017

[5]利用成像高光谱区分冬小麦白粉病与条锈病(英文). 梁栋,刘娜,张东彦,赵晋陵,林芬芳,黄林生,张庆,丁玉婉. 2017

[6]基于主成分分析的不同品种柑橘制汁适应性研究. 王靓钰,夏其乐,陈剑兵,曹艳,张俊,关荣发. 2019

[7]外源添加酵母对黑豆酱油品质的影响. 钟小廷,吕杰,易谦武,刘迎涛,李可. 2020

[8]河流底泥DOM、营养盐与重金属空间分异特征及响应关系. 肖艳春,于会彬,宋永会. 2022

[9]电子舌技术对不同配比香露兜绿茶的识别研究. 徐飞,宗迎,初众,卢少芳,谭乐和,朱红英. 2011

[10]电子鼻和电子舌技术在五倍子蜂蜜风味识别中的应用. 邓梦青,袁扬,赵恬,王胤晨,张定红,张锦华. 2023

[11]基于主成分分析算法的市售南极磷虾油品质分析模型构建. 侯钟令,朱兰兰,周德庆,苏婷,孙伟红,冷凯良,苗钧魁,刘小芳. 2020

[12]红外光谱结合PCA-LDA判别道地和非道地山药. 张芳,周昊,徐蓉,徐寸发,韩伟,徐为民,李勇. 2018

[13]土壤重金属含量变化的影响因素多目标识别方法. 管祥楠,董士伟,刘玉,张欣欣,潘瑜春,卢闯. 2024

[14]气质联用结合电子鼻表征不同温度热风干燥苹果脆片关键香气化合物. 李嘉欣,吴昕烨,毕金峰,苟敏. 2022

[15]5种苹果微粉的理化品质与行为特征. 薛玉洁,陈芹芹,毕金峰,周沫,宁喜斌,王淑珍. 2016

[16]基于多元分析的11种烟台中、晚熟品种苹果香气成分比较. 孙承锋,朱亮,周楠,杨建荣,李彦伸. 2015

[17]不同产地、种类牛肝菌的紫外光谱鉴别分析. 杨天伟,李涛,张霁,李杰庆,刘鸿高. 2015

[18]基于GRA-PCA的英国渔船安全事故致因分析. 李潇阳,任玉清,黄应邦. 2024

[19]基于主成分分析法构建尼罗罗非鱼一般抗病力的评估模型. 刘洪,刘志刚,唐程林,朱伟娟,梁德进,黄维,曹明,王章,曹建萌,衣萌萌,王淼,可小丽. 2025

[20]基于AHP-PCA与语义差异法的晋城市森林公园景观质量评价体系构建. 常朦朦,马星玮. 2024

作者其他论文 更多>>