基于自编码器整合转录组数据提升基因组预测的准确性

文献类型: 中文期刊

第一作者: 骞里

作者: 骞里;梁忙;邓天宇;杜丽丽;李柯安宁;邱诗元;薛青青;张路培;高雪;徐凌洋;郑彩宏;李俊雅;高会江

作者机构:

关键词: 多组学数据;特征提取;机器学习;基因组预测

期刊名称: 畜牧兽医学报

ISSN: 0366-6964

年卷期: 2025 年 56 卷 009 期

页码: 4410-4421

收录情况: 北大核心 ; CSCD

摘要: 为进一步探索传统线性回归模型难以捕捉基因型与表型之间复杂关系的不足,本研究旨在利用机器学习整合组学数据提升基因组预测的准确性.本研究基于具有基因型与转录组数据的数据集:1)华西牛数据集涉及宰前活重、胴体重和净肉重3个主要经济性状;2)水稻数据集包含单株产量、每穗粒数和千粒重3个农艺性状.采用五折交叉验证,以皮尔逊相关系数评估育种值估计的准确性.首先比较了基于单一组学数据作为输入时的预测表现,随后基于自编码器构建隐含矩阵作为关系矩阵用于模型建模.结果表明,使用转录组数据替代基因组数据作为输入可以提升模型的预测能力.在水稻和华西牛数据集分别提高了 44.2%和27.4%,进一步地,将隐含矩阵用于建模后,模型预测准确性相较基因组关系矩阵在水稻和华西牛中分别提升了 4.10%和6.81%.相关性分析表明,隐含矩阵与原始组学数据之间存在较强的非线性关系.将转录组作为模型输入,结合自编码器构建的关系矩阵,可有效提升选种选育的准确性,为育种工作的持续改进提供参考依据.

分类号: S813.3

  • 相关文献

[1]基于机器学习的农业机械运行状态预测方法研究. 傅东兴. 2024

[2]高光谱成像技术在水果品质无损检测中的研究进展. 陈龙跃,段丹丹,王凡,孟翔宇,赵冲,钱英军. 2023

[3]基于不完全双列杂交设计的水稻农艺性状配合力基因组预测. 王欣,马莹,胡中立,徐辰武. 2019

[4]田间害虫图像识别中的特征提取与分类器设计研究. 张红涛,胡玉霞,赵明茜,邱道尹,张孝远,张恒源. 2008

[5]近红外光谱的苹果内部品质在线检测模型优化. 郭志明,黄文倩,陈全胜,彭彦昆,赵杰文. 2016

[6]基于视频的植物动画合成方法. 蒋艳娜,肖伯祥,郭新宇,杨宝祝. 2015

[7]基于线结构光视觉的穴盘苗外形参数在线测量系统研制及试验. 冯青春,刘新南,姜凯,范鹏飞,王秀. 2013

[8]基于分形维数的放牧地秃斑特征提取方法及其应用. 王钊齐,林慧龙. 2011

[9]基于扫描成像的作物近地高光谱获取与特征分析. 张东彦,黄文江,王纪华,杨贵军,朱大洲,刘镕源,马智宏. 2010

[10]支持向量机的动物血液光谱特征提取和识别分类. 卢鹏飞,范雅,周林华,钱军,刘林娜,赵思言,孔之丰,高斌. 2017

[11]基于机器视觉的作物多姿态害虫特征提取与分类方法. 李文勇,李明,陈梅香,钱建平,孙传恒,杜尚丰. 2014

[12]基于深度图像和BP神经网络的肉鸡体质量估测模型. 王琳,孙传恒,李文勇,吉增涛,张翔,王以忠,雷鹏,杨信廷. 2017

[13]基于深度学习的油菜籽粒图像分割方法初探. 彭顺正,黄筑斌,岳延滨,吴小波. 2020

[14]基于图像分割与融合特征的黄瓜叶片含水量分析方法. 何林飞,朱煜,钱婷婷,汪妍. 2019

[15]基于数字照片特征的小麦覆盖度自动提取研究. 李存军,王纪华,刘良云,王人潮. 2004

[16]利用太赫兹光谱技术构建番茄水分胁迫状态检测模型. 张晓东,段朝晖,毛罕平,高洪燕,石强,王亚飞,沈宝国,张馨. 2021

[17]基于图像处理技术的观赏菊品种识别方法研究. 翟果,李志敏,路文超,赵勇,王成. 2016

[18]家蚕微粒子病的图像识别技术研究. 张香琴,方如明,汪萍,蔡健荣,许俐. 2001

[19]基于SVM的水稻稻瘟病识别方法. 赵开才,石凤梅,孟庆林,马立功. 2013

[20]基于经验模态分解与极限学习机的粮食产量模型预测. 袁世一. 2024

作者其他论文 更多>>