作物性状调控基因知识图谱数据集

文献类型: 中文期刊

第一作者: 张丹丹

作者: 张丹丹;赵瑞雪;寇远涛;鲜国建

作者机构:

关键词: 作物;知识图谱;育种知识发现;优异多效基因

期刊名称: 农业大数据学报

ISSN: 2096-6369

年卷期: 2025 年 7 卷 002 期

页码: 220-226

摘要: 当前,作物育种相关的多维度科学数据呈指数级增长,这些半结构化和结构化的科学数据分布在不同领域科学数据库中,缺少跨物种多维度科学数据的关联融合数据集,阻碍了已有作物育种知识的迁移复用与作物育种科学数据价值的最大化发挥,这为作物性状调控基因知识发现带来了挑战。本研究基于数据的可靠性、实用性、易用性等原则,选取PubMed文献数据库与Phytozome、Ensembl plants、UniProt、RGAP、STRING、Pfam、KEGG和GO作为数据获取来源,采用多路径知识抽取的方式对不同数据格式的科学数据分别进行实体及关系的抽取。面向结构化数据的映射知识抽取;面向XML半结构化数据,采用基于Kettle进行数据解析的知识抽取;面向FASTA半结构化数据,采用基于BLAST模型计算的知识抽取。面向Text非结构化数据,采用基于大语言模型的知识抽取。在完成以上实体和关系抽取的基础上,进一步基于实体映射和特定属性关联的方式,实现多源作物育种知识的关联融合。形成了作物性状调控基因知识图谱数据集,并以.csv格式存储为结构化数据。该数据集包含13个实体数据集和14个语义关系数据集。为了验证该数据集的有效性,采用Neo4j图数据库进行数据集存储。最终,形成了涵盖约13万个节点和55万条语义关系的作物性状调控基因知识图谱,可有效支撑跨物种基因知识的关联检索。作物性状调控基因知识图谱数据集已为优异多效基因发现、跨物种基因功能预测与通路基因网络潜在发现等作物育种知识发现提供了关键的语义模型和重要的数据基础。相关科研和生产单位可基于本数据集构建作物性状调控基因知识库,为作物育种知识发现服务平台的构建提供关键的知识资源底座。

分类号: S336%TP311.13

  • 相关文献

[1]基于深度学习的作物病虫害可视化知识图谱构建. 吴赛赛,周爱莲,谢能付,梁晓贺,汪汇涓,李小雨,陈桂鹏. 2020

[2]知识图谱工具比较研究. 肖明,邱小花,黄界,李国俊,冯召辉. 2013

[3]基于知识图谱的核桃研究前沿演进分析. 罗明英,施晓晨,蒋国伟,李东丽,岳丕昌. 2016

[4]基于Web of Science的农业生态安全知识图谱分析. 孙岩,张会芳,段俊枝,齐红志,杨翠苹,樊文杰,燕照玲,陈海燕,刘毓侠,卓文飞. 2019

[5]基于CiteSpace的农业产业集群研究进展. 焦彩菊,张丽娜. 2020

[6]基于文献计量的渔业资源学领域研究现状分析. 陈欣然,钱妤,张晓琴,王希挺. 2019

[7]基于CNKI的中国水产技术研究知识图谱分析. 刘延忠,郑纪业,王东雨,赵文祥. 2017

[8]废弃生物质水热转化技术研究热点与前沿态势分析:基于CiteSpace的大数据知识图谱分析. 周朱梦,李丹阳,吴华山,靳红梅. 2021

[9]基于科学知识图谱的国外数据库盐碱地领域文献研究分析. 敦惠霞,陈晓玲. 2021

[10]基于CiteSpace的我国农村职业教育研究热点及趋势分析. 布海乔,陈会娜,陈蕾. 2019

[11]基于学科知识图谱的紫云英研究态势分析. 李忠义,韦彩会,何铁光,吴惠昌,董文斌,唐红琴. 2020

[12]人工智能辅助种植策略对温室草莓生产调控效果对比研究. 耿闻轩,赵俊晔,阮继伟,侯跃辉. 2022

[13]基于知识图谱可视化方法的低碳农业研究动态分析. 刘晓珂,黄红星,高飞. 2019

[14]知识图谱驱动的科研档案大数据管理系统构建研究. 雷洁,赵瑞雪,李思经,鲜国建,寇远涛. 2020

[15]基于Citespace的我国鹅产蛋性能研究文献知识图谱分析. 刘怡冰,于宁,刘况,赵辉. 2024

[16]我国米粉领域研究进展与发展趋势. 蔡振威,何新华,陈赶林. 2024

[17]基于核心词、突变词与新生词的学科主题演化方法研究. 刘敏娟,张学福,颜蕴. 2016

[18]知识图谱构建管理系统比较研究与优化构想. 马玮璐,鲜国建,赵瑞雪,李娇,黄永文,孙坦. 2023

[19]中国绿肥研究知识图谱——基于CiteSpace的可视化分析. 李忠义,何铁光,唐红琴,韦彩会,董文斌. 2019

[20]基于Penman-Monteith模型和路径排序算法相结合的草莓灌溉方法与验证. 张宇,赵春江,林森,郭文忠,文朝武,龙洁花. 2021

作者其他论文 更多>>