基于大语言模型的《中国小麦品种志》信息提取

文献类型: 中文期刊

第一作者: 韦一金

作者: 韦一金;陈彦清;王秀东;樊景超

作者机构:

关键词: 大语言模型;农业;小麦;信息挖掘;种质资源

期刊名称: 数据与计算发展前沿

ISSN: 2096-742X

年卷期: 2025 年 7 卷 001 期

页码: 175-185

摘要: 【目的】为促进小麦种质资源向小麦产业优势转化、提高小麦遗传背景丰富性,本文基于大语言模型(Large Language Model, LLM)和提示词工程,针对已出版的三卷《中国小麦品种志》进行信息挖掘。【方法】扫描《中国小麦品种志》纸质版文稿并进行OCR识别等数据处理工作以获取小麦品种数据,构建面向育种工作需求的小麦品种数据关键提取指标和相应的大语言模型提示词,以调用商业LLM api接口的方式对小麦品种数据的关键信息进行自动化提取,并形成一套成熟的基于大语言模型的小麦品种信息提取工作方案。【结果】以信息提取任务中的实际存在关系个数、识别出的关系个数、正确识别的关系个数进行精确率、召回率和F1值的计算,结果表明该小麦品种志信息提取方案在已出版的三卷《中国小麦品种志》信息提取中均达到了0.89以上的准确率、0.73以上的召回率和0.84以上的F1值。【结论】小麦品种志信息提取方案的高准确率表明其完全有能力实现精准信息提取,但是召回率又表明该方案存在部分信息无法识别的问题,因此虽然综合F1值而言该方案整体可行,但仍需对提取结果进行进一步的人工核验及审查。

分类号: S512.1%TP18%TP391.1

  • 相关文献

[1]GPT技术驱动的农业发展范式研究与展望. 李灯华,李干琼,许世卫,陈威. 2023

[2]基于互联网的山西省农业信息资源深度挖掘利用. 卜晓冬. 2016

[3]网络信息与农业数字图书馆的建设. 李秀峰,王川. 2004

[4]陆地棉花发育EST大规模测序及其SSR获取与分析. 来德勇,喻树迅,范术丽,宋美珍,庞朝友. 2010

[5]基于多模态数据表型特征提取的番茄生长高度预测方法(英文). 宫宇,王玲,赵荣强,尤海波,周沫,刘劼. 2025

[6]基于多模态融合大模型架构Agri-QA Net的作物知识问答系统. 吴华瑞,赵春江,李静晨. 2025

[7]基于大语言模型的个性化作物水肥管理智能决策方法. 吴华瑞,李静晨,杨雨森. 2025

[8]农业垂直领域大语言模型构建流程和技术展望. 张宇芹,朱景全,董薇,李富忠,郭雷风. 2024

[9]基于大语言模型的智能问答系统研究综述. 任海玉,刘建平,王健,顾勋勋,陈曦,张越,赵昌顼. 2025

[10]基于大语言模型推理的数字孪生平台蔬菜作物生长模型研究. 赵春江,李静晨,吴华瑞,杨雨森. 2024

[11]大语言模型在蛋白质设计中的应用综述. 张锦雄,孟雪莉,陈燕,韦松键,吕丽兰,胡小春. 2024

[12]辽宁省农业种质资源保护与利用的现状与对策建议. 张淼. 2020

[13]广东省农业种质资源共享利用服务平台建设研究. 吴文栋,林伟君,陈燕苹,凌焕枝,梁远航,周广洲. 2018

[14]浙江省农林生物种质资源信息系统的研究与开发. 郑可锋,张小斌,祝利莉,胡为群,姚旭国,胡昊,叶少挺,彭一辉. 2012

[15]农作物种质资源在西藏农业持续发展的地位与作用. 禹代林. 2001

[16]生态脆弱区农业可持续发展途径探讨——以宁夏改种冬麦的沙尘暴防治为例. 隋玉柱,袁汉民. 2004

[17]澳大利亚小麦研究. 孙加祥,蔡士宾,陆维忠. 2004

[18]中国小麦绿色全要素生产率时空特征及影响因素. 代瑞熙,许世卫. 2022

[19]澳大利亚棉花、小麦生产和研究概况. 张琼,王芳,王钊英,马建荣,胡启平. 2013

[20]延津县小麦产业供给侧改革. 罗鹏. 2016

作者其他论文 更多>>