文献类型: 中文期刊
作者: 王春山 1 ; 张宸硕 1 ; 吴华瑞 1 ; 朱华吉 1 ; 缪祎晟 1 ; 张立杰 1 ;
作者机构: 1.河北农业大学信息科学与技术学院;国家农业信息化工程技术研究中心;农业农村部农业信息化技术重点实验室;河北农业大学机电工程学院;河北省农业大数据重点实验室
关键词: 农业病害;命名实体识别;连续提示;指针网络;嵌套实体;预训练语言模型
期刊名称: 农业机械学报
ISSN: 1000-1298
年卷期: 2024 年 06 期
页码: 254-261
收录情况: EI ; 北大核心 ; CSCD
摘要: 针对农业病害领域命名实体识别过程中存在的预训练语言模型利用不充分、外部知识注入利用率低、嵌套命名实体识别率低的问题,本文提出基于连续提示注入和指针网络的命名实体识别模型CP-MRC(Continuous prompts for machine reading comprehension)。该模型引入BERT(Bidirectional encoder representation from transformers)预训练模型,通过冻结BERT模型原有参数,保留其在预训练阶段获取到的文本表征能力;为了增强模型对领域数据的适用性,在每层Transformer中插入连续可训练提示向量;为提高嵌套命名实体识别的准确性,采用指针网络抽取实体序列。在自建农业病害数据集上开展了对比实验,该数据集包含2 933条文本语料,8个实体类型,共10 414个实体。实验结果显示,CP-MRC模型的精确率、召回率、F1值达到83.55%、81.4%、82.4%,优于其他模型;在病原、作物两类嵌套实体的识别率较其他模型F1值提升3个百分点和13个百分点,嵌套实体识别率明显提升。本文提出的模型仅采用少量可训练参数仍然具备良好识别性能,为较大规模预训练模型在信息抽取任务上的应用提供了思路。
- 相关文献
[1]基于RoFormer预训练模型的指针网络农业病害命名实体识别. 王彤,王春山,李久熙,朱华吉,缪祎晟,吴华瑞. 2024
[2]基于BERT-BiLSTM-CRF模型的畜禽疫病文本分词研究. 余礼根,郭晓利,赵红涛,杨淦,张俊,李奇峰. 2024
[3]融合RoBERTa-WWM和全局指针网络的农业病害实体关系联合抽取研究. 王彤,张立杰,王铭,吴华瑞,朱华吉,杨英茹,王春山. 2024
[4]基于注意力机制的农业文本命名实体识别. 赵鹏飞,赵春江,吴华瑞,王维. 2021
[5]面向葡萄知识图谱构建的多特征融合命名实体识别. 聂啸林,张礼麟,牛当当,吴华瑞,朱华吉,张宏鸣. 2024
作者其他论文 更多>>
-
基于多模态融合大模型架构Agri-QA Net的作物知识问答系统
作者:吴华瑞;赵春江;李静晨
关键词:多模态融合;人机交互;农业知识问答;甘蓝作物;大语言模型
-
基于大语言模型的个性化作物水肥管理智能决策方法
作者:吴华瑞;李静晨;杨雨森
关键词:作物管理;大语言模型;多目标决策;个性化决策;PPO算法
-
基于双维信息与剪枝的中文猕猴桃文本命名实体识别方法
作者:齐梓均;牛当当;吴华瑞;张礼麟;王仑峰;张宏鸣
关键词:中文命名实体识别;猕猴桃文本;自建数据集;多维度注意力机制;剪枝;深度学习;文本特征增强
-
农业大模型:关键技术、应用分析与发展方向
作者:郭旺;杨雨森;吴华瑞;朱华吉;缪祎晟;顾静秋
关键词:生成式人工智能;大模型;农业知识服务;机器学习;自主决策;多模态;深度学习
-
融合时间感知和增强过滤的农业知识推荐模型
作者:王鹏哲;朱华吉;缪祎晟;刘畅;吴华瑞
关键词:农业知识推荐;滤波器算法;时间感知;自注意力网络;序列推荐
-
基于改进UperNet的结球甘蓝叶球识别方法
作者:朱轶萍;吴华瑞;郭旺;吴小燕
关键词:结球甘蓝;语义分割;叶球识别;注意力机制;特征选择;特征对齐
-
基于改进YOLOv8s的大田甘蓝移栽状态检测算法
作者:吴小燕;郭威;朱轶萍;朱华吉;吴华瑞
关键词:甘蓝移栽;YOLOv8s;目标检测;多尺度注意力机制;可变形卷积