基于连续提示注入与指针网络的农业病害命名实体识别

文献类型: 中文期刊

第一作者: 王春山

作者: 王春山;张宸硕;吴华瑞;朱华吉;缪祎晟;张立杰

作者机构:

关键词: 农业病害;命名实体识别;连续提示;指针网络;嵌套实体;预训练语言模型

期刊名称: 农业机械学报

ISSN: 1000-1298

年卷期: 2024 年 06 期

页码: 254-261

收录情况: EI ; 北大核心 ; CSCD

摘要: 针对农业病害领域命名实体识别过程中存在的预训练语言模型利用不充分、外部知识注入利用率低、嵌套命名实体识别率低的问题,本文提出基于连续提示注入和指针网络的命名实体识别模型CP-MRC(Continuous prompts for machine reading comprehension)。该模型引入BERT(Bidirectional encoder representation from transformers)预训练模型,通过冻结BERT模型原有参数,保留其在预训练阶段获取到的文本表征能力;为了增强模型对领域数据的适用性,在每层Transformer中插入连续可训练提示向量;为提高嵌套命名实体识别的准确性,采用指针网络抽取实体序列。在自建农业病害数据集上开展了对比实验,该数据集包含2 933条文本语料,8个实体类型,共10 414个实体。实验结果显示,CP-MRC模型的精确率、召回率、F1值达到83.55%、81.4%、82.4%,优于其他模型;在病原、作物两类嵌套实体的识别率较其他模型F1值提升3个百分点和13个百分点,嵌套实体识别率明显提升。本文提出的模型仅采用少量可训练参数仍然具备良好识别性能,为较大规模预训练模型在信息抽取任务上的应用提供了思路。

分类号: S432`TP391.1

  • 相关文献

[1]基于RoFormer预训练模型的指针网络农业病害命名实体识别. 王彤,王春山,李久熙,朱华吉,缪祎晟,吴华瑞. 2024

[2]基于BERT-BiLSTM-CRF模型的畜禽疫病文本分词研究. 余礼根,郭晓利,赵红涛,杨淦,张俊,李奇峰. 2024

[3]农业主要病害检测与预警技术研究进展分析. 王翔宇,温皓杰,李鑫星,傅泽田,吕雄杰,张领先. 2016

[4]融合RoBERTa-WWM和全局指针网络的农业病害实体关系联合抽取研究. 王彤,张立杰,王铭,吴华瑞,朱华吉,杨英茹,王春山. 2024

[5]环介导等温扩增技术在农业病害检测中的应用综述. 王一波,孙泓希,史普想,孙继军,韩宁,任亮,张丽丽,王海新. 2024

[6]基于注意力机制的农业文本命名实体识别. 赵鹏飞,赵春江,吴华瑞,王维. 2021

[7]基于深度学习的方志物产资料实体自动识别模型构建研究. 徐晨飞,叶海影,包平. 2020

[8]基于深度学习的细粒度命名实体识别研究-以番茄病虫害为例. 任妮,鲍彤,沈耕宇,郭婷. 2021

[9]基于人工智能大模型技术的果蔬农技知识智能问答系统. 王婷,王娜,崔运鹏,刘娟. 2023

[10]基于ERNIE-BiLSTM-CRF模型的土壤肥力命名实体识别研究. 周乐乐,陈磊,季丰,任竹,刘楠楠. 2023

[11]面向葡萄知识图谱构建的多特征融合命名实体识别. 聂啸林,张礼麟,牛当当,吴华瑞,朱华吉,张宏鸣. 2024

[12]基于词向量+BiLSTM+CRF的农业技术需求文本实体提取. 宋林鹏,刘世洪,王翠. 2021

作者其他论文 更多>>