您好,欢迎访问北京市农林科学院 机构知识库!

基于连续提示注入与指针网络的农业病害命名实体识别

文献类型: 中文期刊

作者: 王春山 1 ; 张宸硕 1 ; 吴华瑞 1 ; 朱华吉 1 ; 缪祎晟 1 ; 张立杰 1 ;

作者机构: 1.河北农业大学信息科学与技术学院;国家农业信息化工程技术研究中心;农业农村部农业信息化技术重点实验室;河北农业大学机电工程学院;河北省农业大数据重点实验室

关键词: 农业病害;命名实体识别;连续提示;指针网络;嵌套实体;预训练语言模型

期刊名称: 农业机械学报

ISSN: 1000-1298

年卷期: 2024 年 06 期

页码: 254-261

收录情况: EI ; 北大核心 ; CSCD

摘要: 针对农业病害领域命名实体识别过程中存在的预训练语言模型利用不充分、外部知识注入利用率低、嵌套命名实体识别率低的问题,本文提出基于连续提示注入和指针网络的命名实体识别模型CP-MRC(Continuous prompts for machine reading comprehension)。该模型引入BERT(Bidirectional encoder representation from transformers)预训练模型,通过冻结BERT模型原有参数,保留其在预训练阶段获取到的文本表征能力;为了增强模型对领域数据的适用性,在每层Transformer中插入连续可训练提示向量;为提高嵌套命名实体识别的准确性,采用指针网络抽取实体序列。在自建农业病害数据集上开展了对比实验,该数据集包含2 933条文本语料,8个实体类型,共10 414个实体。实验结果显示,CP-MRC模型的精确率、召回率、F1值达到83.55%、81.4%、82.4%,优于其他模型;在病原、作物两类嵌套实体的识别率较其他模型F1值提升3个百分点和13个百分点,嵌套实体识别率明显提升。本文提出的模型仅采用少量可训练参数仍然具备良好识别性能,为较大规模预训练模型在信息抽取任务上的应用提供了思路。

  • 相关文献

[1]基于RoFormer预训练模型的指针网络农业病害命名实体识别. 王彤,王春山,李久熙,朱华吉,缪祎晟,吴华瑞. 2024

[2]基于BERT-BiLSTM-CRF模型的畜禽疫病文本分词研究. 余礼根,郭晓利,赵红涛,杨淦,张俊,李奇峰. 2024

[3]融合RoBERTa-WWM和全局指针网络的农业病害实体关系联合抽取研究. 王彤,张立杰,王铭,吴华瑞,朱华吉,杨英茹,王春山. 2024

[4]基于注意力机制的农业文本命名实体识别. 赵鹏飞,赵春江,吴华瑞,王维. 2021

[5]面向葡萄知识图谱构建的多特征融合命名实体识别. 聂啸林,张礼麟,牛当当,吴华瑞,朱华吉,张宏鸣. 2024

作者其他论文 更多>>