您好,欢迎访问北京市农林科学院 机构知识库!

基于双维信息与剪枝的中文猕猴桃文本命名实体识别方法

文献类型: 中文期刊

作者: 齐梓均 1 ; 牛当当 1 ; 吴华瑞 2 ; 张礼麟 1 ; 王仑峰 1 ; 张宏鸣 1 ;

作者机构: 1.西北农林科技大学信息工程学院

2.国家农业信息化工程技术研究中心

关键词: 中文命名实体识别;猕猴桃文本;自建数据集;多维度注意力机制;剪枝;深度学习;文本特征增强

期刊名称: 智慧农业(中英文)

ISSN: 2096-8094

年卷期: 2025 年 7 卷 001 期

页码: 44-56

摘要: [目的/意义]中文猕猴桃文本在段落上下文主题与字符间的左右关系中,展现出垂直与水平双维度特性。若能充分利用中文猕猴桃文本的双维特性,将有助于进一步提升命名实体识别的识别效果。基于此,提出了一种基于双维信息与剪枝的命名实体识别方法,命名为KIWI-Coord-Prune (kiwifruit-CoordKIWINER-PruneBiLSTM)。[方法]通过设计CoordKIWINER与PruneBi-LSTM两个模块,对中文猕猴桃文本中的双维信息进行精准处理。其中CoordKIWINER模块能够显著提升模型捕捉复杂和嵌套实体的能力,从而生成涵盖更多文本信息的加强字符矢量;PruneBi-LSTM模块在上一模块的基础上,加强了模型对重要特征的学习与识别能力,从而进一步提升了实体识别效果。[结果和讨论]在自建数据集KIWIPRO和四个公开数据集人民日报(People's Daily)、ClueNER、Boson,以及ResumeNER上进行试验,并与LSTM、Bi-LSTM、LR-CNN、Softlexicon-LSTM,以及KIWINER五个先进模型进行对比,本研究提出的方法在5个数据集上分别取得了较好的F1值,分别为89.55%、91.02%、83.50%、83.49%和95.81%。[结论]与现有方法相比,本研究提出的方法不仅能够有效提升中文猕猴桃领域文本的命名实体识别效果,且具有一定的泛化性,同时也能够为相关知识图谱和问答系统的构建等下游任务提供技术支持。

  • 相关文献

[1]基于卷积神经网络的农机图像自动识别研究. 雷雪梅,张光强,姚旗,刘伟渭,邱帅. 2022

[2]基于迁移学习和金字塔卷积网络的河蟹个体图像识别方法研究. 冯裕清,杨信廷,徐大明,罗娜,陈枫,孙传恒. 2022

[3]基于Faster R-CNN的美国白蛾图像识别模型研究. 薛大暄,张瑞瑞,陈立平,陈梅香,徐刚. 2020

[4]基于深度残差网络的番茄叶片病害识别方法. 吴华瑞. 2019

[5]基于云原生技术的土壤墒情监测系统设计与应用. 于景鑫,杜森,吴勇,钟永红,张钟莉莉,郑文刚,李文龙. 2020

[6]基于深度学习的跨年龄人脸识别. 孙文斌,王荣,孙连烛,林源松. 2022

[7]采用组合增强的YOLOX-ViT协同识别温室内番茄花果. 吕志远,张付杰,魏晓明,黄媛,李晶晶,张钟莉莉. 2023

[8]设施温室影像采集与环境监测机器人系统设计及应用. 郭威,吴华瑞,朱华吉. 2020

[9]农业害虫检测的深度学习算法综述. 蒋心璐,陈天恩,王聪,李书琴,张宏鸣,赵春江. 2023

[10]基于Faster R-CNN网络的茶叶嫩芽检测. 朱红春,李旭,孟炀,杨海滨,徐泽,李振海. 2022

[11]基于WDNN的温室多特征数据融合方法研究. 孙耀杰,蔡昱,张馨,薛绪掌,郑文刚,乔晓军. 2019

[12]基于注意力机制的农业文本命名实体识别. 赵鹏飞,赵春江,吴华瑞,王维. 2021

[13]基于偏最小二乘法和深度学习的近红外糖度预测. 彭发,王震,刘双喜,王金星,杨化伟. 2021

[14]番茄非接触式单果质量估测方法. 许伟浩,李斌,林森,郑书河,郎冲冲,李涛,董创,郭文忠. 2021

[15]基于深度学习与多尺度特征融合的烤烟烟叶分级方法. 鲁梦瑶,周强,姜舒文,王聪,陈栋,陈天恩. 2022

[16]轻小型无人机遥感及其行业应用进展. 郭庆华,胡天宇,刘瑾,金时超,肖青,杨贵军,高显连,许强,谢品华,彭炽刚,闫利. 2021

[17]农业大模型:关键技术、应用分析与发展方向. 郭旺,杨雨森,吴华瑞,朱华吉,缪祎晟,顾静秋. 2024

[18]畜禽个体识别技术研究进展. 纪宝锋,周孟创,朱芷芫,陈嘉辉,朱君,李斌. 2024

[19]基于深度学习网络实现番茄病虫害检测与识别. 王铭慧,张怀清,樊江川,陈帮乾,云挺. 2023

[20]基于深度学习的杂草识别方法研究进展. 付豪,赵学观,翟长远,郑康,郑申玉,王秀. 2023

作者其他论文 更多>>