基于双维信息与剪枝的中文猕猴桃文本命名实体识别方法

文献类型: 中文期刊

第一作者: 齐梓均

作者: 齐梓均;牛当当;吴华瑞;张礼麟;王仑峰;张宏鸣

作者机构:

关键词: 中文命名实体识别;猕猴桃文本;自建数据集;多维度注意力机制;剪枝;深度学习;文本特征增强

期刊名称: 智慧农业(中英文)

ISSN: 2096-8094

年卷期: 2025 年 7 卷 001 期

页码: 44-56

摘要: [目的/意义]中文猕猴桃文本在段落上下文主题与字符间的左右关系中,展现出垂直与水平双维度特性。若能充分利用中文猕猴桃文本的双维特性,将有助于进一步提升命名实体识别的识别效果。基于此,提出了一种基于双维信息与剪枝的命名实体识别方法,命名为KIWI-Coord-Prune (kiwifruit-CoordKIWINER-PruneBiLSTM)。[方法]通过设计CoordKIWINER与PruneBi-LSTM两个模块,对中文猕猴桃文本中的双维信息进行精准处理。其中CoordKIWINER模块能够显著提升模型捕捉复杂和嵌套实体的能力,从而生成涵盖更多文本信息的加强字符矢量;PruneBi-LSTM模块在上一模块的基础上,加强了模型对重要特征的学习与识别能力,从而进一步提升了实体识别效果。[结果和讨论]在自建数据集KIWIPRO和四个公开数据集人民日报(People's Daily)、ClueNER、Boson,以及ResumeNER上进行试验,并与LSTM、Bi-LSTM、LR-CNN、Softlexicon-LSTM,以及KIWINER五个先进模型进行对比,本研究提出的方法在5个数据集上分别取得了较好的F1值,分别为89.55%、91.02%、83.50%、83.49%和95.81%。[结论]与现有方法相比,本研究提出的方法不仅能够有效提升中文猕猴桃领域文本的命名实体识别效果,且具有一定的泛化性,同时也能够为相关知识图谱和问答系统的构建等下游任务提供技术支持。

分类号: S663.4%TP391.1

  • 相关文献

[1]基于偏正结构表示的加工命名实体识别方法. 王素琴,王钰珏,石敏,朱登明,李兆歆. 2024

[2]剪枝处理对桔梗结实特性的影响. 王志芬,单成钢,苏学合,闫树林,朱连先,隋春青. 2008

[3]引茄1号、杭茄1号越冬长季节栽培比较试验. 陈巧燕,吴爱芳. 2018

[4]上海地区茄子长周期简约化栽培技术. 朱宗文,吴雪霞,查丁石,顾大国. 2023

[5]深度学习方法在农业领域的研究及应用. 马聪,张建华,陈学东,朱丹. 2020

[6]基于深度卷积神经网络的红树林物种无人机监测研究. 黄亦其,刘琪,赵建晔,黄文善,孙中宇,乔曦. 2020

[7]基于卷积神经网络的农机图像自动识别研究. 雷雪梅,张光强,姚旗,刘伟渭,邱帅. 2022

[8]基于迁移学习和金字塔卷积网络的河蟹个体图像识别方法研究. 冯裕清,杨信廷,徐大明,罗娜,陈枫,孙传恒. 2022

[9]基于词向量的检索扩展方法与农业领域实证. 吴蕾,梁晓贺,乌吉斯古楞,王瑞. 2019

[10]基于神经网络的文献主题国别标引方法研究. 王新. 2019

[11]基于无人机遥感的盛花期薇甘菊爆发点识别与监测. 孙中宇,荆文龙,乔曦,杨龙. 2019

[12]基于YOLOv3深度卷积神经网络的田间百香果定位. 林营志,卢依琳,刘现. 2019

[13]基于深度学习的无人机影像玉米倒伏区域提取. 郑二功,田迎芳,陈涛. 2018

[14]机器学习在植物病害识别研究中的应用. 王聃,柴秀娟. 2019

[15]蛋鸡设施养殖环境质量评价预测模型构建方法及性能测试. 李华龙,李淼,詹凯,刘先旺,杨选将,胡泽林,郭盼盼. 2020

[16]基于深度学习与特征可视化方法的草地贪夜蛾及其近缘种成虫识别. 魏靖,王玉亭,袁会珠,张梦蕾,王振营. 2020

[17]基于长短时记忆神经网络的生猪价格预测模型. 刘怡然,王东杰,邓雪峰,刘振宇. 2021

[18]基于性诱和深度学习的草地贪夜蛾成虫自动识别计数方法. 邱荣洲,赵健,何玉仙,陈韶萍,黄美玲,池美香,梁勇,翁启勇. 2021

[19]基于深度学习的油菜籽粒图像分割方法初探. 彭顺正,黄筑斌,岳延滨,吴小波. 2020

[20]人工智能驱动智慧奶牛养殖的思考与实践. 夏雪,侍啸,柴秀娟. 2020

作者其他论文 更多>>