融合BERT-WWM和注意力机制的茶叶知识图谱构建

文献类型: 中文期刊

第一作者: 刘永波

作者: 刘永波;黄强;高文波;何鹏;许钰莎

作者机构:

关键词: 茶叶;知识图谱;条件随机场;双向长短词记忆模型;注意力机制

期刊名称: 西南农业学报

ISSN: 1001-4829

年卷期: 2022 年 35 卷 012 期

页码: 2912-2921

收录情况: 北大核心 ; CSCD

摘要: [目的]针对当前茶叶领域语料数据库不完善、多源异构数据聚合能力差、知识共享困难等问题,提出一种基于BERT-WWM-BiLSTM-AttTea-CRF模型的茶叶知识图谱构建方法.[方法]以基于全词掩码的BERT-WWM(Whole Word Masking)层替换预训练模型中的随机掩码BERT层,并根据茶叶领域语料数据的全局文本特征,设计可实现茶叶关键实体权重分配的注意力机制层以提高文本提取的准确率,最后通过条件随机场对序列中的各个实体进行分类提取,从而完成茶叶中文实体识别的整个流程.[结果]BERT-WWM-BiLSTM-AttTea-CRF模型能有效识别茶叶知识文本数据中的实体,对茶叶非结构化数据的实体抽取效果优于RoBERTa_BiLSTM_CRF、ALBERT_BiLSTM-CRF 等主流模型,识别的准确率、召回率、F1 值分别为 92.03%、90.36%、91.19%.经改进后的模型对茶叶品种数据和茶叶病害数据的识别率有明显提升,其F1值分别达到94.32%和94.05%.[结论]本研究所构建的茶叶知识图谱具有数据覆盖面广、聚合能力强、体系完整等优势,对农业特定领域的知识图谱构建和农业中文命名实体的提取研究具有重要意义.

分类号: TP3

  • 相关文献

[1]基于PCNN-Attention的土壤肥力关系抽取研究. 季丰,周乐乐,张彩丽,任竹,刘楠楠,陈磊. 2022

[2]融合农村居民意图的健康知识推荐方法. 王馨悦,吴华瑞,陈雯柏,韩笑,朱华吉,赵春江. 2024

[3]基于YOLOv5s-SE和通道剪枝的虫咬紫金蝉茶检测方法研究. 戴佳兵,宋春芳,凌彩金,李臻锋,孙崇高. 2024

[4]基于改进YOLOv4-tiny的茶叶嫩芽检测模型. 方梦瑞,吕军,阮建云,边磊,武传宇,姚青. 2022

[5]基于CiteSpace可视化分析的茶叶香气研究进展. 银霞,黄建安,黄静,包小村,周凌云,李维,刘红艳,张曙光,刘仲华. 2020

[6]面向数字人文的馆藏方志古籍地名自动识别模型构建. 李娜,包平. 2018

[7]基于条件随机场的高光谱遥感影像农作物精细分类. 余铭,魏立飞,尹峰,李丹丹,黄庆彬. 2018

[8]农业中文期刊论文信息自动识别与抽取模型构建及实现. 薛欢欢,赵瑞雪,寇远涛,鲜国建. 2019

[9]基于BERT-BiLSTM-CRF模型的畜禽疫病文本分词研究. 余礼根,郭晓利,赵红涛,杨淦,张俊,李奇峰. 2024

[10]基于图像处理的温室黄瓜霜霉病诊断系统. 马浚诚,温皓杰,李鑫星,傅泽田,吕雄杰,张领先. 2017

[11]基于词向量+BiLSTM+CRF的农业技术需求文本实体提取. 宋林鹏,刘世洪,王翠. 2021

[12]改进YOLOv4的温室环境下草莓生育期识别方法. 龙洁花,郭文忠,林森,文朝武,张宇,赵春江. 2021

[13]基于YOLOX改进模型的茶叶嫩芽识别方法. 俞龙,黄楚斌,唐劲驰,黄浩宜,周运峰,黄永权,孙佳琪. 2022

[14]融合注意力机制的开集猪脸识别方法. 王荣,高荣华,李奇峰,刘上豪,于沁杨,冯璐. 2023

[15]基于双线性注意力网络的农业灯诱害虫细粒度图像识别研究. 姚青,姚波,吕军,唐健,冯晋,朱旭华. 2021

[16]基于改进YOLO v5的复杂环境下桑树枝干识别定位方法. 李丽,卢世博,任浩,徐刚,周永忠. 2024

[17]改进YOLOv5在胡瓜钝绥螨品质管控系统中的设计与应用. 李建兴,刘振宇,马莹,张艳璇,宋江,纪茂源,旷树森. 2023

[18]基于多维间注意力机制的水稻病害识别模型. 王忠培,谢成军,董伟,管博伦. 2024

[19]基于Attention_DenseCNN的水稻问答系统问句分类. 王郝日钦,吴华瑞,冯帅,刘志超,许童羽. 2021

[20]基于改进YOLOv5s的硬核期葡萄簇检测. 冯晓,张辉,刘运超,张微,李小红,马中杰. 2024

作者其他论文 更多>>