您好,欢迎访问北京市农林科学院 机构知识库!

基于BERT-Attention-DenseBiGRU的农业问答社区问句相似度匹配

文献类型: 中文期刊

作者: 王郝日钦 1 ; 王晓敏 1 ; 缪祎晟 1 ; 许童羽 1 ; 刘志超 1 ; 吴华瑞 1 ;

作者机构: 1.国家农业信息化工程技术研究中心;内蒙古民族大学计算机科学与技术学院;北京市农林科学院信息技术研究中心;沈阳农业大学信息与电气工程学院

关键词: 问答社区;农业问句相似度匹配;自然语言处理;密集连接BiGRU;协同注意力机制

期刊名称: 农业机械学报

ISSN: 1000-1298

年卷期: 2022 年 01 期

页码: 244-252

收录情况: EI ; 北大核心 ; CSCD

摘要: 为了解决问答社区中相同语义问句文本的快速自动检测,提出一种基于BERT的Attention-DenseBiGRU农业问句相似度匹配模型。针对农业文本具备的特征,采用12层的中文BERT文本预训练模型对文本数据进行向量化处理,并与Word2Vec、Glove、TF-IDF方法进行对比分析,得出BERT方法能够有效地解决农业文本的高维性和稀疏性问题,并且解决多义词在不同语境下具有不同含义的问题。该网络的每一层都使用注意特征的连接信息以及前面所有递归层的隐藏特征,为了缓解由于密集拼接而导致特征向量尺寸不断增大的问题,在模型的最后使用自动编码器进行特征降维。试验结果表明:基于BERT的Attention-DenseBiGRU农业问句相似度匹配模型可以提高文本特征的利用率,减少特征丢失,能够实现快速及准确的农业问句文本相似度匹配,在本文所构建的农业问句相似对数据集上精确率及F1值达到97.2%和97.6%,与其他6种问句相似度匹配模型相比,效果提升明显。

  • 相关文献

[1]基于特征增强的多方位农业问句语义匹配. 王奥,吴华瑞,朱华吉. 2023

[2]基于Attention_DenseCNN的水稻问答系统问句分类. 王郝日钦,吴华瑞,冯帅,刘志超,许童羽. 2021

[3]基于卷积模型的农业问答语性特征抽取分析. 张明岳,吴华瑞,朱华吉. 2018

[4]农业文本语义理解技术综述. 吴华瑞,郭威,邓颖,王郝日钦,韩笑,黄素芳. 2022

作者其他论文 更多>>