农业中文期刊论文信息自动识别与抽取模型构建及实现

文献类型: 中文期刊

第一作者: 薛欢欢

作者: 薛欢欢;赵瑞雪;寇远涛;鲜国建

作者机构:

关键词: 信息抽取;条件随机场;GROBID;农业期刊论文信息

期刊名称: 情报工程

ISSN: 2095-915X

年卷期: 2019 年 06 期

页码: 46-56

摘要: 面对农业领域丰富的中文期刊论文资源,为实现对农业中文期刊论文文本信息的高效利用,识别与抽取论文中信息已成为一种非常迫切的需求。通过对现有论文信息识别与抽取方法及工具进行调研,确定基于条件随机场算法以及GROBID工具进行农业中文期刊论文信息的识别与抽取。本文构建了农业中文期刊论文信息识别与抽取级联模型,并通过数据采集、文本预处理、特征选择、序列标注、特征模板以及模型训练及评估等一系列流程对模型进行实现与应用。实验结果表明,在进行农业中文期刊论文信息识别与抽取时,该模型在论文头信息以及引文信息抽取方面具有较好的效果,在章节标题以及段落信息的识别上仍然存在不足。

分类号: TP391.1`G252.7`G237.5

  • 相关文献

[1]面向数字人文的馆藏方志古籍地名自动识别模型构建. 李娜,包平. 2018

[2]基于条件随机场的高光谱遥感影像农作物精细分类. 余铭,魏立飞,尹峰,李丹丹,黄庆彬. 2018

[3]基于BERT-BiLSTM-CRF模型的畜禽疫病文本分词研究. 余礼根,郭晓利,赵红涛,杨淦,张俊,李奇峰. 2024

[4]基于图像处理的温室黄瓜霜霉病诊断系统. 马浚诚,温皓杰,李鑫星,傅泽田,吕雄杰,张领先. 2017

[5]融合BERT-WWM和注意力机制的茶叶知识图谱构建. 刘永波,黄强,高文波,何鹏,许钰莎. 2022

[6]基于词向量+BiLSTM+CRF的农业技术需求文本实体提取. 宋林鹏,刘世洪,王翠. 2021

[7]一种自适应的Web信息抽取规则自动生成方法. 黄锋,吴华瑞. 2010

[8]村镇产业信息自动获取与可视化展示方法. 彭程,吴华瑞,朱华吉. 2011

[9]文本挖掘技术在农业知识服务中的应用述评. 孙坦,丁培,黄永文,鲜国建. 2021

[10]基于词性标注规则的马铃薯文献信息抽取方法. 王腾阳,赵小丹,胡林. 2023

[11]基于Web的农业信息自动抽取方法研究. 王文生,谢能付. 2007

[12]水稻本体实例构建研究. 李嘉锐,崔运鹏,张学福,苏晓路,郝心宁,鄂志国. 2014

[13]基于Web的农业知识问答系统研究. 钟娟,谢能付. 2007

[14]基于多语义信息融合的事件检测模型. 魏建香,陆谦,韩普,黄卫东. 2023

[15]地理标志农产品品牌管理政策注意力分析模型构建及应用. 霍梦佳,刘娟,黄杰. 2023

作者其他论文 更多>>