中文农业科技文献自动标引技术与实践

文献类型: 中文期刊

第一作者: 王怀惠

作者: 王怀惠;王继华;吴泽宜;苏晓鸳;张彤

作者机构:

关键词: 自动标引;农业科技文献;中文;分词技术

期刊名称: 农业图书情报学刊

ISSN: 1002-1248

年卷期: 1997 年 03 期

页码: 50-54

摘要: 本文介绍了中文农业科技文献自动标引系统,它基于主题词、分类号、范畴代码和网罗词四位一体化词表,在文献标题句法分析的基础上,归纳出7个元标题模式,并应用其模式、主题词表、预匹配词表和停用词表进行预处理和分步匹配,综合采用了正向增字最长匹配算法、结合增字、跳字规则,前后缀扩充规则,模式匹配规则,末二字回溯算法以及自由词和特征词提取技术。系统分词准确率达到95%以上,具有词表维护自由词词频统计、显示浏览标引结果和标引测试等功能。具有主题词、分类号、范畴代码、网罗词以及自由词和特征词一体化自动标引功能。经过四个数据库数万篇文献的实际标引,标引速度达到4000篇/小时(题名)和3000篇/小时(题名加文摘,标引深度达到4.4(题名)和6.7(题名加文摘)个主题词和自由词,各项标引准确率达95%以上,标引环境为AST486/33微机。

分类号: G254.36

  • 相关文献

[1]基于自动标引的自然语言检索方法研究. 王丹,杨晓蓉,马健. 2016

[2]自动标引中的歧义词消除方法研究. 王丹,杨晓蓉. 2014

[3]农业信息智能处理与利用平台的设计与实现. 王文生,王丹,马健,李期位. 2005

[4]基于开放式访问的农业科技文献公共服务平台建设初探. 李会萍,梁伟文,李泽,王晖,赵馨. 2009

[5]广东农业科技文献信息资源共建共享的现状与发展对策. 何绮云,曾志康,黄樑,万忠. 2007

[6]基于改进TF-IDF-CHI算法的农业科技文献文本特征抽取. 杜若鹏,鲜国建,寇远涛. 2019

[7]中文农业科技文献检索的常用方法和技巧. 任银玲,张莉. 2011

[8]省级农业科技文献共享服务平台的研建. 唐研,封文杰,仝雪芹,黎香兰,秦磊磊,王艳红,房毅. 2008

[9]四川农业科技文献信息资源共享平台设计与实现. 曹艳,李晓. 2009

作者其他论文 更多>>