中文农业科技文献自动标引技术与实践
文献类型: 中文期刊
第一作者: 王怀惠
作者: 王怀惠;王继华;吴泽宜;苏晓鸳;张彤
作者机构:
关键词: 自动标引;农业科技文献;中文;分词技术
期刊名称: 农业图书情报学刊
ISSN: 1002-1248
年卷期: 1997 年 03 期
页码: 50-54
摘要: 本文介绍了中文农业科技文献自动标引系统,它基于主题词、分类号、范畴代码和网罗词四位一体化词表,在文献标题句法分析的基础上,归纳出7个元标题模式,并应用其模式、主题词表、预匹配词表和停用词表进行预处理和分步匹配,综合采用了正向增字最长匹配算法、结合增字、跳字规则,前后缀扩充规则,模式匹配规则,末二字回溯算法以及自由词和特征词提取技术。系统分词准确率达到95%以上,具有词表维护自由词词频统计、显示浏览标引结果和标引测试等功能。具有主题词、分类号、范畴代码、网罗词以及自由词和特征词一体化自动标引功能。经过四个数据库数万篇文献的实际标引,标引速度达到4000篇/小时(题名)和3000篇/小时(题名加文摘,标引深度达到4.4(题名)和6.7(题名加文摘)个主题词和自由词,各项标引准确率达95%以上,标引环境为AST486/33微机。
分类号: G254.36
- 相关文献
[1]基于自动标引的自然语言检索方法研究. 王丹,杨晓蓉,马健. 2016
[2]自动标引中的歧义词消除方法研究. 王丹,杨晓蓉. 2014
[3]农业信息智能处理与利用平台的设计与实现. 王文生,王丹,马健,李期位. 2005
[4]基于开放式访问的农业科技文献公共服务平台建设初探. 李会萍,梁伟文,李泽,王晖,赵馨. 2009
[5]广东农业科技文献信息资源共建共享的现状与发展对策. 何绮云,曾志康,黄樑,万忠. 2007
[6]基于改进TF-IDF-CHI算法的农业科技文献文本特征抽取. 杜若鹏,鲜国建,寇远涛. 2019
[7]中文农业科技文献检索的常用方法和技巧. 任银玲,张莉. 2011
[8]省级农业科技文献共享服务平台的研建. 唐研,封文杰,仝雪芹,黎香兰,秦磊磊,王艳红,房毅. 2008
[9]四川农业科技文献信息资源共享平台设计与实现. 曹艳,李晓. 2009
作者其他论文 更多>>
-
金线莲苷的研究现状
作者:张闻婷;杨旻静;梅瑜;王继华
关键词:金线莲苷;提取;检测;人工合成;药理作用
-
穿心莲TCP基因家族全基因组鉴定及非生物胁迫下的表达分析
作者:张龙;徐世强;李静宇;胡学博;顾艳;王继华
关键词:穿心莲;TCP转录因子;基因家族;非生物胁迫
-
穿心莲分子生药学研究进展
作者:张龙;李静宇;徐世强;王继华
关键词:穿心莲;分子生药学;品质;有效成分;种质创新
-
云南曲靖和蒙自万寿菊主栽区有害生物调查与分析
作者:张艺萍;杨慈琳;许凤;钱绍方;张丽芳;王丽花;王继华;汤东生
关键词:万寿菊;病害;虫害;草害;调查
-
珍稀药用植物金线莲研究现状与展望
作者:张闻婷;梅瑜;王继华
关键词:金线莲;基因组学;环境响应;品质影响;胚胎繁殖
-
砂仁炭疽病及其致病病原菌研究进展
作者:邓权清;徐世强;梅瑜;顾艳;李静宇;王继华
关键词:砂仁;炭疽病;刺盘孢菌;真菌病害;防控措施
-
广宁县砂仁产业发展现状及对策
作者:胡爱群;邓权清;梅瑜;王继华
关键词:赤坑镇;砂仁;对策;发展现状