基于自动标引的自然语言检索方法研究

文献类型: 中文期刊

第一作者: 王丹

作者: 王丹;杨晓蓉;马健

作者机构:

关键词: 转换、自动赋予标引词的主题词、同义词、近义词、相关词和网罗词,完成标引词的概念控制。自动标引的一般方法[8]有基于字符串匹配的分词方法,基于理解的分词方法和基于统计的分词方法。基于字符串匹配的分词方法是按照一定的策略将待分析的汉字串与词典中的词条进行匹配,匹配成功则给出一个标引词。按照扫描方向的不同,可分为正向匹配和逆向匹配;按照不同长度优先匹配的不;自动标引;自然语言检索;方法

期刊名称: 图书馆杂志

ISSN: 1000-4254

年卷期: 2016 年 06 期

页码: 66-72

收录情况: 北大核心 ; CSSCI

摘要: 自从自然语言进入计算机检索系统以来,就因其不受不同职业、不同知识背景、不同检索经验的影响等特点受到终端用户的青睐。由于中文文献的标题是中文文献内容的集中体现,它反映了文献的中心思想。本文介绍的自然语言检索方法,限定在文献标题层面进行主题标引。该方法的基本思想是用自动标引方法分别对检索系统中数据库的文献标题和用于检索的自然语言进行自动赋词标引,对给定的关键词进行概念控制,即词义转换,形成最终标引词;然后,用向量空间模型对数据库的索引数据进行"或"运算检索,形成命中文献集合B,对B集合中的每篇文献标题再进行自动标引,形成的标引词与用于检索的自然语言标引词进行相似度计算,根据B集合中的每篇文献的相似度进行排序,把最符合检索要求的文献最先呈现给用户。此方法是一种简便、实用的自然语言检索方法。

分类号: G354

  • 相关文献

[1]自动标引中的歧义词消除方法研究. 王丹,杨晓蓉. 2014

[2]中文农业科技文献自动标引技术与实践. 王怀惠,王继华,吴泽宜,苏晓鸳,张彤. 1997

[3]农业信息智能处理与利用平台的设计与实现. 王文生,王丹,马健,李期位. 2005

[4]砂砾化斑块栽培胡枝子的几种方法试验. 孙娟,丛娟. 2005

[5]关于提高羊冷冻精液受胎率的输精方法探讨. 鲍志鸿,马惠海,巩俊明,李锋,杨德新,吴红艳. 2005

[6]事业单位财务管理存在的问题及解决办法. 刘文汇. 2014

[7]贵州有机茶园害虫综合防治原理与方法. 姚雍静. 2008

[8]事业单位对外投资核算方法研究. 任延辉,王吉艳. 2013

[9]蔬菜种子育苗前的处理. 李焕如. 2002

[10]菊花的繁殖方法. 王凤祥,王月娥,王雅芳,马长春. 2007

[11]科学研究方法在农业机械中的应用. 隋佳,付君,郭超,祝文超. 2011

[12]鸡的免疫接种方法. 王丽萍,王敏. 2015

[13]不同浓度木瓜蛋白酶和复合磷酸盐对鸡肉嫩度的影响. 宋玉,诸永志,徐幸莲,王道营,徐为民,刘芳. 2009

[14]基于Taguchi试验设计稻草发酵产纤维素酶的优化. 辛婷,谢逸萍,张兴,马代夫,王慧. 2009

[15]辣椒不同人工去雄方法比较研究. 李冠义,张艳飞,孟令强,崔聪聪. 2011

[16]加强对农业科研单位所属企业监管的途径和方法. 沈新芬. 2013

[17]谷子高产栽培技术. 韵晓茹. 2016

[18]玉米不同组织提取总蛋白浓度测定2种方法的比较. 杨文鹏,王伟,王明春,王秀影. 2014

[19]一种简易分离藻类的方法(英文). . 2010

[20]参与式方法在农村项目培训中的运用. 丁映,颜谦,黄萍,陈沫. 2010

作者其他论文 更多>>