您好,欢迎访问北京市农林科学院 机构知识库!

基于Nutch农业搜索引擎的研究与设计

文献类型: 中文期刊

作者: 周鹏 1 ; 吴华瑞 1 ; 赵春江 1 ; 杨宝祝 1 ; 朱华吉 1 ;

作者机构: 1.首都师范大学信息工程学院;国家农业信息化工程技术研究中心

关键词: Nutch;搜索引擎;农业词典;主题过滤;网页排序

期刊名称: 计算机工程与设计

ISSN: 1000-7024

年卷期: 2009 年 03 期

页码: 96-98

收录情况: 北大核心 ; CSCD

摘要: 针对目前通用搜索引擎对专门领域及特定主题信息覆盖率较低,在开源的Nutch搜索引擎架构的基础上,通过Hash索引在多语种农业叙词表AGROVOC上进行农业词典的构建,利用已有的空间向量算法进行农业相关度计算,并结合Page-Rank的改进算法对结果综合排序,搭建了一个面向互联网上农业相关信息资源的搜索引擎。相对于通用搜索引擎来说减少了搜索结果的信息量,提高了搜索速度,同时提高了专业信息搜索的准确率。

  • 相关文献

[1]WEB信息检索与WEB数据挖掘. 刘振岩,王万森,陈立平. 2003

[2]高效FTP搜索引擎的设计与实现. 郭立力,赵春江. 2009

[3]基于遗传算法的主题爬虫策略. 刘国靖,康丽,罗长寿. 2007

作者其他论文 更多>>