基于Nutch农业搜索引擎的研究与设计

文献类型: 中文期刊

第一作者: 周鹏

作者: 周鹏;吴华瑞;赵春江;杨宝祝;朱华吉

作者机构:

关键词: Nutch;搜索引擎;农业词典;主题过滤;网页排序

期刊名称: 计算机工程与设计

ISSN: 1000-7024

年卷期: 2009 年 03 期

页码: 96-98

收录情况: 北大核心 ; CSCD

摘要: 针对目前通用搜索引擎对专门领域及特定主题信息覆盖率较低,在开源的Nutch搜索引擎架构的基础上,通过Hash索引在多语种农业叙词表AGROVOC上进行农业词典的构建,利用已有的空间向量算法进行农业相关度计算,并结合Page-Rank的改进算法对结果综合排序,搭建了一个面向互联网上农业相关信息资源的搜索引擎。相对于通用搜索引擎来说减少了搜索结果的信息量,提高了搜索速度,同时提高了专业信息搜索的准确率。

分类号: TP391.3

  • 相关文献

[1]基于Nutch框架的农业信息垂直搜索引擎研究与设计. 高亮亮,阮怀军,陈英义. 2015

[2]基于农业垂直搜索引擎中文分词词典的构建研究. 张启宇,于辉辉,陈英义,王磊. 2015

[3]WEB信息检索与WEB数据挖掘. 刘振岩,王万森,陈立平. 2003

[4]因特网上中英文ontology网页文献量增长特征. 常春. 2005

[5]高效FTP搜索引擎的设计与实现. 郭立力,赵春江. 2009

[6]基于Lucene的“农搜”并行索引技术研究. 樊景超,周国民. 2009

[7]“农搜”系统的研发与应用. 周国民,樊景超,张静,丘耘. 2009

[8]基于Multi-Agent跨库检索系统的开发与应用. 姜丽华,张宏斌,杨晓蓉. 2006

[9]互联网上农业外文资源的利用. 唐研,封文杰. 2007

[10]如何有效地在互联网上获取棉花信息. 师维军,乌买尔江,徐利民. 2003

[11]基于遗传算法的主题爬虫策略. 刘国靖,康丽,罗长寿. 2007

[12]Google应用技巧. 常春. 2004

[13]利用虚拟图书馆和“农搜”检索农业科技信息. 张子良. 2011

[14]网络信息检索存在的问题及发展方向. 常春. 2003

[15]基于概念空间的领域信息爬虫设计研究. 谢能付,王文生,段延娥. 2008

[16]国家农业科学数据中心站内搜索引擎技术研究. 王剑,周国民,丘耘,王健. 2011

[17]搜索引擎用户体验"定制化"交互及优化策略. 胡起靖,董宏标. 2024

[18]基于Multi-Agent跨库检索系统的设计与实现. 姜丽华,张宏斌,杨晓蓉. 2006

作者其他论文 更多>>