基于Lucene的“农搜”并行索引技术研究

文献类型: 中文期刊

第一作者: 樊景超

作者: 樊景超;周国民

作者机构:

关键词: Lucene;并行索引;搜索引擎

期刊名称: 农业网络信息

ISSN: 1672-6251

年卷期: 2009 年 2009 卷 08 期

页码: 30-31+50

摘要: Lucene作为高度优化的倒排索引搜索引擎为搜索向垂直化和专业行业化发展提供了可能,打破了搜索的高技术壁垒。但在实际应用过程中遇到了两个主要问题:①随着被索引文件的增多,索引时间成线性增长,导致建索引的过程会影响搜索体验;②搜索服务器的硬件门槛导致无法实现分布式索引。本文采用多台PC同时建索引再合并索引的方法形成了一个可扩展的搜索引擎解决方案。极大地缓解了建索引给搜索带来的问题。

分类号: S126

  • 相关文献

[1]国家农业科学数据中心站内搜索引擎技术研究. 王剑,周国民,丘耘,王健. 2011

[2]DSpace的检索机制及其扩展应用. 杜若鹏,赵瑞雪,朱亮,寇远涛,鲜国建. 2013

[3]基于Solr的中文农业期刊文摘检索系统的构建研究. 鲜国建,赵瑞雪. 2011

[4]WEB信息检索与WEB数据挖掘. 刘振岩,王万森,陈立平. 2003

[5]因特网上中英文ontology网页文献量增长特征. 常春. 2005

[6]高效FTP搜索引擎的设计与实现. 郭立力,赵春江. 2009

[7]基于Nutch农业搜索引擎的研究与设计. 周鹏,吴华瑞,赵春江,杨宝祝,朱华吉. 2009

[8]“农搜”系统的研发与应用. 周国民,樊景超,张静,丘耘. 2009

[9]基于Multi-Agent跨库检索系统的开发与应用. 姜丽华,张宏斌,杨晓蓉. 2006

[10]互联网上农业外文资源的利用. 唐研,封文杰. 2007

[11]如何有效地在互联网上获取棉花信息. 师维军,乌买尔江,徐利民. 2003

[12]基于遗传算法的主题爬虫策略. 刘国靖,康丽,罗长寿. 2007

[13]Google应用技巧. 常春. 2004

[14]利用虚拟图书馆和“农搜”检索农业科技信息. 张子良. 2011

[15]网络信息检索存在的问题及发展方向. 常春. 2003

[16]基于概念空间的领域信息爬虫设计研究. 谢能付,王文生,段延娥. 2008

[17]搜索引擎用户体验"定制化"交互及优化策略. 胡起靖,董宏标. 2024

[18]基于Multi-Agent跨库检索系统的设计与实现. 姜丽华,张宏斌,杨晓蓉. 2006

作者其他论文 更多>>