基于Heritrix+Solr的农业信息垂直搜索引擎研究与设计

文献类型: 中文期刊

第一作者: 郭承坤

作者: 郭承坤;陈国松;阮怀军;陈英义;屠星月

作者机构:

关键词: 农业垂直搜索引擎;Heritrix;Solr;中文分词;页面排序

期刊名称: 广东农业科学

ISSN: 1004-874X

年卷期: 2015 年 42 卷 05 期

页码: 139-144

收录情况: 北大核心 ; CSCD

摘要: 随着农业信息化、智能化的不断发展,农业信息量呈现井喷式增长,为广大农业从业者和农业科研人员提供便捷有效的信息检索方法是目前农业搜索引擎亟需解决的问题。为此,本文提出了基于Heritrix+Solr的农业信息垂直搜索引擎框架,并设计了适用于农业信息垂直搜索引擎的隐马尔科夫Web信息抽取模块和基于词典的mmseg4j中文分词模块,同时改进了页面排序算法,对进一步提升农业垂直搜索引擎的用户体验和工作效率具有一定的参考价值。

分类号: TP391.3

  • 相关文献

[1]基于Solr的中文农业期刊文摘检索系统的构建研究. 鲜国建,赵瑞雪. 2011

[2]基于农业垂直搜索引擎中文分词词典的构建研究. 张启宇,于辉辉,陈英义,王磊. 2015

[3]文章关键词和标题分词多样性及其绘制知识图谱的比较. 李继红,徐桂珍,江珊,王洪江. 2021

[4]渔业科学数据智能RSS阅读器的设计研究. 肖慧,王立华,徐硕,陈孟婕. 2013

作者其他论文 更多>>