文献类型: 中文期刊
作者: 李昀 1 ; 邓颖 2 ; 吴华瑞 2 ;
作者机构: 1.北京市农林科学院
2.国家农业信息化工程技术研究中心
关键词: 农业信息搜索引擎;语义相似度;word2vec;doc2vec;tf-idf;文本智能搜索
期刊名称: 西南师范大学学报(自然科学版)
ISSN: 1000-5471
年卷期: 2020 年 009 期
页码: 43-50
收录情况: 北大核心 ; CSCD
摘要: 在农业科研办公过程中,科研人员进行信息检索的频率高,信息需求精度高,但传统的综合性搜索引擎检索农业实用技术、政策法规、专题数据等方向性比较强的农业信息,通常返回结果数据量庞大、主旨范围宽泛,导致内容不精准、搜索面太广,筛选结果专业性不足;且现阶段主流的农业领域的垂直搜索引擎的搜索策略主要建立在传统的文本检索上,在自身领域数据量有限的情况下,搜索结果查全率不高,且搜索结果没有排序依据(大多仅仅按信息发生时间为排序依据).本文对农业互联网信息搜索引擎进行了研究,通过对各级农业管理部门网站、农业科研院所网站、农业新闻网站、农业商业网站等数据源的模块进行定位,通过爬虫进行数据更新检测与定时抓取,从数据源上有效减少不相关信息;基于数百个互联网数据源农业相关模块的信息抽取,采用word2vec和本文提出的基于文本特征表达的doc2vec,分别创建农业词向量、文档向量空间,用来应对搜索关键词为无序词组和有序语句的搜索场景,确保垂直搜索的智能和返回结果的准确.经过实验验证,本文提出的doc2vec+tf-idf搜索算法能够在有序搜索中达到较高的准确率,结合word2vec进行的无序搜索,有针对地进行语义搜索,可以进一步提高搜索引擎的查准率,满足日益增长的对农业领域信息搜索的高效高质的需求.
- 相关文献
[1]农村土地利用数据集成的模式匹配方法. 王强,吴华瑞,朱华吉,王育红. 2014
作者其他论文 更多>>
-
农业大模型:关键技术、应用分析与发展方向
作者:郭旺;杨雨森;吴华瑞;朱华吉;缪祎晟;顾静秋
关键词:生成式人工智能;大模型;农业知识服务;机器学习;自主决策;多模态;深度学习
-
融合时间感知和增强过滤的农业知识推荐模型
作者:王鹏哲;朱华吉;缪祎晟;刘畅;吴华瑞
关键词:农业知识推荐;滤波器算法;时间感知;自注意力网络;序列推荐
-
基于连续提示注入与指针网络的农业病害命名实体识别
作者:王春山;张宸硕;吴华瑞;朱华吉;缪祎晟;张立杰
关键词:农业病害;命名实体识别;连续提示;指针网络;嵌套实体;预训练语言模型
-
基于改进UperNet的结球甘蓝叶球识别方法
作者:朱轶萍;吴华瑞;郭旺;吴小燕
关键词:结球甘蓝;语义分割;叶球识别;注意力机制;特征选择;特征对齐
-
基于改进YOLOv8s的大田甘蓝移栽状态检测算法
作者:吴小燕;郭威;朱轶萍;朱华吉;吴华瑞
关键词:甘蓝移栽;YOLOv8s;目标检测;多尺度注意力机制;可变形卷积
-
海南夏季蔬菜高效生产技术规程
作者:尚庆茂;张锋;吴华瑞;廖道龙;罗丰;孙晓东;庞强强;伍壮生;陈贻诵
关键词:夏季蔬菜;抗病丰产;南菜北运;生产技术规程;夏季高温;集约化育苗;病虫害;自给率
-
基于RoFormer预训练模型的指针网络农业病害命名实体识别
作者:王彤;王春山;李久熙;朱华吉;缪祎晟;吴华瑞
关键词:农业病害;命名实体识别;实体嵌套;RoFormer预训练模型;指针网络