古农文语义检索模型构建及其应用研究

文献类型: 中文期刊

第一作者: 刘楠竹

作者: 刘楠竹;崔运鹏;王末

作者机构:

关键词: 古农文;语义检索;对比学习;模型构建;深度学习

期刊名称: 农业图书情报学报

ISSN: 1002-1248

年卷期: 2023 年 35 卷 007 期

页码: 52-62

摘要: [目的/意义]构建能实现以白话文作为查询,系统自动返回与输入最相关的古农文段落的语义检索模型,为学者提供更加便利的古代农业知识检索方式和古代农业知识溯源方式.[方法/过程]使用基于四库全书作为训练语料的SikuBERT作为基础模型,基于对比学习的方法,使用自建的古农文数据集对模型进行继续训练,得到能够支持使用白话文作为查询,返回与查询语义最相似的古农文段落的语义检索模型.[结果/结论]古农文语义检索模型的Spearman系数在测试集上的表现能够达到 86.51%,较基线模型在测试集上的表现 83.69%有一定程度的提升,在自建的古农文检索测试集上的召回情况(recall@k)较基线模型有一定程度提升,模型在古农文上能够有比较好的检索效果.但受限于古农文训练语料规模,模型的训练效果还有很大提升空间.

分类号: TP391

  • 相关文献

[1]基于深度学习的方志物产资料实体自动识别模型构建研究. 徐晨飞,叶海影,包平. 2020

[2]基于对比学习的植物叶片病害识别. 杨新宇,冯全,张建华,杨森. 2024

[3]基于生成对抗网络和视觉-语义对齐的零样本害虫识别方法. 李天俊,杨信廷,陈晓,胡焕,周子洁,李文勇. 2024

[4]农业生产技术本体构建与语义检索实现. 宗南苏,何绮云,郑业鲁,钱平. 2009

[5]一种基于本体的移动学习资源语义检索模型. 刘艺,万蓉,裴新涌,戴爱梅. 2015

[6]农业科学叙词表的SKOS转化及其应用研究. 鲜国建,赵瑞雪,朱亮,寇远涛. 2012

[7]1~2年生浙南绿竹地上生物量分配与模型构建. 夏海涛,王月英,李效文,卢小琴,林化忠. 2014

[8]基于Pro/E的四杆机构设计与运动分析. 李艳芳,卢绪振. 2013

[9]芝麻株高和叶龄对盛花期渍水响应的定量分析. 李国强,张建涛,李亚丽,周萌,陈丹丹,胡峰,辛银平,郑国清. 2020

[10]中国农产品膳食暴露评估模型构建初探. 宋雯,陈志军,钱永忠,徐辰武,刘贤金. 2014

[11]云南水稻直链淀粉含量近红外模型的创建研究. 陈建华,郭咏梅,刘义富,辜琼瑶,谭春艳,刘小丽,卢义宣. 2008

[12]渔船渔港综合管理服务平台构建与应用. 薛沐涵,徐硕,鲁峰,朱勇,吴建光,王义刚. 2021

[13]在普洱茶产地溯源中化学计量学工具的应用研究. 林昕,沙岭杰,兰珊珊,林涛,魏茂琼,和丽忠,刘宏程. 2015

[14]基于LUCC的兰州城市生态系统服务价值动态分析. 林栋,马晖玲,任正超,李元恒. 2016

[15]小麦籽粒蛋白质光谱特征变量筛选方法研究. 李栓明,郭银巧,王克如,谢瑞芝,戴建国,肖春华,李静,李少昆. 2015

[16]烤后烟叶不同部位高光谱特征分析及判别模型构建. 闫鼎,张义志,程森,蔡宪杰,董祥洲,杨悦章,岳耀稳,王大彬,林润英. 2024

[17]基于特征香气的白茶香气品质评价模型构建初探. 张应根,陈林,陈泉宾,王秀萍,王振康,王丽丽. 2017

[18]基于全透射可见-近红外光谱的西瓜糖度在线检测研究. 王贺功,黄文倩,蔡仲磊,严忠伟,黎胜,李江波. 2024

[19]中红外光谱土壤有机质含量估测研究进展. 张霄羽,姚艳敏,颜祥照. 2021

[20]基于BSC和AHP的农业科技创新团队绩效评价模型构建. 单成俊,吴云良,戴云云,王永霞,沈建新. 2013

作者其他论文 更多>>