您好,欢迎访问江苏省农业科学院 机构知识库!

生成式情报学术语自动抽取与多维关联知识挖掘研究

文献类型: 中文期刊

作者: 胡昊天 1 ; 邓三鸿 1 ; 孔玲 1 ; 闫晓慧 1 ; 杨文霞 1 ; 王东波 1 ; 沈思 1 ;

作者机构: 1.江苏省农业科学院;南京大学信息管理学院;数据工程与知识服务省高校重点实验室(南京大学);山东理工大学信息管理学院;南京农业大学信息管理学院;南京理工大学经济管理学院

关键词: 情报学术语;术语自动抽取;文本生成;科学计量;热点分析

期刊名称: 情报学报

ISSN: 1000-0135

年卷期: 2024 年 43 卷 005 期

页码: 588-600

收录情况: 北大核心 ; CSCD ; CSSCI

摘要: 情报学术语承载了情报学科基础知识与核心概念.从概念维度梳理与分析情报学术语对推动学科发展、助力下游知识挖掘任务具有重要意义.面对数量快速增长的科技文献,自动术语抽取替代了人工筛选,但现有方法严重依赖大规模标注数据集,难以迁移至低资源场景.本文设计了一种生成式情报学术语抽取方法(generative term ex-traction for information science,GTX-IS),将传统基于序列标注的抽取式任务转化为序列到序列的生成式任务.结合小样本学习策略与有监督微调,提升面向特定任务的文本生成能力,能够在低资源有标签数据集场景下较为精准地抽取情报学术语.对于抽取结果,本文进一步开展了情报学领域术语发现及多维知识挖掘.综合运用全文科学计量与信息计量方法,从术语自身、术语间关联、时间信息等维度,对术语的出现频次、生命周期、共现信息等进行统计分析与知识挖掘.采用社会网络分析方法,结合时间维度特征,从术语角度出发,完善期刊的动态简介,探究情报学研究热点、演变历程和未来发展趋势.本文方法在术语抽取实验中的表现超越了全部13种主流生成式和抽取式模型,展现出较强的小样本学习能力,为领域信息抽取提供了新的思路.

  • 相关文献
作者其他论文 更多>>