生成式情报学术语自动抽取与多维关联知识挖掘研究

文献类型: 中文期刊

第一作者: 胡昊天

作者: 胡昊天;邓三鸿;孔玲;闫晓慧;杨文霞;王东波;沈思

作者机构:

关键词: 情报学术语;术语自动抽取;文本生成;科学计量;热点分析

期刊名称: 情报学报

ISSN: 1000-0135

年卷期: 2024 年 43 卷 005 期

页码: 588-600

收录情况: 北大核心 ; CSCD ; CSSCI

摘要: 情报学术语承载了情报学科基础知识与核心概念.从概念维度梳理与分析情报学术语对推动学科发展、助力下游知识挖掘任务具有重要意义.面对数量快速增长的科技文献,自动术语抽取替代了人工筛选,但现有方法严重依赖大规模标注数据集,难以迁移至低资源场景.本文设计了一种生成式情报学术语抽取方法(generative term ex-traction for information science,GTX-IS),将传统基于序列标注的抽取式任务转化为序列到序列的生成式任务.结合小样本学习策略与有监督微调,提升面向特定任务的文本生成能力,能够在低资源有标签数据集场景下较为精准地抽取情报学术语.对于抽取结果,本文进一步开展了情报学领域术语发现及多维知识挖掘.综合运用全文科学计量与信息计量方法,从术语自身、术语间关联、时间信息等维度,对术语的出现频次、生命周期、共现信息等进行统计分析与知识挖掘.采用社会网络分析方法,结合时间维度特征,从术语角度出发,完善期刊的动态简介,探究情报学研究热点、演变历程和未来发展趋势.本文方法在术语抽取实验中的表现超越了全部13种主流生成式和抽取式模型,展现出较强的小样本学习能力,为领域信息抽取提供了新的思路.

分类号: TP391.1

  • 相关文献

[1]天然橡胶新兴趋势科学计量分析. 李一萍,胡小婵,谢龙莲,李晓娜,曾安逸,曾筱芬,王大鹏. 2020

[2]《山东农业科学》近十年期刊评价指标变化动态及学术影响力分析. 王丽丽,孟静,张丽荣,梅林,黄洁,陈庆禹,王磊,孔庆富,赵文祥. 2019

[3]2001-2018年农业领域国家科技奖励获奖成果分析. 王萌,刘涛,陈天金,郑床木. 2021

[4]农业科研机构作物学科科技竞争力评价研究. 袁雪,刘敏娟,王婷,颜蕴. 2016

[5]基于科学计量的2010—2014年兽医学科国家自然科学基金资助立项情况全面分析. 袁雪,刘敏娟,郑利莎,王婷,陈露,颜蕴. 2016

[6]基于科学计量的2010-2014年兽医学科国家自然科学基金资助立项情况全面分析. 袁雪,刘敏娟,郑利莎,王婷,陈露,颜蕴. 2016

[7]我国主要农业机构作物学科科技产出能力对比研究. 刘敏娟,袁雪,王婷,颜蕴,续玉红,陈露. 2015

[8]基于科学计量的天然橡胶学科领域前沿热点分析. 李一萍,茶正早,王大鹏. 2020

[9]基于知识图谱的我国"三农"研究现状及热点分析. 黄丽芸. 2019

[10]成都郊区农业土地利用空间集聚及斑块变化特征分析. 蒋怡,董秀春,李宗南,刘忠友,任国业,李章成. 2022

[11]南海北部海域大眼鲷空间自相关性. 刘禹希,王学锋,吕少梁,曾嘉维,陈国宝. 2021

[12]四川盆地莲藕种植遥感提取及热点区域分析. 蒋怡,董秀春,刘忠友,李宗南,黄平,任国业,王小燕. 2023

[13]基于卫星AIS的中西太平洋金枪鱼延绳钓渔场分布研究. 原作辉,杨东海,樊伟,张胜茂. 2018

[14]基于Citespace的农村集体经济研究进展与热点分析. 刘大伟,赵鑫. 2024

[15]基于卫星船位数据的北太平洋作业渔船分布及类型研究. 孙永文,张胜茂,唐峰华,王书献,樊伟,范秀梅,杨胜龙. 2022

[16]基于CNKI的中国猪圆环病毒病研究文献分析. 李立虎,陈磊,江懿,任竹. 2016

[17]基于空间自相关的东海带鱼聚集特征年代际变化. 袁兴伟,刘尊雷,金艳,崔学森,周为峰,程家骅. 2017

作者其他论文 更多>>