科研实体名称规范的研究与实践
文献类型: 中文期刊
第一作者: 张建勇
作者: 张建勇;钱力;于倩倩;董智鹏;黄永文;刘建华;郭舒;王峰
作者机构:
关键词: 名称规范;期刊规范;机构规范;基金规范;作者规范
期刊名称: 数据分析与知识发现
ISSN: 1003-3513
年卷期: 2019 年 1 期
页码: 27-37
摘要: [目的]建立机构规范、作者规范、期刊规范、基金规范,为发现系统、科研实体分析评价等建立数据基础.[方法]以多源异构数据为基础,对数据进行汇聚和融合,形成具有唯一标识符的统一的结构化数据.依据名称规范元数据模型,对科研实体及实体间的关系进行抽取.针对不同的科研实体可获取的文献特征,制定不同的消歧规则集合,结合传统字符串匹配方法和深度学习方法进行文本相似度计算.[结果]形成包含260多万条数据的机构规范库、2 300多万条数据的作者规范库、3万多条数据的期刊规范库和200多万条数据的基金规范库.以NSTL机构规范为例,与InCites机构规范进行对比,结果显示所遴选的美、英、中3个国家的6所高校,对标吻合度平均值达到86.8%.[局限]所提出的消歧规则和算法在处理文献特征表达形式多样性方面有待进一步细化和提升;需对具体数据源数据情况进行分析,以选择合适的算法模型.[结论]本研究提出了多源异构数据汇聚融合方法,设计了科研实体消歧规则和算法,能够有效实现名称规范数据库建设的规范性和全面性.
分类号: G254
- 相关文献
作者其他论文 更多>>
-
四川宜宾稻米品质的影响因素及稻谷优质生产的综合技术解析
作者:包灵丰;江青山;张英;赵德明;贺兵;陈家彬;张杰;廖宗永;姜方洪;王峰;韩冬;李恒进;邬相宏
关键词:四川宜宾;稻米品质;影响因素;综合技术;解析
-
浅谈观赏桃在园林景观中的应用
作者:王峰;黄慧敏;吴金龙;王玲玲
关键词:观赏桃;品种资源;智慧园林;文化景观;生态环境
-
学术期刊图文摘要研究及启示——以农业领域为例
作者:黄永文;孙坦;鲜国建;李娇
关键词:图文摘要;可视化摘要;农业期刊
-
以文化特色破解辽宁省乡村旅游同质化问题研究
作者:于倩倩;潘百涛
关键词:文化特色;乡村旅游;辽宁省;同质化
-
茉莉花茶加工技术及风味品质研究进展
作者:崔宏春;赵芸;黄海涛;李红莉;余继忠;张建勇;吴云迪
关键词:茉莉花茶;加工;窨制;风味;品质评价;形成机理
-
基于全基因组重测序研究文昌鸡产蛋性能的影响因素
作者:任钰为;陈星;林燕宁;黄潇仙;洪玲玲;王峰;孙瑞萍;张艳;刘海隆;郑心力;晁哲
关键词:文昌鸡;全基因组重测序;遗传选择;产蛋性能;影响因素
-
海藻寡糖在绿色农业发展中的研究与应用
作者:吴宇凡;王鸿睿;樊浩杰;郭锋骁;徐雪人;王峰;李聪
关键词:海藻寡糖;寡糖制备;寡糖功效;增产提质;绿色农业