基于改进文本表示的农产品贸易摩擦新闻文本聚类及应用展望
文献类型: 中文期刊
第一作者: 潘尧
作者: 潘尧;王末;王健
作者机构:
关键词: 农产品贸易摩擦;文本表示;词向量;文本聚类
期刊名称: 农业展望
ISSN: 1673-3908
年卷期: 2020 年 16 卷 006 期
页码: 80-88
摘要: 传统文本表示方法应用于农产品贸易摩擦新闻文本上,数据维度高、稀疏性较大、结构信息和语义信息表达不充分,会造成文本聚类时间复杂度和计算复杂度较大等问题.为解决这些问题,在Word2Vec词向量表示方法的基础上,结合TF-IDF表示新闻文本,提出基于关键词文本表示矩阵KTRM方法,通过深度学习聚类DEC模型进行文本聚类.在有标注的新闻语料上进行包括参数调节实验、文本表示方法对比实验和聚类方法对比实验,并应用于实际的农产品贸易摩擦新闻文本.结果 表明,该方法聚类精度ACC及标准化互信息NMI均有显著提高,验证了该方法的有效性.最后,对该方法的应用前景进行了展望.
分类号:
- 相关文献
[1]基于词向量的检索扩展方法与农业领域实证. 吴蕾,梁晓贺,乌吉斯古楞,王瑞. 2019
[2]全球转基因抗虫玉米专利布局及对我国的发展建议. 贾倩,郑怀国,赵静娟. 2023
[3]微博主题发现研究方法述评. 梁晓贺,田儒雅,吴蕾,张学福. 2017
[4]国内外农业废弃物资源化利用技术对比研究. 贾倩,串丽敏,王爱玲,赵静娟,李凌云. 2023
作者其他论文 更多>>
-
智慧果园关键应用场景研究进展
作者:吴建伟;张琳;郑文刚;秦向阳;吴忠高;方锡红;王永泉;芦天罡;王健;朴香淑;王芳;岳巧云;张海合;季婧;丛小蔓;李奇峰
关键词:智慧果园;大数据;模型;数智化
-
基于大语言模型的智能问答系统研究综述
作者:任海玉;刘建平;王健;顾勋勋;陈曦;张越;赵昌顼
关键词:大语言模型;智能问答;自然语言处理;检索增强生成;提示学习;知识图谱
-
水稻DMP1、DMP2、DMP3基因突变体的创制及其单倍体诱导能力鉴定
作者:胡风越;王健;王春;王克剑;刘朝雷
关键词:水稻;单倍体诱导;DMP;Os MTL
-
基于Fuzzy-PID的棉花打顶升降装置设计与试验
作者:薛星星;胡斌;贾首星;王健
关键词:棉花打顶机;升降装置;高度控制;模糊PID;仿真研究
-
玉溪市柑桔主产区综合比较优势分析研究
作者:李冬云;倖华珍;魏永葵;邝应聪;魏丹;施云庭;马晶;赵美琼;代龙彪;王娅;赵映莲;鲁鹏;王健;姚万福;陶磅
关键词:玉溪市;柑桔;主产区;比较优势
-
13份姜荷花品种花粉形态观察
作者:石丁蓉;冷青云;谌振;黄素荣;奚良;张琼尹;王健;杨光穗
关键词:姜荷花;花粉形态;扫描电镜;倍性鉴定
-
科学数据安全标准研究与工作建议
作者:廖方宇;胡良霖;王健;王志强;甘杰夫
关键词: