基于改进文本表示的农产品贸易摩擦新闻文本聚类及应用展望

文献类型: 中文期刊

第一作者: 潘尧

作者: 潘尧;王末;王健

作者机构:

关键词: 农产品贸易摩擦;文本表示;词向量;文本聚类

期刊名称: 农业展望

ISSN: 1673-3908

年卷期: 2020 年 16 卷 006 期

页码: 80-88

摘要: 传统文本表示方法应用于农产品贸易摩擦新闻文本上,数据维度高、稀疏性较大、结构信息和语义信息表达不充分,会造成文本聚类时间复杂度和计算复杂度较大等问题.为解决这些问题,在Word2Vec词向量表示方法的基础上,结合TF-IDF表示新闻文本,提出基于关键词文本表示矩阵KTRM方法,通过深度学习聚类DEC模型进行文本聚类.在有标注的新闻语料上进行包括参数调节实验、文本表示方法对比实验和聚类方法对比实验,并应用于实际的农产品贸易摩擦新闻文本.结果 表明,该方法聚类精度ACC及标准化互信息NMI均有显著提高,验证了该方法的有效性.最后,对该方法的应用前景进行了展望.

分类号:

  • 相关文献

[1]基于词向量的检索扩展方法与农业领域实证. 吴蕾,梁晓贺,乌吉斯古楞,王瑞. 2019

[2]全球转基因抗虫玉米专利布局及对我国的发展建议. 贾倩,郑怀国,赵静娟. 2023

[3]微博主题发现研究方法述评. 梁晓贺,田儒雅,吴蕾,张学福. 2017

[4]国内外农业废弃物资源化利用技术对比研究. 贾倩,串丽敏,王爱玲,赵静娟,李凌云. 2023

作者其他论文 更多>>