基于朴素贝叶斯算法的水产类专利文本分类

文献类型: 中文期刊

第一作者: 范秀梅

作者: 范秀梅;张胜茂;岳冬冬

作者机构:

关键词: 朴素贝叶斯;文本分类;卡方检验

期刊名称: 渔业信息与战略

ISSN: 2095-3666

年卷期: 2014 年 29 卷 01 期

页码: 54-59

摘要: 本文选取公开日从1992年1月1日到2011年12月31日的水产类的9 894条失效专利作为数据挖掘的文本。从中选出56条专利,利用分词器对其摘要进行分词,并通过卡方检验的方法过滤掉与分类相关度比较小的词,形成词组矩阵。然后采用朴素贝叶斯的方法对这些矩阵进行训练并设计程序。使用训练过后的程序对失效专利进行分类测试,合格后再对所有的专利的摘要文本进行分类,并对分类结果进行了分析和验证。验证的结果表明该程序对文本进行分类的准确率达到了85%,达到了比较好的可信度,可以用它对文本分类。如此我们就可以把失效的水产类专利文本按照设定的类别进行归类,了解一个时间段它们的分布情况,为以后做决策提供参考。

分类号: S9-5

  • 相关文献

[1]基于朴素贝叶斯的西北太平洋柔鱼渔场预报模型的建立. 崔雪森,唐峰华,张衡,伍玉梅,樊伟. 2015

[2]基于改进TF-IDF-CHI算法的农业科技文献文本特征抽取. 杜若鹏,鲜国建,寇远涛. 2019

[3]人工神经网络在渔业高价值专利筛选中的应用-以中国水产科学研究院为例. 金武,王书磊,刘晓萌,夏晔,刘建伟. 2021

[4]地理标志农产品品牌管理政策注意力分析模型构建及应用. 霍梦佳,刘娟,黄杰. 2023

[5]基于BERT和深度主动学习的农业新闻文本分类方法. 石运来,崔运鹏,杜志钢. 2022

[6]回归模型分析中卡方(χ^2)检验的误用. 唐启义,王磊. 1997

[7]用Excel中的VBA编写卡方测算相关程序. 杨振宇,杨海智,杨信东. 2012

[8]用EXCEL中的VBA编写“质量性状遗传分析”相关程序及其在农业上的应用. 杨振宇,杨海智,杨信东. 2012

[9]R语言及在农业试验数据分析中的基本应用(二). 王磊,闵佳鑫,申红芳,鄂志国. 2022

[10]敌敌畏烟剂和异丙威烟剂对韭菜迟眼蕈蚊的室内毒力测定. 徐蕾,赵彤华,许国庆,刘培斌. 2018

作者其他论文 更多>>