您好,欢迎访问中国水产科学研究院 机构知识库!

基于朴素贝叶斯算法的水产类专利文本分类

文献类型: 中文期刊

作者: 范秀梅 1 ; 张胜茂 2 ; 岳冬冬 2 ;

作者机构: 1.中国水产科学研究院东海水产研究所

2.中国水产科学研究院东海水产研究所,中国水产科学研究院渔业资源遥感信息技术重点开放实验室

关键词: 朴素贝叶斯;文本分类;卡方检验

期刊名称: 渔业信息与战略

ISSN: 2095-3666

年卷期: 2014 年 29 卷 01 期

页码: 54-59

摘要: 本文选取公开日从1992年1月1日到2011年12月31日的水产类的9 894条失效专利作为数据挖掘的文本。从中选出56条专利,利用分词器对其摘要进行分词,并通过卡方检验的方法过滤掉与分类相关度比较小的词,形成词组矩阵。然后采用朴素贝叶斯的方法对这些矩阵进行训练并设计程序。使用训练过后的程序对失效专利进行分类测试,合格后再对所有的专利的摘要文本进行分类,并对分类结果进行了分析和验证。验证的结果表明该程序对文本进行分类的准确率达到了85%,达到了比较好的可信度,可以用它对文本分类。如此我们就可以把失效的水产类专利文本按照设定的类别进行归类,了解一个时间段它们的分布情况,为以后做决策提供参考。

  • 相关文献

[1]基于朴素贝叶斯的西北太平洋柔鱼渔场预报模型的建立. 崔雪森,唐峰华,张衡,伍玉梅,樊伟. 2015

[2]人工神经网络在渔业高价值专利筛选中的应用-以中国水产科学研究院为例. 金武,王书磊,刘晓萌,夏晔,刘建伟. 2021

作者其他论文 更多>>