基于聚类权重分阶段的SVM解不平衡数据集分类
文献类型: 中文期刊
第一作者: 王超学
作者: 王超学;张涛;马春森
作者机构:
关键词: 不平衡数据集;权重分配模型;支持向量机(SVM)
期刊名称: 计算机工程与应用
ISSN: 1002-8331
年卷期: 2015 年 51 卷 21 期
页码: 133-137
收录情况: CSCD
摘要: SVM在处理不平衡数据分类问题(class imbalance problem)时,其分类结果常倾向于多数类。为此,综合考虑类间不平衡和类内不平衡,提出一种基于聚类权重的分阶段支持向量机(WSVM)。预处理时,采用K均值算法得到多数类中各样本的权重。分类时,第一阶段根据权重选出多数类内各簇边界区域的与少数类数目相等的样本;第二阶段对选取的样本和少数类样本进行初始分类;第三阶段用多数类中未选取的样本对初始分类器进行优化调整,当满足停止条件时,得到最终分类器。通过对UCI数据集的大量实验表明,WSVM在少数类样本的识别率和分类器的整体性能上都优于传统分类算法。
分类号: TP181
- 相关文献
[1]基于聚类权重分阶段的SVM解不平衡数据集分类. 张涛,马春森. 2014
[2]改进型加权KNN算法的不平衡数据集分类. 潘正茂,马春森,董丽丽,张涛. 2012
[3]大豆田间杂草的光谱识别研究. 邓巍,陈立平,孟志军,王秀,郭建华,武广伟,付卫强,张瑞瑞,陈天恩,徐刚. 2012
[4]利用成像高光谱区分冬小麦白粉病与条锈病(英文). 梁栋,刘娜,张东彦,赵晋陵,林芬芳,黄林生,张庆,丁玉婉. 2017
[5]SVM法定性鉴别奶牛饲料中脲醛树脂的可行性研究. 单杨,李高阳. 2011
[6]基于卷积神经网络模型的遥感图像分类. 付秀丽,黎玲萍,毛克彪,谭雪兰,李建军,孙旭,左志远. 2017
[7]一种处理非平衡数据集的优化随机森林分类方法. 马海荣,程新文. 2018
[8]面向不平衡数据集的改进型SMOTE算法. 张涛,马春森. 2014
[9]改进SVM-KNN的不平衡数据分类. 张涛,马春森. 2016
[10]改进SVM-KNN的不平衡数据分类. 张涛,马春森. 2014
作者其他论文 更多>>
-
河口鱼类生态廊道研究进展
作者:张婷婷;赵峰;王思凯;杨刚;张涛;袁瑞
关键词:河口鱼类;生态廊道;通道路径识别;生境保护修复
-
饲粮添加高蛋白牧草对黔东南小香鸡肠道菌群的影响
作者:张涛;陶小艳;冉江;唐远江;卢昱希;文正常;王璇;王庆红;刘艳
关键词:黔东南小香鸡;牧草;高通量测序;肠道微生物
-
15个燕麦品种萌发期耐旱、耐盐及耐碱性综合评价
作者:周超凡;魏玉清;杨崇庆;陈一鑫;陈岩;马政;张涛
关键词:燕麦品种;种子萌发期;耐旱性;耐盐性;耐碱性;综合评价
-
过热蒸汽预处理技术在油脂加工中的研究进展
作者:朱淼淼;刘园;牛佳钰;张茹茹;于淼;解梦汐;谢亮亮;郭红艳;张涛;郑立友
关键词:过热蒸汽;油料预处理;油脂品质;油料品质;稳定化
-
油菜精量播种关键技术与装备研究进展
作者:张涛;任桂英;代聪;唐兴隆;李磊
关键词:油菜;播种;排种器;离散元;进展
-
广元市曾家山高山蔬菜产业发展现状及高质量发展对策建议
作者:黎莉;张涛;牟文平;徐志勇;苗明军;张河庆;侯春霞;孙学琴;范秀华
关键词:高山蔬菜;高质量;发展现状;对策建议
-
水生生物资源增殖放流的发展历程与问题思考
作者:庄平;赵峰;罗刚;张涛;石小涛;冯广朋;王思凯
关键词:水生生物资源衰退;增殖放流;种群结构调整;生态容纳量;生活史;水产品供给;生态平衡