面向不平衡数据集的改进型SMOTE算法

文献类型: 中文期刊

第一作者: 王超学

作者: 张涛;马春森

作者机构:

关键词: 不平衡数据集;分类;遗传算子;少数类样本合成过采样技术(SMOTE)

期刊名称: 计算机科学与探索

ISSN: 1673-9418

年卷期: 2014 年 06 期

页码: 727-734

收录情况: 北大核心

摘要: 针对SMOTE(synthetic minority over-sampling technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法GA-SMOTE。该算法的关键将是遗传算法中的3个基本算子引入到SMOTE中,利用选择算子实现对少数类样本有区别的选择,使用交叉、变异算子实现对合成样本质量的控制。结合GA-SMOTE与SVM(support vector machine)算法来处理不平衡数据的分类问题。UCI数据集上的大量实验表明,GA-SMOTE在新样本的整体合成效果上表现出色,有效提高了SVM在不平衡数据集上的分类性能。

分类号: TP18

  • 相关文献

[1]改进型加权KNN算法的不平衡数据集分类. 潘正茂,马春森,董丽丽,张涛. 2012

[2]基于聚类权重分阶段的SVM解不平衡数据集分类. 王超学,张涛,马春森. 2015

[3]一种处理非平衡数据集的优化随机森林分类方法. 马海荣,程新文. 2018

[4]改进SVM-KNN的不平衡数据分类. 张涛,马春森. 2016

[5]基于聚类权重分阶段的SVM解不平衡数据集分类. 张涛,马春森. 2014

[6]改进SVM-KNN的不平衡数据分类. 张涛,马春森. 2014

[7]中国南海美济礁和大亚湾水螅水母纲(刺胞动物门)三新种记述. 杜飞雁,林昭进,许振祖,黄加祺,郭东晖. 2013

[8]苹果品种抗寒测定方法的研究. 高爱农,赵锡温. 2000

[9]DNA分子标记在作物种质资源中的应用进展. 郭树春,安玉麟,李素萍,孙瑞芬,张艳芳,张启辰,闫素丽. 2007

[10]从分类和地理差异看亚洲栽培稻的耐盐性. 张尧忠,IDA,飞田哲,仙北俊弘,长峰司. 2000

[11]番茄种质资源分类和品种鉴定研究进展. 张永平,朱为民,崔辉梅. 2006

[12]苹果品种抗寒性测定方法的研究. 高爱农,姜淑荣,赵锡温,邓继光,沙守峰,刘志,张敏. 2000

[13]满江红属系统学研究的新进展. 陈坚,徐国忠. 2001

[14]饲料的分类与科学使用. 李润藩,李淑华. 2006

[15]我国的花生品种资源及其在育种上的利用. 栾文琪,顾淑媛. 1993

[16]贵州地方辣椒品种资源主要类别、分布及利用潜力. 任卫卫,付小松,张万萍,詹永发. 2015

[17]贵州辣椒主要地方品种资源的分类. 韩世玉,姜虹,杨红. 2008

[18]贵州久安古茶树资源的分类研究. 龚雪,杨春,郭燕,周顺珍,郑文佳. 2015

[19]竹黄的生物学特性及其药用价值的研究进展. 陈艺萌,周德群,刘作易,刘永翔. 2013

[20]8株国外引进的酿酒酵母菌的分类鉴定. 夏青,谢田,文红梅,刘永翔. 2007

作者其他论文 更多>>