基于改进SMOTE的非平衡数据集分类研究

文献类型: 中文期刊

第一作者: 王超学

作者: 潘正茂;董丽丽;马春森;张星

作者机构:

关键词: 非平衡数据集;分类;支持度;轮盘赌选择;合成少数过采样技术(SMOTE)

期刊名称: 计算机工程与应用

ISSN:

年卷期: 2012 年 02 期

页码: 184-187+245

收录情况: CSCD

摘要: 针对SMOTE(SyntheticMinorityOver-samplingTechnique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法(SSMOTE)。该算法的关键是将支持度概念和轮盘赌选择技术引入到SMOTE中,并充分利用了异类近邻的分布信息,实现了对少数类样本合成质量和数量的精细控制。将SSMOTE与KNN(K-NearestNeighbor)算法结合来处理不平衡数据集的分类问题。通过在UCI数据集上与其他重要文献中的相关算法进行的大量对比实验表明,SSMOTE在新样本的整体合成效果上表现出色,有效提高了KNN在非平衡数据集上的分类性能。

分类号:

  • 相关文献

[1]基于改进SMOTE的非平衡数据集分类研究. 潘正茂,董丽丽,马春森,张星. 2013

[2]中国南海美济礁和大亚湾水螅水母纲(刺胞动物门)三新种记述. 杜飞雁,林昭进,许振祖,黄加祺,郭东晖. 2013

[3]苹果品种抗寒测定方法的研究. 高爱农,赵锡温. 2000

[4]DNA分子标记在作物种质资源中的应用进展. 郭树春,安玉麟,李素萍,孙瑞芬,张艳芳,张启辰,闫素丽. 2007

[5]从分类和地理差异看亚洲栽培稻的耐盐性. 张尧忠,IDA,飞田哲,仙北俊弘,长峰司. 2000

[6]番茄种质资源分类和品种鉴定研究进展. 张永平,朱为民,崔辉梅. 2006

[7]苹果品种抗寒性测定方法的研究. 高爱农,姜淑荣,赵锡温,邓继光,沙守峰,刘志,张敏. 2000

[8]满江红属系统学研究的新进展. 陈坚,徐国忠. 2001

[9]饲料的分类与科学使用. 李润藩,李淑华. 2006

[10]我国的花生品种资源及其在育种上的利用. 栾文琪,顾淑媛. 1993

[11]贵州地方辣椒品种资源主要类别、分布及利用潜力. 任卫卫,付小松,张万萍,詹永发. 2015

[12]贵州辣椒主要地方品种资源的分类. 韩世玉,姜虹,杨红. 2008

[13]贵州久安古茶树资源的分类研究. 龚雪,杨春,郭燕,周顺珍,郑文佳. 2015

[14]竹黄的生物学特性及其药用价值的研究进展. 陈艺萌,周德群,刘作易,刘永翔. 2013

[15]8株国外引进的酿酒酵母菌的分类鉴定. 夏青,谢田,文红梅,刘永翔. 2007

[16]动物DNA条形码鉴定技术及其在害虫种类鉴定中的应用. 张莉,苏生,吕召云,孟泽洪. 2014

[17]东方蜜蜂的新亚种. 庄德安. 1989

[18]24份龙眼种质资源RAPD分析. 许奇志,李韬,陈秀萍,许秀淡,陈亮,郑少泉. 2008

[19]福建野生大豆生态分布及其分类. 刘德金,徐树传. 1991

[20]中国贵州灵芝科的分类研究. 吴兴亮,张小青,钟金霞,邹芳伦,连宾. 1994

作者其他论文 更多>>