基于Benford-SVR的数据异常检验模型构建及其应用

文献类型: 中文期刊

第一作者: 李斐斐

作者: 李斐斐;周向阳;秦朗;葛章明;韩书庆;张晶;吴建寨

作者机构:

关键词: 数据质量;Benford定律;SVR;农业生产数据

期刊名称: 山东农业科学

ISSN: 1001-4942

年卷期: 2019 年 51 卷 7 期

页码: 136-142,155

摘要: 当前数据数量剧增的同时,大量异常数据的存在降低了数据质量,数据分析工作面临着数据丰富而信息贫乏的困境,寻找有效的数据异常检验模型,成为数据科学研究的重要内容.本研究以农业生产数据为对象,融合应用Benford定律与SVR模型的技术优势,构建Benford-SVR异常数据检验模型,并以河北省7个地市131个县为例进行实证分析.结果表明,沧州、邢台、邯郸的数据集质量较好,保定、石家庄、唐山、张家口数据集质量较差,并从中有效挖掘出异常较大的数据点.本研究结果为农业数据应用与信息提取提供了参考,Benford-SVR模型可以作为数据质量检验中精准挖掘异常点的有效工具.

分类号: S126`TP393

  • 相关文献

[1]基于支持向量回归(SVR)和多时相遥感数据的冬小麦估产. 黎锐,李存军,徐新刚,王纪华,杨小冬,黄文江,潘瑜春. 2009

[2]基于时间序列与横截面数据的吉林省水稻产量预测对比分析. 陈威,祁伟彦,袁福香,李哲敏. 2018

[3]冷链物联网监测数据质量评估与优化研究进展分析. 胡金有,王靖杰,朱志强,张小栓. 2019

[4]从数据质量到信息质量的发展. 宋立荣,李思经. 2010

[5]科研数据存档工作探析-以海洋渔业类科研院所为例. 于喆,杜静,高祥刚. 2021

作者其他论文 更多>>