文献类型: 中文期刊
作者: 张辉 1 ; 魏东 1 ; 乔璐 1 ; 李丹丹 1 ; 张玉尧 1 ; 郑国清 1 ; 冯晓 1 ;
作者机构: 1.河南省农业科学院农业经济与信息研究所
关键词: 工作流;统计年鉴;数据清洗;Alteryx;质量控制
期刊名称: 河南农业科学
ISSN: 1004-3268
年卷期: 2021 年 010 期
页码: 172-180
收录情况: 北大核心 ; CSCD
摘要: 为实现统计年鉴数据集成整合和综合快速查询,以2000—2018年《中国统计年鉴》及《河南统计年鉴》等全国31个省(市、区)统计年鉴为例,深入分析其数据特征后,采用Alteryx Designer 2019.2学习版,基于工作流技术,经过提取目录及文件、提取文件中的表单、提取表单中表的内容、数据清洗及规范、规范标识数据的6个维度、数据重组和数据输出共7个步骤构建了统计年鉴数据清洗模型。结果表明,在16 GB内存的笔记本电脑上,模型用时4~5 h即可将数据容量达21 GB、包含33万个文件、120万张表单的统计年鉴数据清洗并整合为1套包含6 000多万条指标数据序列的标准规范数据集。构建的数据清洗建模方法具有高效、可溯源的优势。
- 相关文献
[1]牛胚胎生产的全程质量控制. 徐照学,魏成斌,辛晓玲,贺文杰. 2004
[2]动物源性饲料的质量控制及安全性指标. 欧阳雅连,李明凤,侯自花. 2007
[3]DDGS在猪鸡日粮中的应用及其质量控制研究进展. 马慧慧,魏凤仙,徐彬,李绍钰. 2017
[4]蛋品色变的影响因素、形成机制及控制方法. YANG Jin-chu,杨金初,CHEN Li-juan,陈丽娟,LI Bin,李斌. 2013
作者其他论文 更多>>
-
基于深度学习的玉米包衣种子品种识别
作者:冯晓;张辉;刘正;张会芳;陈海燕;赵威;郑国清;马中杰
关键词:玉米;包衣种子;品种识别;可见光;深度学习
-
基于改进YOLOv5s的硬核期葡萄簇检测
作者:冯晓;张辉;刘运超;张微;李小红;马中杰
关键词:葡萄簇;目标检测;YOLOv5s算法;重参数化;注意力机制
-
芝麻蒴果表型数据采集研究进展
作者:赵巧丽;郑国清;张建涛;李国强
关键词:芝麻;蒴果;表型
-
河南省芝麻生产成本收益分析
作者:刘海礁;邱雅洁;周萌;郑国清
关键词:河南;芝麻;成本收益;适度规模经营;机械化生产
-
河南省农业科技应急服务能力建设研究
作者:王瑛;刘海礁;邱雅洁;杨帆;张辉;冯晓;张会芳
关键词:农业自然灾害;应急服务;问卷调查;河南省
-
基于无人机数字表面模型的冬小麦生物量估算模型构建及迁移能力分析
作者:郭燕;贺佳;曾凯;张彦;张红利;郑国清;王来刚
关键词:冬小麦;生物量;估算;无人机;株高;迁移能力
-
基于文献计量分析芝麻的研究热点与趋势
作者:刘海礁;邱雅洁;周萌;张辉;魏东;张会芳;田媛;付锦州;王瑛;郑国清
关键词:芝麻;文献计量分析;CiteSpace