基于hadoop和mahout的聚类系统的研究与实现

文献类型: 中文期刊

第一作者: 赵军敏

作者: 赵军敏;黄焯;张维纬

作者机构:

关键词: hadoop;mahout;大数据;聚类;HDFS;MapReduce

期刊名称: 福建电脑

ISSN: 1673-2782

年卷期: 2017 年 01 期

页码: 6-7+14

摘要: 随着云计算,物联网以及移动互联网的快速发展,随之产生的数据量也急速膨胀,如何从海量的数据中挖掘出自己所需的信息尤为重要,聚类是解决该问题的重要途径之一。一方面,网络上不断产生大量的文档数据,这些数据量已经远远地超过了人们对信息的利用能力。云计算的出现为数据挖掘打开了一扇新世界的大门。通过搭建hadoop和mahout平台,讨论基于hadoop和mahout聚类系统的实现,可以看出Mahout是一个处理大数据的优秀平台。

分类号: TP311.13

  • 相关文献

[1]面向农业科学数据的分布式存储方法研究. 王剑,黄朝光,王健,刘少坤,柴进. 2016

[2]基于Hadoop的气象大数据分析GIS平台设计与试验. 李涛,冯仲科,孙素芬,程文生. 2019

[3]国内外农业大数据应用研究分析. 黎玲萍,毛克彪,付秀丽,马莹,王芳,刘勍. 2016

[4]基于Hadoop的大数据基础平台搭建与西藏农业应用构想. 尹中江. 2019

[5]农业海量信息资源管理平台设计与实现. 孙想,吴华瑞,李庆学. 2015

[6]基于云计算的农作物种质资源数据挖掘平台研究. 潘恺,方沩,陈丽娜,曹永生. 2015

[7]农业大数据平台的研究进展与应用现状. 王丽娟,信丽媛,贾宝红,原少辉. 2018

[8]基于Hadoop的农技推广数据存储平台设计. 汪浩,王文生,冯阳. 2015

[9]海量农业科学数据存储体系架构与方法研究. 王剑,黄朝光. 2015

[10]云环境下农业产销信息匹配推荐平台设计与实现. 陈涛,刘世洪,郑火国,胡海燕,王烁,马涛. 2014

[11]吉林省水稻品种品质的研究Ⅳ.吉林省优质品种的系谱及品质聚类分析. 张三元,李彻,张俊国,赵劲松,石玉海. 2000

[12]柞蚕主要性状主成分聚类分析与综合评价. 徐亮,孟宪民,戚俐,焦阳,钟亮. 2018

[13]普通杏(Prunus armeniaca)初级核心种质资源的构建及评价. 章秋平,刘威生,刘宁,张玉萍,郁香荷,孙猛,徐铭. 2009

[14]辽宁省主要稻区水稻新品种品质性状的主成分及聚类分析. 姜秀英,于永梅,王铮,韩勇,刘军,张悦. 2009

[15]波兰桑蚕品种的综合评价与聚类分析. 吴艳,蔡兴忱,李喜升,仝振祥,石淑萍. 2016

[16]51份红三叶种质资源萌发期耐铜性评价. 赵思怡,陈菲,张鹤山,张志飞. 2019

[17]滇牡丹不同采种区种苗质量评价. 苏泽春,薛润光,和桂青,李兆光,王泽清,和寿莲. 2020

[18]多元统计分析法在大麻资源评价与农业生产中的应用. 张效霏,张利国. 2018

[19]京津冀地区乡村功能分区及振兴途径. 张衍毓,唐林楠,刘玉. 2020

[20]晋南雨养旱田不同玉米品种耐旱性聚类分析. 张虎,张鹏华,张久刚,崔爱民,单皓. 2018

作者其他论文 更多>>