
数据处理
laymenISmouse
这个作者很懒,什么都没留下…
展开
-
R入门知识学习
R是最受欢迎的数据分析和可视化平台之一,2011年R随着大数据的爆发而流行起来,R是免费的,开源的,支持windows/Mac os/Linux平台R可以挖槽数据分析涉及的几乎所有步骤:从数据获取到数据清洗到数据分析到结果报告https://www.kaggle.coms数据分析包括:1、探索性数据分析a、数据分析中必要步骤b、了解数据c、作图2、统计推断原创 2016-02-04 13:02:58 · 942 阅读 · 0 评论 -
Hadoop之Hive学习
Hive是构建在hadoop HDFS上的一个数据仓库数据仓库:是不可更新的,随着时间的推移,不产生变化的集合,主要是数据查询,用于决策的数据。Hive允许熟悉MapReduce开发者的开发自定义的mapper和reducer来处理内建的mapper和reducer无法完成的复杂的分析工作.是SQL解析引擎,他将SQL语句转移成M/R Job然后在hadoop执行。Hive的表原创 2016-02-03 21:27:14 · 622 阅读 · 0 评论 -
hadoop2.7.3 mahout 0.9 遇到问题
hadoop2.7.3 mahout 0.9 遇到问题:以命令行提交hadoop任务,VMware10虚拟机,ubuntu16.4,单机版hadoop2.7.3,mahout0.9,maven3.3.9 处理数据ratings.csv;原创 2016-10-01 10:25:44 · 1103 阅读 · 0 评论