
大数据
「已注销」
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hadoop课程--第一篇
Mac系统安装Hadoop:Mac系统安装HadoopHDFS分布式存储框架 YARN:分布式计算框架:资源调度 MapReduce:离线计算,批处理 Tez:获得最好的处理效率,DAG计算,哪个先做,哪个后做,不重复做, Spark:内存计算 Hive:数据仓库,用于企业决策分析 Pig:轻量级脚本语言 Oozie:作业流调度系统 Zookeper:分布式协调服务 Hbase:分布式数据库 Flu原创 2016-04-02 23:02:12 · 453 阅读 · 0 评论 -
爬虫系列<一>:京东数据
基础介绍使用Webmagic爬虫框架,爬取京东商品数据。 需要准备基础知识: 1 Java EE基础知识 2 Webmagic框架了解使用 3 Html、css、js等基础Html知识 4 部署到服务器上,也可以搞个大数据(O(∩_∩)O哈哈~) 第一步:创建项目,导入jar包 创建项目: New ---> Dynamic Web Pro原创 2016-04-10 09:54:53 · 1484 阅读 · 0 评论