
Big Data
文章平均质量分 93
积微成著
每一个你不满意的现在,都有一个你没有努力的曾经。
展开
-
hadoop集群搭建
写在前面:本例中的演示均为非 root 权限,所以有些命令行需要加 sudo,如果你是 root 身份运行,请忽略 sudo。 软件环境:Ubuntu 14.04.1 LTS (GNU/Linux 3.13.0-32-generic x86_64)Hadoop: 2.6.0Jdk1.8.0_74布局: IP 主机名 用户名 192.168.30.130 master原创 2016-04-27 21:00:48 · 686 阅读 · 0 评论 -
Hadoop入门指导
首先整体上了解hadoop,包括hadoop是什么,能够做什么,使用场景等,不需要考虑细节问题。在有了整体上的了解后,就开始准备系统地学习hadoop。建议:勿一味学习理论知识,要注意理论与实践相结合。在实际操作中查缺补漏,提高针对性、目的性。总的来说,学习hadoop需要具备:linux 1、熟练操作linux常用命令以及网络配置; 2、熟悉用户以及权限管理操作; 3、熟悉软件包以及系统命原创 2016-05-04 17:03:29 · 950 阅读 · 0 评论 -
Hive教程
hive是一个基于hadoop文件系统之上的数据仓库架构。它为数据仓库的管理提供了很多功能:数据ETL(抽取、转换、加载)工具、数据存储管理和大型数据集的查询和分析能力。同时,hive定义了类sql的语言——hive ql。hive ql允许用户进行和sql相似的操作,还允许开发人员方便地使用mapper和reducer操作,这对mapreduce框架是一个强有力的支持。一、hive简介hive是什原创 2016-05-13 17:00:10 · 1229 阅读 · 0 评论 -
DO’S AND DON’TS OF DATA SCIENCE
原文地址Don’t Start with the Data Do Start with a Good QuestionDon’t think one person can do it all Do build a well-rounded teamDon’t only use one tool Do use the best tool for the jobDon’t brag about t转载 2016-09-20 12:25:18 · 558 阅读 · 0 评论 -
大数据的应用——用户画像
什么是画像?什么是画像呢?可能大家看到过一些外文资料或者演讲中出现过profile一词,其实和画像是一个概念,都是从不同的维度来表达一个人,这些维度可以是事实的,可以是抽象的;可以是自然属性,比如性别、年龄;可以是社会属性,比如职业、社交特征;可以是财富状况,比如是否高收入人群,是否有固定资产;可以是家庭情况,比如是否已经结婚,是否有孩子;可以是购物习惯,比如喜欢网购还是喜欢逛商场;可以是位置特征,原创 2016-10-27 21:45:28 · 10910 阅读 · 0 评论