
云计算/大数据
Matrix_x
这个作者很懒,什么都没留下…
展开
-
初识Docker
声明:本文流程实现自菜鸟教程:https://www.runoob.com/docker/docker-tutorial.html 一、Docker简介 Docker 是一个开源的应用容器引擎,基于Go语言并遵从Apache2.0协议开源。Docker 可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化。容器是完全使用沙...原创 2019-05-27 11:22:01 · 404 阅读 · 0 评论 -
Docker镜像使用
一、列出镜像列表 我们可以使用docker images来列出本地主机上的镜像。 各个选项说明: REPOSITORY:表示镜像的仓库源 TAG:镜像的标签 IMAGE ID:镜像ID CREATED:镜像创建时间 SIZE:镜像大小 同一仓库源可以有多个 TAG,代表这个仓库源的不同个版本,如ubuntu仓库源里,有15.10、14.04等多个不同的版本,我们使用 REPO...原创 2019-06-10 09:47:49 · 246 阅读 · 0 评论 -
Hadoop大数据入门——HDFS和MapReduce基础使用
一、分析处理数据集 数据集描述: 2011年某天某搜索引擎的搜索情况 数据集一共6列,分别为时间、UID、搜索关键词、选择第几个入口、搜索次数、URL。 初级阶段我的研究目标是对搜索关键词(keyword)进行词频统计。 那么首先我需要对数据集进行预处理,这里我使用python编写处理程序,仅提取出关键字一列的内容形成新文件,为下一步存入Hadoop的HDFS中做准备。处理代码如...原创 2019-06-18 00:13:54 · 283 阅读 · 0 评论