
hadoop
大数据汪
分享大数据学习笔记,望记心中
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Spark用户留存分析:计算用户的次日留存率(次周留存率同理)
日志数据,下面是一行日志信息,已经经过数据清洗写入到full_access_logs表中2018-09-04T20:27:31+08:00 http://datacenter.bdqn.cn/logs/user?actionBegin=1536150451617&actionClient=Mozilla%2F5.0+%28Windows+NT+6.1%3B+WOW64%29+AppleWebKit%2F537.36+%28KHTML%2C+like+Gecko%29+Chrome%2F.原创 2021-12-16 18:34:57 · 4352 阅读 · 0 评论 -
Scala之HelloWorld案例
1创建IDEA项目工程1)打开IDEA->点击左侧的File->选择New->选择Project。。2)创建一个Maven工程,并且点击next3)指定分组和工程名scalademo4)指定项目工作目录空间5)默认下,Maven不支持Scala的开发,需要引入Scala框架在scalademo项目上,点击右键->Add Framework Support..->选择Scala->点击ok注意:如果是第一次引入框架,Use libary看不到原创 2021-12-02 17:04:24 · 861 阅读 · 0 评论 -
自动安装JDK、HADOOP、ZOOKEEPER、HIVE的shell脚本
看脚本需要注意的地方是用【" "】双引号括起来的字段一般是带有$某个东西的,例如$hostname,需要取值的一般都用""不然会出错,如果不想取值,直接保留$hostname的时候,就用【''】单引号#!/bin/bash#设置触发条件jdk=truehadoop=truezookeeper=truehive=true#定义主机名hostname=`hostname`#定义用户名whoami=`whoami`#定义一个安装目录,如果不存在就创建installdir=.原创 2021-11-09 20:08:37 · 1580 阅读 · 0 评论