- 博客(12)
- 收藏
- 关注
翻译 Hive权限管理默认认证-传统模式
Hive权限管理默认认证-传统模式本文档通过基本认证模式来描述Hive安全,在hive客户端层面控制进入hive元数据。 免责声明: hive authorization 不是完全安全,这个基本的认证模式打算主要是为了良好的用户去预防偶然的误操作,但是不能保证恶意的用户做恶意的事情,详情可以查看 Hive authorization main page中涉及安全的选项。前提要求: 为了使用hi
2017-05-17 18:01:17
2898
1
原创 全概率和贝叶斯公式
全概率和贝叶斯公式 引言:到什么山头唱什么歌! 0. 条件概率P(A | B) = P(AB) / P(B),变形P(AB)=P(A)*P(B|A) 1. 若某个事件B的发生是由于多个原因(Ai)引起,且这些原因构成一个完备的事件组,则常将事件B分解为一些简单的A1,A2 … 等事件,从而可以通过全概率公式来出概率P(B)。
2017-04-14 14:20:54
1599
原创 Lamda架构-分析日志流水线
Lamda架构 前言:日志分析中既有离线大规模需求,也有实时性需求,因此需要采用Lamda架构(目的是为大数据分析应用程序提供一个低响应延迟的组合数据环境)构建日志分析流水线。
2017-03-28 09:28:50
1287
原创 spark在windows本地调试
spark程序在windows下本地调试前言: 在最初接触spark分布式平台程序开发时,如何快速的调试spark应用程序,提高开发效率尤为重要。正所谓兵马未动,粮草先行。因此接下来开始准备高效的spark开发环境。
2017-03-27 22:35:56
3954
原创 spark-submit ClassNotFoundException的问题解决
I wrote a spark program with scala,but when I use “spark-submit” to submit my project, I met the java.lang.ClassNotFoundException. 注意提交的spark-submit的 –class参数必须要完整的代码package包名.scala文件名组合。
2017-03-26 10:27:54
11339
2
原创 互联网日志分析技术及分析指标
日志分析必要性 日志格式 传统单机日志数据分析 大规模分布式日志分析日志分析指标网站运营日志分析常用指标 PV Page View UV Unique Visitor PVUV Page View Per User 漏斗模型与转化率 留存率 用户属性终极目标使用界面展示
2017-03-23 23:49:39
4822
1
原创 Intellij IDEA 2016.2.5软件安装激活
Intellij IDEA 201625软件安装激活IDEA版本下载地址安装激活Intellij IDEA 2016.2.5软件安装激活 背景:由于git config配置混乱,最后导致在IDEA上无法commit push 代码至GitHub。所以重新安装最新版IDEA。IDEA版本IntelliJ IDEA 2016.2.5下载地址链接: http://pan.baidu.com/s
2017-03-22 13:20:37
1661
原创 Hive Beeline HiveServer2使用
如何使用Hive Beeline?1. 后台启动HiveServer2 (默认的端口为10000,可以通过配置更改端口号)2. 启动$HIVE_HOME/bin/beeline脚本3. !connect jdbc:hive2://localhost:10000 username passwd
2017-03-21 22:02:51
3755
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人