wmky_kk-优快云博客

原创 Cloudera Hive传统权限管理设置

Cloudera Hive 传统权限管理设置

2017-06-09 14:04:52 1108

翻译 Hive权限管理默认认证-传统模式

Hive权限管理默认认证-传统模式本文档通过基本认证模式来描述Hive安全，在hive客户端层面控制进入hive元数据。免责声明: hive authorization 不是完全安全，这个基本的认证模式打算主要是为了良好的用户去预防偶然的误操作，但是不能保证恶意的用户做恶意的事情，详情可以查看 Hive authorization main page中涉及安全的选项。前提要求：为了使用hi

2017-05-17 18:01:17 2942 1

原创全概率和贝叶斯公式

全概率和贝叶斯公式引言：到什么山头唱什么歌！ 0. 条件概率P(A | B) = P(AB) / P(B),变形P(AB)=P(A)*P(B|A) 1. 若某个事件B的发生是由于多个原因（Ai）引起，且这些原因构成一个完备的事件组，则常将事件B分解为一些简单的A1，A2 … 等事件，从而可以通过全概率公式来出概率P(B)。

2017-04-14 14:20:54 1668

转载 gitlab备份与恢复

## Backup restore gitlab backup restore document

2017-04-14 08:34:20 3541

翻译 Hive Query Sample 查询样本抽样

hive抽样查询分桶表抽样数据块抽样

2017-04-13 11:48:19 3145

原创 Lamda架构-分析日志流水线

Lamda架构前言：日志分析中既有离线大规模需求，也有实时性需求，因此需要采用Lamda架构(目的是为大数据分析应用程序提供一个低响应延迟的组合数据环境)构建日志分析流水线。

2017-03-28 09:28:50 1344

原创 spark在windows本地调试

spark程序在windows下本地调试前言：在最初接触spark分布式平台程序开发时，如何快速的调试spark应用程序，提高开发效率尤为重要。正所谓兵马未动，粮草先行。因此接下来开始准备高效的spark开发环境。

2017-03-27 22:35:56 4101

原创 spark-submit ClassNotFoundException的问题解决

I wrote a spark program with scala,but when I use “spark-submit” to submit my project, I met the java.lang.ClassNotFoundException. 注意提交的spark-submit的 –class参数必须要完整的代码package包名.scala文件名组合。

2017-03-26 10:27:54 11398 2

原创互联网日志分析技术及分析指标

日志分析必要性日志格式传统单机日志数据分析大规模分布式日志分析日志分析指标网站运营日志分析常用指标 PV Page View UV Unique Visitor PVUV Page View Per User 漏斗模型与转化率留存率用户属性终极目标使用界面展示

2017-03-23 23:49:39 4911 1

原创 sublime工具Package Control安装使用

Sublime工具下载以及package control安装使用

2017-03-23 22:36:51 1038

原创 Intellij IDEA 2016.2.5软件安装激活

Intellij IDEA 201625软件安装激活IDEA版本下载地址安装激活Intellij IDEA 2016.2.5软件安装激活背景：由于git config配置混乱，最后导致在IDEA上无法commit push 代码至GitHub。所以重新安装最新版IDEA。IDEA版本IntelliJ IDEA 2016.2.5下载地址链接: http://pan.baidu.com/s

2017-03-22 13:20:37 1713

原创 Hive Beeline HiveServer2使用

如何使用Hive Beeline？1. 后台启动HiveServer2 (默认的端口为10000，可以通过配置更改端口号)2. 启动$HIVE_HOME/bin/beeline脚本3. !connect jdbc:hive2://localhost:10000 username passwd

2017-03-21 22:02:51 3839

youchuikai的博客