自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 收藏
  • 关注

原创 hbase操作及优化

HBase学习之二: hbase分页查询https://blog.youkuaiyun.com/javajxz008/article/details/51833982

2018-09-11 18:53:20 160

原创 内存调优汇总

Java启动参数与内存调优一些学习笔记https://blog.youkuaiyun.com/rishengcsdn/article/details/40301015Vmstat命令详解:查看系统与用户占cpu比率,排除线程频繁切换状况 https://www.cnblogs.com/tommyli/p/3746187.html查看Spark进程的JVM配置及内存使用https...

2018-06-27 10:32:32 169

原创 spark使用总结

Spark集群地址http://192.168.12.21:8080/Master:spark://192.168.12.21:7077【转】Spark性能优化指南——基础篇 (推荐)https://www.cnblogs.com/hark0623/p/5533803.htmlspark submit参数调优https://blog.youkuaiyun.com/che...

2018-04-17 18:07:59 166

原创 安装redis

https://blog.youkuaiyun.com/shaobin188/article/details/77481207下载:https://redis.io/download wget http://download.redis.io/releases/redis-4.0.1.tar.gz tar xzf redis-4.0.1.tar.gz cd redis-4.0.1 ...

2018-04-10 11:16:37 123

原创 常用正则样例

192.168.0.2 192.168.0.1 - - [22/Dec/2017:14:57:09 +0800] "GET /testWS/aaa/getLyricURL?aa=123 HTTP/1.0" 200 185 "-" "Apache-HttpClient/4.5 (Java/1.8.0_60)" "asasas" 0 h2^\D*([\d., ]+) (\S+) (\S...

2018-04-02 11:34:05 133

原创 Spark Hive集成maven

UTF-8 1.8 1.8 2.11.8 2.1.0 5.1.27 org.apache.spark spark-streaming-kafka-0-10_2.1...

2018-03-23 17:16:27 1182

原创 算法汇总

余弦相似度与欧氏距离相似度http://blog.sina.com.cn/s/blog_7308ed2f0102x327.html推荐常用算法之-基于内容的推荐https://blog.youkuaiyun.com/ch18255112191/article/details/51383612白话深度神经网络https://cloud.tencent.com/developer/ar...

2018-03-13 15:43:37 126

原创 Idea快捷键

实现类: ctrl+alt+b

2018-01-19 17:24:49 96

原创 Python3 安装

CentOS6.5下使用Virtualenv搭建Python3开发环境http://www.linuxidc.com/Linux/2015-08/121352.htm 

2017-12-04 14:25:48 112

原创 centos 7 下 安装配置 caravel

Superset pykylin集成安装http://blog.youkuaiyun.com/sunday_or/article/details/68927393?utm_source=itdadao&utm_medium=referral SuperSet CentOs7安装部署http://blog.youkuaiyun.com/akfdgg123/article/details/7374...

2017-11-29 16:58:17 168

原创 Kylin实践

 http://bigdataer.net/?p=308 Kylin的cube模型http://www.cnblogs.com/en-heng/p/cube-model-of-kylin.html 

2017-11-21 11:19:56 103

原创 hbase完全分布式安装

hbase完全分布式安装https://www.cnblogs.com/haozhengfei/p/b2f14298a429a6ca0012b43952f0d53f.html 还得从node1中拷贝 core-site.xml到hbase的conf目录中 

2017-11-20 15:13:28 124

原创 hadoop问题

 没配置mapred-site.xml导致不找本地目录而从hdfs上找参考: http://blog.youkuaiyun.com/liyongke89/article/details/51276384

2017-11-17 18:08:40 117

原创 hadoop HA启动

hadoop集群启动https://wenku.baidu.com/view/c36ec0b277232f60ddcca1ee.html2.5启动zookeeper集群(分别启动zk)cd /weekend/zookeeper-3.4.5/bin/./zkServer.sh start#查看状态:一个leader,两个follower./zkServer.sh stat...

2017-11-16 13:50:29 329

原创 推荐博客

 推荐系统的架构https://www.cnblogs.com/kobedeshow/p/3569525.html 推荐系统easyrec数据结构分析https://wenku.baidu.com/view/7cd8ad0b83c4bb4cf7ecd1aa.html easyrec官网http://easyrec.org/home 推荐系统easyrec...

2017-11-10 15:35:30 149

原创 Kylin安装

最高支持hive1.2.1http://archive.apache.org/dist/hive/hive-1.2.1/ http://blog.youkuaiyun.com/wzy0623/article/details/51283352 kylin 搭建和简单测试结果http://chengjianxiaoxue.iteye.com/blog/2218510 Kylin...

2017-10-30 17:19:09 146

原创 scala学习

快学Scala学习笔记及习题解答http://blog.youkuaiyun.com/u013980127/article/details/53331624 

2017-10-16 13:45:49 138

原创 Spark Mysql to hdfs

import org.apache.hadoop.fs.Pathimport org.apache.spark.sql.SQLContextimport org.apache.spark.{SparkConf, SparkContext}  object MysqlToHdfs {   def main(args: Array[String]) {      v...

2017-08-18 18:11:55 303

原创 生活博客

 BBC记录片http://cn163.net/bbcjilu/ 

2017-07-09 09:15:48 117

原创 Mysql5.7安装

最全的mysql 5.7.13 安装配置方法图文教程(linux) 强烈推荐!http://www.jb51.net/article/90317.htm启动:/etc/init.d/mysqld start登陆: ./mysql -uroot -p 

2017-06-28 10:44:49 95

原创 hive安装

 参考:http://www.cnblogs.com/linbingdong/p/5829369.html 但注意database schema初始化,有两种方式. 第一种,先配置好hive-site.xml ./schematool -initSchema -dbType mysql 会在db中自动创建数据库及表 另一种,手工创建数据库,并source scr...

2017-06-22 19:31:18 76

原创 关注的博客

 机器学习与数据挖掘网上资源搜罗——良心推荐http://www.cnblogs.com/cxzdy/p/5111780.html白马负金羁http://blog.youkuaiyun.com/baimafujinji/article/category/6048259 牛肉圆粉不加葱 http://www.jianshu.com/u/001d44710e2e 孟令龙博客...

2017-06-14 09:17:22 140

原创 大数据培训体系

LINUXUnit01: Linux概述 、 系统安装与分区 、 常用命令 视频Unit02: 磁盘物理结构 、 文件系统原理 、 网络基本知识 、 网络操作 视频Unit03: 进程概述 、 rpm安装软件 、 yum安装删除软件 、 yum进阶 视频Unit04: vim命令 、 常见的shell命令 以及实战练习 视频Unit05: shell script 、 条件判...

2017-05-15 12:33:00 188

原创 英语链接

magic school bus字幕文件下载 第1集、第2集 http://www.ebama.net/thread-61871-1-1.html 

2017-05-12 12:37:56 210

原创 Maven打可执行包配置

参考: http://blog.youkuaiyun.com/defonds/article/details/43233131mvn assembly:assembly<build> <plugins> <plugin> <artifactId>maven-assembly-plugin</ar...

2017-05-09 17:35:25 101

原创 Spark 博文

VentLam大数据https://www.jianshu.com/u/xyZroM 大数据时代 基于用户画像的精准营销http://www.cbdio.com/BigData/2016-08/23/content_5207015.htm基于用户画像的实时异步化视频推荐系统http://www.jianshu.com/p/83af9502acb6 一个电子商务网站商...

2017-05-04 13:07:28 211

原创 Spark Sql

Spark入门实战系列--6.SparkSQL(下)--Spark实战应用http://www.cnblogs.com/shishanyuan/p/4723713.html Flume+Spark+Hive+Spark SQL离线分析系统http://blog.youkuaiyun.com/ymh198816/article/details/52014315 sparkSQL实战详...

2017-05-03 13:03:51 107

原创 Yarn命令

 yarn logs -applicationId xxx 

2017-04-25 18:22:35 132

原创 Hive 优化

Hive中跑MapReduce Job出现OOM问题分析及解决https://blog.youkuaiyun.com/oopsoom/article/details/41356251 ==========================================================================================================...

2017-04-24 16:50:13 130

原创 java常用网址

findJarhttp://www.findjar.com download jarhttp://maven.ibiblio.org/maven2/org/json/json/20160212/

2017-03-22 17:15:13 889

原创 hive函数

 http://www.kuqin.com/shuoit/20131030/335990.htmlSELECT id, CONCAT_WS(',', COLLECT_SET(pic)) FROM tbl GROUP BY id在这里CONCAT_WS是UDF,COLLECT_SET是UDAF,它将group后的pic去重,并转换为了array,方便udf是用。PS:如果不需要去...

2017-03-15 15:16:13 78

原创 使用 Selenium with Python 进行 web 自动化测试

安装Splinter:D:\Program Files\Python36\Scripts>pip install splinter http://www.cnblogs.com/mealrice/p/5495544.html使用 Selenium with Python 进行 web 自动化测试 https://www.zybuluo.com/mwumli/not...

2017-03-14 22:41:58 141

原创 Zookeeper 命令

递归删除: rmr /path

2017-03-09 17:22:04 92

原创 Kafka命令

 启动:/bin/kafka-server-start.sh -daemon config/server.properties & 关闭: ./kafka-server-stop.sh 启动所有的broker命令: bin/kafka-server-start.sh config/server.properties & 创建 bin/kafka-topi...

2017-03-06 22:37:42 123

原创 storm1.0.2版本集群搭建完整步骤

storm1.0.2版本集群搭建完整步骤http://blog.youkuaiyun.com/xu470438000/article/details/54090429 nimbus:nohup bin/storm nimbus >/dev/null 2>&1 & ui:nohup bin/storm ui >/dev/null 2>&1 &a...

2017-03-03 21:42:18 101

原创 idea打包jar的多种方式

idea maven打包jar的多种方式http://www.cnblogs.com/qifengshi/p/6036870.html 

2017-03-03 09:58:19 142

原创 Oozie4.0.1详细安装教程

Oozie4.0.1详细安装教程http://www.linuxidc.com/Linux/2014-12/110456.htm http://www.tuicool.com/articles/n2MJ3mn azkaban安装http://blog.youkuaiyun.com/levy_cui/article/details/51594965 ...

2017-02-26 23:12:36 131

原创 Spark机器学习

基于隐式反馈的音乐推荐技术研究http://www.doc88.com/p-3691241178446.html 一个电子商务网站商品推荐系统的设计与实现https://wenku.baidu.com/view/e514ef99b8f67c1cfbd6b874.html 机器学习入门好文,强烈推荐http://blog.youkuaiyun.com/ritterliu/arti...

2017-02-26 23:10:42 139

原创 Hive hql

[Hadoop大数据]——Hive连接JOIN用例详解http://www.cnblogs.com/xing901022/p/5804836.html 清空表数据insert overwrite table t_table1 select * from t_table1 where 1=0; 建表create table test_part (id int,name...

2017-02-21 11:06:41 121

原创 Maven Hive-Jdbc教程

Maven Hive-Jdbc教程http://www.cnblogs.com/ae6623/p/5686504.html http://blog.youkuaiyun.com/jethai/article/details/52345271

2017-02-20 22:32:10 391

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除