- 博客(7)
- 资源 (2)
- 收藏
- 关注

原创 HBase scan shell操作详解
创建表create 'test1', 'lf', 'sf'lf: column family of LONG values (binary value)-- sf: column family of STRING values 导入数据put 'test1', 'user1|ts1', 'sf:c1', 'sku1'put 'test1', 'user1|ts2', 'sf:c1',
2017-02-09 17:21:35
28188

原创 站在程序员的角度学算法 主讲人:雷文昌 QQ:494391740
这门算法实战课程通过matlab代码一句一句的分析算法过程,相比与枯燥,抽象的数学公式,这门课程还提到了许多算法优化的方法和原理。先介绍原理,然后一句一句的分析调试代码,再结合代码介绍原理。课程内容细致,讲解简单易懂。适合入门、初级、中级算法研究人员。1、数据结构(初始化、+-*/ mod 开方,根号,对数,指数、关系运算,逻辑运算).* 结构体1.1 非矩阵变量
2016-06-23 10:26:21
3032
1
转载 curl 命令详解
可以看作命令行浏览器1、开启gzip请求curl -I http://www.sina.com.cn/ -H Accept-Encoding:gzip,defalte2、监控网页的响应时间curl -o /dev/null -s -w "time_connect: %{time_connect}\ntime_starttransfer: %{time_starttransfer}\nti...
2019-02-27 14:40:26
9525
原创 java命令行执行程序解决依赖外部jar包的问题
用java命令行直接执行程序,如果这个程序需要引用外部jar包。就不能单纯用java xx来执行如果你的jar包和程序就在一个目录:编译javac -cp D:\yy\yy.jar,D\xx\xx.jar test.java执行java -cp D:\yy\yy.jar,D\xx\xx.jar test但是往往我们依赖的包很多,要一个个填写估计就疯了。所有我们一般会把所有的...
2019-01-26 09:22:54
1280
原创 hdfs HA原理及安装
hdfs HA原理及安装 早期的hadoop版本,NN是HDFS集群的单点故障点,每一个集群只有一个NN,如果这个机器或进程不可用,整个集群就无法使用。为了解决这个问题,出现了一堆针对HDFS HA的解决方案(如:Linux HA, VMware FT, shared NAS+NFS, BookKeeper, QJM/Quorum Journal Manager, BackupNode等)...
2019-01-02 17:12:53
320
原创 hive与hbase数据表关联
hive到hbase的使用一、简单介绍hive的元数据保存在metastore里面,真实的数据一般位于hdfs中,可以通过hql来对数据进行分析。hbase中的数据也是存放在hdfs上的,可不可以使用hive来分析hbase中的数据呢?二、hive表到hbase表的映射2.1hbase表t1的结构和其中的数据如下图2.2创建hive表映射到hbase的表首先输入下面的命...
2018-12-07 15:58:55
2220
原创 大数据常见问题汇总
1、用./bin/spark-shell启动spark时遇到异常:java.net.BindException: Can't assign requested address: Service 'sparkDriver' failed after 16 retries!解决方法:add export SPARK_LOCAL_IP="127.0.0.1" to spark-env.sh2、j...
2018-12-07 12:02:34
719
open-nlp parse 标注字典
2018-12-27
spark平台scala语言自己实现的kmeans算法,相比于MLlib的Kmeans更简单,更容易看懂,代码量少注释多
2016-05-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人