自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (2)
  • 收藏
  • 关注

原创 flink和hbase整合

有两种方式第一种,批处理模式整合,即从hbase查询数据并转为DataSet格式首先引入flink整合hbase的jar(版本号请根据实际调整) org.apache.flink flink-table_2.11 1.1.42 在resource下添加hbase-site.xml文件xml version="1.0"?>xml-style

2017-02-20 15:14:19 6749

原创 spark Streaming 和drools整合

最近公司打算把drools引入spark Streaming实时计算引擎,测试了一下,还是很好用对 JavaPairDStream aggregateRecords 执行以下程序,创建drools session,加载配置文件并执行规则,执行后调用ChannAmount的hbaseSave()方法aggregateRecords.foreachRDD(new VoidFunction>()

2017-02-09 14:36:30 2981

原创 hbase表设计

1 hbase表设计思路以横向扩展为设计方向的表结构(列族中有很多列),能保持多列的原子性,因为行级有事务控制以纵向扩展为设计方向的表结构(把常用查询字段拼入rowkey),能快速查询数据,但损失原子性。实际使用中可以对rowkey用MD5加密,还可以统一长度,提高存取性能(怎么提高)可以利用列名存储数据,64位操作系统内存一次存取8个字节,rowkey最好8个字节的整数倍,尽量不超过

2016-10-24 11:12:50 349

原创 一致性hash理解

一致性哈希主要应用于分布式集群对机器添加、删除的管理1 按照常用hash算法将要管理的对象映射到一个2^32-1的闭合环形上2 按照常用hash算法将机器映射也映射到此闭合环形上3 以顺时针计算,将要管理的对象纳入离自己最近的机器上4 删除节点时,该机器存储的对象按照顺时针就近原理分配到临近机器上5 增加节点时,按照哈希算法获得机器hash值,然后把临近对象分配到该节点6

2016-10-19 11:42:19 425

转载 一致性hash

转载请说明出处:http://blog.youkuaiyun.com/cywosp/article/details/23397179    一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网中的热点(Hot spot)问题,初衷和CARP十分类似。一致性哈希修正了CARP使用的简 单哈希算法带来的问题,使得分布式哈希(DHT)可以在P2P环境中真正得到

2016-10-19 11:40:49 168

转载 storm 原理

本文翻译自: https://github.com/nathanmarz/storm/wiki/TutorialStorm是一个分布式的、高容错的实时计算系统。Storm对于实时计算的的意义相当于Hadoop对于批处理的意义。Hadoop为我们提供了Map和Reduce原语,使我们对数据进行批处理变的非常的简单和优美。同样,Storm也对数据的实时计算提供了简单Spout和Bolt原语。

2016-10-19 11:35:03 290

原创 storm 安装启动

stormwget http://mirrors.hust.edu.cn/apache/storm/apache-storm-0.9.5/apache-storm-0.9.5.tar.gzmv apache-storm-0.9.5 /usr/local/ln -s /usr/local/apache-storm-0.9.5 /usr/local/apache-stormvi /et

2016-10-19 11:31:34 308

原创 hbase存储原理

Hbase 表结构设计注意问题:见过程经验积累--数据库问题 Hbase每个cell插入时都会写入时间戳(当前系统时间)来做版本标识,在读取时如果没有指定时间戳,默认取最新时间。Hbase默认保留3个版本数据。 HBase写入原理1 客户端写入请求-->MemStore同时会写入Hlog,类似于Commit log,做数据恢复用2 MemStore满足条件后刷入Stor

2016-10-19 11:28:59 1966

原创 cassandra使用

cassandra拷贝文件到csvCOPY airplanes (name, mach, year, manufacturer) TO 'export.csv';cassandra 删除节点1 ./nodetool status获取host id2 ./nodetool removenode 3 ./nodetool removenode status  nodetoo

2016-10-19 11:27:04 489

原创 cassandra安装管理

1 解压tar zxvf apache-cassandra-2.0.12-bin.tar.gz -C /usr/local/2 进入conf目录,vi cassandra.yaml1> data_file_directories:      - /usr/local/apache-cassandra-2.0.12/data2> commitlog_directory: /usr

2016-10-19 11:26:18 544

原创 cassandra 存储原理

参考:http://my.oschina.net/jsycwangwei/blog/4202571 Cassandra 通过4个技术来维护数据的最终一致性,分别为逆熵(Anti-Entropy),读修复(Read Repair),提示移交(Hinted Handoff)和分布式删除。逆熵:节点间定期检查数据一致性,使用markle tree,markle tree是hash树,叶节点是ke

2016-10-19 11:24:12 1943

RNN网络代码

RNN神经网络代码 神经网络代码

2018-07-17

唐宇迪深度学习讲义

唐宇迪深度学习讲义,清晰易懂,比较适合初学者;唐宇迪深度学习讲义,清晰易懂,比较适合初学者

2018-07-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除