- 博客(8)
- 资源 (3)
- 收藏
- 关注

原创 ClickHouse 简单介绍包括分布式表,子表,ttl,主键
介绍ClickHouse是一款由俄罗斯IT人员开发的一款开源的列式数据库管理系统。clickehouse是一款OLAP分析型数据库,以快取胜。至于为什么快,网络上各位大牛已经做了介绍,此处不再叙述。本文主要从使用角度来介绍关于CH的分布式表,ttl,主键等信息。分布式表分布式表是一种逻辑上的表,并不真正存储数据。查询时,请求直接下发分布式表,分布式表会下发到各个子表进行查询,之后结果进行汇总、合并,极大的加快了检索效率。它的创建和普通字表创建语法相似,主要是引擎类型不同。语法具体如下:
2020-05-23 11:56:10
2330
原创 HBase MOB简介以及使用
背景视图数据现在发展都比较快,数据量也越来越多,数据价值也越来越大,通过数据挖掘分析,可以产生越来越多的价值。所以这种大对象的存储需求也越来越多,HBase 2.0 发布了很多新的特性,其中一个非常值得关注的是中等对象存储的特性,即 HBase MOB(Medium Object Storage)特性。HBase 2.0 MOB的引入(由HBASE-11339这个issue引入),扩宽了HBase在人工智能、物联网等领域的应用场景。最近公司也在考虑切换对象存储策略,由之前的ceph转变为HBase
2021-05-11 11:33:56
1289
原创 Faiss PQ乘积量化的学习总结
好久么有写东西了,看来做一件事情,坚持真的很难。今天为什么想到写东西,是因为我刚才看到之前学过的东西又两眼摸黑了,脑子是个好东西,可惜我么有,哈哈。俗话说,好记性不如烂笔头,我今天就把他记录下来,以免我的老年痴呆复发,哈哈 首先,简单介绍下Faiss,由Facebook开发并且开源的一款针对聚类和相似性搜索的库,使用C++语言编写,并提供Python接口,内部一些...
2020-02-21 17:23:21
3039
9
原创 docker简单操作,以及运行gpu
最近正在做关于gpu的运行相关的工作。所以本篇文章所写的都是本人经过真实操作的,并非网络版本的copy,这个也是增加积累以及分享。 先说下我最近的目的,希望训练模型可以运行在cpu以及gpu上,由于gpu运行速度较快,所以在机器学习中,计算资源的考虑必不可少,其实我的最终目标是使用kubernetes集群来管理运行基于tensorflow的模型训练任务。由于目前k8s运行gpu
2017-02-25 16:11:42
13751
原创 kubernetes(k8s)以及涉及组件简单介绍
本文主要介绍了kubernetes涉及的相关组件以及一些基本概念的介绍。从部署搭建以及运行的角度说明了底层docker以及数据存储相关的etcd的一些基础知识以及涉及的相关合核心内容,让读者针对k8s有一个大致的了解。
2017-01-08 14:38:32
57288
2
原创 纪念我的五年程序员生涯,此生第一篇博客
程序员工龄五年,做过web前端开发,hadoop应用平台开发,从2016七月底开始接触tensorflow。目前在做机器学习的一些工作。 从12年开始工作,到现在突然觉得应该写点东西了,尤其是最近,自大开始学习深度学习,才觉得自己之前丢掉的东西太多了。因为机器学习对于数学要求极高。所以现在感觉有些吃力。还有就是学习tensorflow的知识比较新,网上资料少之又少,大家说的也都是千
2016-12-03 13:58:53
846
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人