weixin_40147959-优快云博客

原创 slimarray: gzip的压缩率, 即时访问

12 分钟阅读本文链接: https://blog.openacid.com/algo/slimarray/ slimarray 场景和问题在时序数据库, 或列存储为基础的系统中, 很常见的形式就是存储一个整数数组, 例如 slim 这个项目按天统计的 star 数: 这类数据有有很明显的统一的变化趋势, 对这类数据的存储, 我们可以利用数据分布的特点, 将整体数据的大小压缩到几分之一. 这就是 slimarray 要做的事情. 使用 slimarray, 可以将数据容量减小到gzip差不多的大小

2020-11-18 16:01:30 224

原创 200行代码实现基于paxos的kv存储

本文链接: https://blog.openacid.com/algo/paxoskv/ 前言写完 paxos的直观解释之后, 网友都说疗效甚好, 但是也会对这篇教程中一些环节提出疑问(有疑问说明真的看懂了 ???? ) , 例如怎么把只能确定一个值的paxos应用到实际场景中. 既然Talk is cheap, 那么就Show me the code, 这次我们把教程中描述的内容直接用代码实现出来, 希望能覆盖到教程中的涉及的每个细节. 帮助大家理解paxos的运行机制. 这是一个基于paxos,

2020-11-08 21:19:12 322 3

翻译 Art of Pull Requests(翻译)

本文链接: https://blog.openacid.com/culture/pr/ 原文: Art of Pull Requests 正如我之前写的，我们是一个远程团队，团队成员遍布世界各地。这意味着code reviews 和 pull requests必须远程完成。最近，我们团队的一位成员提出了这样的宣言: 作为 PR writer 我会: 保持PR够小使用标签表明PR是许多部分之一发布PR后在Slack上也提一下作为 PR reviewer 我会: 一有空就review。

2020-10-28 15:50:00 149

原创互联网中对象访问频率的91分布

在互联网领域, 流行着这么一句话: 90%的流量由10%的内容产生. 缓存也由此产生: 只为最频繁访问的10%的内容提供更快的存储, 就可以以很低的成本提供尽可能好的服务质量. 一般符合这种互联网访问模型的曲线是下图这样的. 对每个访问的url做独立计数, 并按照从访问最多到最低排序: 这句是一个经验结论, 从它可以得出我们的频度分布公式: 也就是zipf 模型. f(k)=c/ks f(k...

2019-12-02 22:10:14 312

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 slimarray: gzip的压缩率, 即时访问

原创 200行代码实现基于paxos的kv存储

翻译 Art of Pull Requests(翻译)

原创 互联网中对象访问频率的91分布

空空如也

空空如也

原创互联网中对象访问频率的91分布