- 博客(4)
- 收藏
- 关注
原创 slimarray: gzip的压缩率, 即时访问
12 分钟阅读本文链接: https://blog.openacid.com/algo/slimarray/ slimarray场景和问题在时序数据库, 或列存储为基础的系统中, 很常见的形式就是存储一个整数数组, 例如 slim 这个项目按天统计的 star 数:这类数据有有很明显的统一的变化趋势, 对这类数据的存储, 我们可以利用数据分布的特点, 将整体数据的大小压缩到几分之一. 这就是 slimarray 要做的事情.使用 slimarray, 可以将数据容量减小到gzip差不多的大小
2020-11-18 16:01:30
190
原创 200行代码实现基于paxos的kv存储
本文链接: https://blog.openacid.com/algo/paxoskv/前言写完 paxos的直观解释 之后, 网友都说疗效甚好, 但是也会对这篇教程中一些环节提出疑问(有疑问说明真的看懂了 ???? ) , 例如怎么把只能确定一个值的paxos应用到实际场景中.既然Talk is cheap, 那么就Show me the code, 这次我们把教程中描述的内容直接用代码实现出来, 希望能覆盖到教程中的涉及的每个细节. 帮助大家理解paxos的运行机制.这是一个基于paxos,
2020-11-08 21:19:12
283
3
翻译 Art of Pull Requests(翻译)
本文链接: https://blog.openacid.com/culture/pr/原文: Art of Pull Requests正如我之前写的, 我们是一个远程团队,团队成员遍布世界各地。 这意味着code reviews 和 pull requests必须远程完成。最近,我们团队的一位成员提出了这样的宣言:作为 PR writer 我会:保持PR够小使用标签表明PR是许多部分之一发布PR后在Slack上也提一下作为 PR reviewer 我会:一有空就review。
2020-10-28 15:50:00
107
原创 互联网中对象访问频率的91分布
在互联网领域, 流行着这么一句话:90%的流量由10%的内容产生.缓存也由此产生: 只为最频繁访问的10%的内容提供更快的存储,就可以以很低的成本提供尽可能好的服务质量.一般符合这种互联网访问模型的曲线是下图这样的.对每个访问的url做独立计数, 并按照从访问最多到最低排序:这句是一个经验结论, 从它可以得出我们的频度分布公式:也就是zipf 模型.f(k)=c/ksf(k...
2019-12-02 22:10:14
274
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人