Memcached 入门

Memcached分布式缓存系统详解

最新推荐文章于 2022-02-01 13:00:03 发布

胡老汉

最新推荐文章于 2022-02-01 13:00:03 发布

阅读量342

点赞数 1

CC 4.0 BY-SA版权

分类专栏： Memcached 文章标签：高性能分布式分布式缓存多线程 Memcached

本文链接：https://blog.youkuaiyun.com/qq_27559331/article/details/89886565

0 篇文章

订阅专栏

本文介绍了高性能分布式内存对象缓存系统Memcached。它可缓存数据查询结果，减少数据库访问。其特点包括分布式、多线程等，还阐述了内存分配、回收机制，分布式机制有余数计算和一致性哈希算法，同时提到缓存命中率及使用注意事项。

缓存数据查询结果，减少数据库访问次数，以提高Web应用的响应速度、提高可扩展性。

web_6-1

bbbf14c95339704aeb4a729fcc96640fc44eb5a2-1

原理

优点

缺点

内存浪费
- Slab中的每个Chunk大小是固定的，当存储的数据小于Chunk大小，则产生少量不可使用的内存
- Page的大小也是固定的，当分割成固定大小的Chunk时，可能剩余不足以分割的内存
- 按照Growth Factor因子生成指定大小的Slab，而某Slab的Id根本未被使用时，会出现内存浪费

调优

Memcached 在启动时指定 Growth Factor 因子（-f），就可以在某种程度上控制 Slab 之间的
差异。默认值为 1.25。最佳值应该通过分析数据的平均长度而定

1357370073_4128-1

Memcached 在启动时指定 Growth Factor 因子（-f），就可以在某种程度上控制 Slab 之间的
差异。默认值为 1.25。最佳值应该通过分析数据的平均长度而定

余数计算分散算法
- 根据服务器台数的余数进行分散。虽然分散性优秀，但是新增或删除服务器时，缓存不可避免会重组，缓存命中率骤降，严重时会将数据压力集中到数据库服务器，导致无法正常提供服务。
一致性哈希算法(Consistent Hashing)
- 首先求出Memcached服务器节点的哈希值，并将其分配到0~2^32 的圆上，这个圆我们可以把它叫做值域，然后用同样的方法求出存储数据键的哈希值，并映射到圆上。然后从数据映射到的位置开始顺时针查找，将数据保存到找到的第一个服务器上，如果超过0~2^32仍找不到，就会保存在第一台memcached服务器上：

104611_1XXX_1759553

104838_fEr1_1759553

node5被放在了node4与node2之间，本来映射到node2和node4之间的区域都会找到node4，当有node5的时候，node5和node4之间的还是找到node4，而node5和node2之间的此时会找到node5，因此当添加一台服务器的时候受影响的仅仅是node5和node2区间。

命中率 =  get成功次数 / get总次数

命中率越高意味着访问数据库的次数越少，带来的性能提升也是最大的。

使用缓存一定是读多写少，实时性较高的数据不适用缓存
Page默认值为1MB，所以数据大小受限于Page大小，处理方案：
- 数据分片存储，降低单个Chunk大小
- 利用客户端实现gzip压缩数据
- Page默认值调高，但可能导致内存浪费率增高，需具体分析后处理，建议作为最终办法