《Data Caching Optimization in the Edge Computing Environment》论文阅读笔记
Common Sense
数据缓存是边缘计算中一项关键技术。由于网络中接入的移动用户数越来越多,用户对服务质量的要求也越来越高(如低延时、高准确性等),需要频繁从云中心获取请求的数据,在此过程中,由于内容的获取效率低下(重复数据多次获取等情况)、获取时延增加等问题,需要在移动边缘网络中对数据进行缓存,从而降低时延,提高服务质量。
传统的缓存替换策略如最近最少使用(LRU)和最近最少访问频次(LFU), 已经被大量的研究工作采用。对于相同规模的内容, 这两种策略简单而且高效。但是, 它们会忽略内容的下载时延以及内容的数据量。为此, 研究者们提出了一些新的缓存方案, 如基于用户偏好、增强学习或多节点合作的缓存策略。

数据的流行度(data popularity)在边缘计算的数据缓存问题中是一项重要的因素。
Question
关于数据缓存的现有研究,大多从减少网络时延和提高移动设备的能量利用效率的方面进行考虑,这是以移动用户的视角来看待问题的。而本文则以服务提供商的角度切入,研究如何在数据接入时延约束下,最大化服务提供商的收益(revenue)。
Analysis

上图为一个边缘网络,包含5个边缘服务器,边缘服务器接收到来自覆盖范围内的用户的数据请求,d1或者d2。针对这些请求,边缘服务器如何进行数据缓存才能使得收益最大化呢?
首先考虑对于5个边缘服务器,全部缓存d1和d2一定能够满足用户的请求,但是这增加了缓存的代价,对于服务提供商来说并不划算。合理的缓存方式为,S2缓存数据d1,S5缓存数据d2。
从服务提供商的角度,目标为满足用户数据接入时延的同时,最大化缓存数据带来的收益。
数据缓存收益(data caching revenue)有两部分组成:一是缓存数据后用户请求带来的利润,二是存储数据和传输数据的代价。需要在两者进行trade-off。
Contributions
- 在考虑数据流行度的基础上,基于获益和代价建模服务提供商的收益。
- 扩展Page-Hinckley-Test方法用户检测数据流行度。
- 将数据缓存问题建模成整数规划问题,证明其为NP-complete。
- 提出一种近似算法来解决大规模场景下的数据缓存问题,并证明了算法的近似比。
- 在一个真实世界构造的数据集上进行扩展实验,与两种baseline方法进行比较。
Related work
| 作者 | 方法 | 目标or特点 |
| Drolia et.al | 提出了缓存模型系统Cachier | 通过平衡云边负载最小化时延 |
| E. Zeydan et al | 用大量的数据进行内容流行度估计,存储流行度高的数据 | 实现用户的高满意度 |
| Halalai et al | 基于动态规划提出了缓存模型系统Agar | 考虑数据流行度 |
| Xuanyu et al | 从服务提供商角度提出一种优化竞争机制 | 保证缓存空间上的内容分配和用户的支付 |
| Xi et al | 提出联合缓存机制,未考虑数据流行度 | 最大化缓存命中率 |
| Gharaibeh et al | 提出在线缓存算法 | 未考虑数据流行度 |
| George et al. | 基于视频流行度分布设计了挑选视频缓存的准则 | 确定视频流行度时考虑用户偏好 |

本文探讨了在边缘计算环境中,如何在数据接入时延约束下,通过考虑数据流行度和成本,从服务提供商的角度最大化收益。作者提出了基于获益和代价的收益模型,构建了整数规划问题,并设计了一种近似算法。实验结果显示在不同场景下,算法表现良好。
最低0.47元/天 解锁文章
3671

被折叠的 条评论
为什么被折叠?



