基于云的大数据评估框架与服务生态系统优化探索
基于云的大数据评估框架
在当今大数据时代,对于大数据算法的评估变得至关重要。云技术的出现为大数据评估带来了新的解决方案。
云技术为计算带来了诸多创新,它能提供看似无限的按需计算资源,消除云用户的前期投入,并支持按短期需求使用计算资源付费。对于大数据评估实验而言,云需要具备以下能力:
- 集中存储和提供大型数据集 :云服务提供商已经能提供这项服务,例如亚马逊免费托管公共数据集。
- 多用户处理存储数据无需转移 :通过将虚拟存储驱动器按需连接到计算实例来实现,像亚马逊公共数据集就是这样被访问的。
云基框架在一定程度上克服了大数据基准测试的四个实际问题:
|问题|解决方案|
| ---- | ---- |
|数据分布问题|将数据放在云端,参与者在云端计算实例中安装软件|
|计算能力问题|所有参与者在云端计算实例中可获得足够计算能力,可选择 Linux 或 Windows 实例|
|算法效率测量问题|计算能力标准化,可客观测量算法效率|
|注释过程效率问题|注释过程可根据注释者间一致性和参与者条目进行有效管理|
基准活动流程
基准测试分为训练阶段和测试阶段:
1. 训练阶段 :
- 潜在参与者通过注册系统注册,需签署数据使用规范文件。
- 组织者批准后,参与者获得与训练数据相连的计算实例访问权限。
- 参与者在截止日期前在计算实例中实现必要软件以执行基准任务,组织者会明
超级会员免费看
订阅专栏 解锁全文
1681

被折叠的 条评论
为什么被折叠?



