13、数据虚拟化与转换服务:挑战、模式与实现

数据虚拟化与转换服务:挑战、模式与实现

在大数据时代,数据的存储和处理变得越来越复杂。不同的数据存储格式、多样的处理引擎以及海量的数据规模,给数据用户带来了诸多挑战。为了应对这些挑战,数据虚拟化和数据转换服务应运而生。本文将深入探讨数据虚拟化的实现模式以及数据转换服务的相关内容。

数据虚拟化服务的成本与调试性

数据虚拟化在计算上成本高昂,因此优化相关成本至关重要。同时,在大规模生产部署中,在虚拟化服务上开发的查询应易于监控和调试,以确保其正确性和性能。

数据虚拟化服务的实现模式

数据虚拟化服务对应现有任务图,有三个自动化级别,每个级别对应自动化处理当前手动或低效的任务组合:
1. 自动查询路由模式
- 模式目标 :自动将查询路由到处理集群,用户只需将作业提交给虚拟化服务。路由模式会考虑查询和集群属性以及当前集群负载,就像查询与可用处理集群之间的“媒人”。
- 工作流程
- 处理作业提交到作业 API,指定作业属性,如作业类型(Hive、Presto、Spark)、命令行参数和文件依赖集。
- 数据虚拟化服务为每个提交的作业生成自定义运行脚本,允许作业在运行时选择的不同处理集群上运行。
- 根据当前负载和其他属性,选择一个集群执行作业,并将请求提交给作业编排服务执行。
- 示例 :Netflix 的 Genie 是开源实现的例子。Web 2.0 公司如 Facebook 也有内部实现的变体,会分析查询的数据基数和复杂度,将短运行、交互式查询路由到

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值