必须建筑师附体!像盖大楼那样打造数据即服务

面对数据洪流,云服务提供商需构建完善的数据处理和分析平台。借鉴建筑思维,需解决数据存储、数据库即服务及数据分析即服务。英特尔平台与Ceph技术结合,提供高效存储与计算解决方案,实测案例显示性能显著提升。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

近两年产业界总用“数据洪流”来形容数据的大爆发,但如果我们真把它视作洪水,那么它只会带来冲击;如能积极发掘其潜藏的价值,它则可能变成一条流金之河,正如麦肯锡在研究中发现的那样:与竞争对手相比,能使用数据识别客户行为的企业,在销售增长率方面要高出85%,在毛利率方面会高出25%[1]


640?wx_fmt=png


这个道理,其实大多数企业都清楚,但要构建完善的数据处理和分析平台,难度并不比构建AI应用平台低,对他们而言,通过公有云服务获得这种能力反而更现实。


640?wx_fmt=png


那么,云服务提供商应该怎样做,才能打造出一个高效、全面和可靠的数据即服务呢?根据先行者们的经验,导入“建筑师”思维是必需的,也就是说,要用盖大楼那样的思路来构建数据即服务。

 

就像起高楼必须先挖地基一样,云服务提供商首先要考虑数据即服务的“地基”,也就是数据存储的问题。在各行各业全面拥抱数字化趋势的今天,存储服务的要求更多地体现为:容量和性能要实现高效扩展,相关资源可进行灵活调配和快速交付。

 

接下来,在数据存储的“地基”之上,要筑起坚实的“楼体”,也就是提供数据库即服务,将繁琐的数据库预置、配置、优化、备份、安全、监控、联网、自动化、升级及维护等操作,全部交给自动化数据库管理系统来处理。

 

640?wx_fmt=png


最后一步,就是要在“楼体”上加装顶层,也就是大数据或数据分析即服务,海量数据将通过它的清洗、挖掘、分析和可视化等操作,提炼出高价值、易理解和检索的关键信息,或者说是洞察。

 

640?wx_fmt=png


云服务提供商还需要确保上述不同层级间各模块和功能之间能形成协作,而非各自为政。如金山云的数据即分析服务KMR(Kingsoft MapReduce),就与其对象存储KS3、表格数据库服务和关系型数据库服务(KRDS)实现了集成。其用例之一,就是用户可在得到分析结果后将其存入KS3,然后释放按时计费的KMR集群,以节省成本[2]


640?wx_fmt=png


有了设计思路,云服务提供商就要操心“钢筋水泥”,即基础设施的选择了。由于这个体系自下而上,对硬件的需求从重存储,渐渐过渡到重计算,所以这两点就是考量的重点。

 

先谈存储,数据即服务应优先考虑软件定义存储,它利于创建跨服务产品使用,且易于管理和调配的共享存储资源池。

 

英特尔平台+Ceph技术是实施软件定义存储的理想之选。Ceph是目前唯一能提供开源存储、软件定义存储、企业级存储和统一存储(对象、块和文件)的解决方案。它与至强处理器搭配,再辅以英特尔智能存储加速库(让应用能使用至强加速与数据保护、完整性和安全性相关的任务)、高速缓存加速软件(让Ceph可通过智能缓存提高性能),以及高性能、低延迟、高稳定和耐用的英特尔固态盘和傲腾固态盘等技术,可输出令人满意的性能和总拥有成本。


640?wx_fmt=png


再谈计算,英特尔的优势更加明显:不仅有新一代至强可扩展处理器凭借全新微架构带来的加成,还有诸多开源和商业版本数据库及数据处理和分析技术,如Apache Hadoop、Spark、SAPHANA带来的“众星捧月”效果。两者融合就产出了一串更诱人的数据,如SAP HANA每小时执行的查询量可提高至1.5倍[3],IBM DB2批量分析的平均速度提高至1.4倍[4]


640?wx_fmt=png


这些英特尔新技术带来的功效可不是纸上谈兵,抛两个身边的真实“战例”:

 

-      腾讯金融云TDSQL服务升级采用至强可扩展处理器、英特尔Omni-Path架构和傲腾固态盘,写性能提高至原来的3倍,读性能提升到原来的4倍,整体性能提升至原来的1.7倍[5]


640?wx_fmt=png


-      用友分析云平台在升级使用至强铂金8180处理器后,性能归一化指标比使用至强E7-8890 v4时提升42%,搭配傲腾固态盘后,性能更是提升达92%[6]

 

640?wx_fmt=png


数据与信息来源:

[1]: 麦肯锡,2017年,《利用您的客户数据获取价值》,https://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/capturing-value-from-your-customer-data

[2]: 白皮书《金山云助力实现云端数据分析》,https://www.intel.cn/content/www/cn/zh/cloud-computing/kingsoft-cloud-enables-data-analytics-in-the-cloud.html

[3]、[4]:白皮书《数据分析:面向云服务提供商的指南》, https://connect.intel.com/analytics_eguide_reg

[5]: 白皮书《铸就智慧金融的“芯”动力——英特尔助力腾讯云提供基于TDSQL的高效、安全金融云服务》,https://www.intel.cn/content/www/cn/zh/cloud-computing/tencent-financial-cloud-case-study.html

[6]: 白皮书《英特尔技术助力用友分析云向用户提供全分析服务解决方案》,即将上传。

 

并发、时延、成本等各方面,都对云平台的基础设施提出了更高的要求。点击阅读原文,登上至强特快专列,了解成功的云服务提供商如何高效打造差异化的云服务。


640?wx_fmt=jpeg


详情请查看【阅读原文】

内容概要:论文提出了一种基于空间调制的能量高效分子通信方案(SM-MC),将传输符号分为空间符号和浓度符号。空间符号通过激活单个发射纳米机器人的索引来传输信息,浓度符号则采用传统的浓度移位键控(CSK)调制。相比现有的MIMO分子通信方案,SM-MC避免了链路间干扰,降低了检测复杂度并提高了性能。论文分析了SM-MC及其特例SSK-MC的符号错误率(SER),并通过仿真验证了其性能优于传统的MIMO-MC和SISO-MC方案。此外,论文还探讨了分子通信领域的挑战、优势及相关研究工作,强调了空间维度作为新的信息自由度的重要性,并提出了未来的研究方向和技术挑战。 适合人群:具备一定通信理论基础,特别是对纳米通信和分子通信感兴趣的科研人员、研究生和工程师。 使用场景及目标:①理解分子通信中空间调制的工作原理及其优势;②掌握SM-MC系统的具体实现细节,包括发射、接收、检测算法及性能分析;③对比不同分子通信方案(如MIMO-MC、SISO-MC、SSK-MC)的性能差异;④探索分子通信在纳米网络中的应用前景。 其他说明:论文不仅提供了详细的理论分析和仿真验证,还给出了具体的代码实现,帮助读者更好地理解和复现实验结果。此外,论文还讨论了分子通信领域的标准化进展,以及未来可能的研究方向,如混合调制方案、自适应调制技术和纳米机器协作协议等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值