RK3399平台开发系列讲解(系统篇)1.28、ML知识拓展—RAPIDS初探

本文介绍了NVIDIA的RAPIDS平台,一个用于数据分析和机器学习的GPU加速框架。RAPIDS包括Apache Arrow、cuDF和cuML等组件,能够提升数据处理速度并降低数据科学家的工作负担。通过对比分析,展示了cuDF和cuML在数据处理和机器学习任务上的性能提升,尤其是GPU加速的PCA和KNN算法。文章还探讨了RAPIDS在工程化方案中的可行性,提供了不同级别的集成策略。

1.背景与概述

在这里插入图片描述
数据科学家一天,总是要被迫拿出大量的时间“享受”咖啡。这是因为在传统数据科学领域其的主要工作集中在数据处理过程中,由于算力的有限,数据分析往往都是漫长的等待过程。图1中,左侧展示的是基于CPU的数据准备和数据分析流程,其中绿色部分代表数据分析过程,数据科学家们只能在这段漫长的时间里一边无奈地喝着咖啡,一边等待结果。右侧是基于GPU的数据科学加速平台,数据科学家们摸鱼的时间变少了!
在数据分析、传统机器学习等领域常用到的工具和框架如Numpy、Panda、 SciPy、Matplotlib、Scikit-learn、Spark MLlib等都是基于CPU平台的。这些框架一般采用的加速方式主要是英特尔数学核心函数库(MKL)的优化和分布式处理。即使有一些基于GPU的加速方案(XGboost GPU、h2o4GPU )也是基于异构计算的思想,数据需要在内存和显存之间反复的来回拷贝,这大大降低了系统整体的加速效果。
18年底“核弹厂”NVIDIA推出的一款针对大规模数据分析和机器学习的开源GPU加速平台。它允许数据科学家们使用GPU来加速数据分析、机器学习和数据可视化工作流,与仅支持CPU的系统相比,其运算速度提升了50倍左右。通过运用NVIDIA开源GPU加速平台,数据科学家们可以和咖啡说拜拜了。
RAPIDS是一款针对数据科学和机器学习的GPU加速框架。RAPIDS主要关注数据科学中的数据预处理任务,同时它也集成了各种机器学习算法

评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

内核笔记

你的鼓励是我的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值