背景
公司较多的使用了阿里的产品,特别是云数据库rds和大数据max compute(原odps),那么,使用机器学习pai进行机器学习和数据挖掘,理论上来说是首选(因为pai和max compute的数据是互通的)。
本博客系列将走读一下pai的基础功能,带有相关的实战和应用分析。
实战操作
创建实验
新建一个实验,所有的实战过程必须在实验中进行

数据读取
直接使用pai的读数据表组件,设置max compute的数据表


右键组件框,选择查看数据,就可以查看前100条数据。

理论分析
- 数据源可以是阿里系列的
表格,这个功能具有很大的优势。我的数据主要从odps上面来,能在不影响业务性能的情况下,自行使用 - 数据源打通的过程,
本质是在使用sql直接操作odps
评价
pai可以可视化的引入数据,甚至都不需要sql,能大大的提高效率。
本文详细介绍使用阿里云PAI进行机器学习与数据挖掘的实战过程,包括如何创建实验、读取MaxCompute数据表,以及PAI在数据源打通方面的优势。
15万+

被折叠的 条评论
为什么被折叠?



