ODPS,PAI 入门笔记

本文介绍了阿里云ODPS计算平台的特点及使用流程。ODPS具备强大的算力支撑,并提供图形界面进行数据挖掘操作,内置多种机器学习算法。文章还列举了ODPS的主要教程和文档资源。
新学者,记录自己的探索轨迹

ODPS是一套独立于Hadoop/Spark/的计算平台,优势:
1 依托阿里云的强大算力
2. DTPAI图形界面可以给你单机GUI数据挖掘(类似SPSS/SAS)的方便,能调用并行资源,
3. 内置很多机器学习算法

4. 其他辅助数据很多,比如郡县图治

5. PYODPS也有了,Dataframe等


使用流程
1. 阿里云官网开通大数据计算服务
2. 阿里云官网ODPS控制台创建项目:http://odps.console.aliyun.com
    数据管理和big table 定义平台:http://ide.shuju.aliyun.com
    左侧图标是table mgmt
开通后DTPAI里预览数据是右键。Execute

小心安装时候如果有System Proxy可能会出md5 校验错


SQL语句独特格式:

select a,b from tablea distrbt by a order by B (类似paritition 分析函数,但是分发到不同机器处理,否则速度无法接受)

select a from tablea order by a limit 10 (否则也有巨大延时

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值