震惊!不需hadoop环境运行scala和pyspark程序

Databricks云平台提供集成托管解决方案,消除企业采用Spark的障碍。平民玩家可免费申请其空间,解决电脑配置低、无Hadoop环境等问题。注册需gmail邮箱,进入后可创建Scala、Python等四种Notebook运行Spark程序,还能导出导入,适合笔记本和低配置电脑用户。

Databricks官方是这样描述Databricks优势的:

        像Databricks这样的云平台提供了一套集成的、主机托管的解决方案,消除了企业采用Spark和确保大数据项目成功所面临的这三大障碍。我们为你提供了全面管理和调优的Spark集群,开发Spark的一群专家在大力支持。我们的平台为你提供了一种互动式工作区域,以便探查、可视化、合作和发布。如果你已准备好进入生产环境,只要点击一下鼠标即可启动任务。我们会自动搭建基础设施。

        另外,我们还提供了一组丰富的API,以便通过编程访问该平台,这还让用户能够无缝整合第三方应用程序。

咱们平民玩家想练习scala,pyspark,苦于电脑配置不行,没安装hadoop环境,公司没环境用,等痛点。

没关系,可以免费申请Databricks 空间,并且运行scala代码是不需要*大大×××*的哈。

只是注册账号的时候需要一个gmail邮箱就ok了。

注册网址如下

https://community.cloud.databricks.com/login.html

640?wx_fmt=png

选择社区版。

进入后,姓名,公司名 abc随便写写。

注意:这里有个注册验证码可能需要*大大×××*的哈~

    这个你要是找笔者要,我只能这样回你了 --- :

640?wx_fmt=png

账号搞定后,开始创建scala或者python脚本(pyspark):

Create Notebook:

可以创建scala,python,sql,R 四种notebook 用来运行spark程序。

640?wx_fmt=png

如图,很贴心的给了免费集群(6G内存,spark2.4,scala2.11)这样我们可以方便的在云端体验

spark了。对使用笔记本电脑 和电脑配置低的用户是比较推崇的。

而且在里面创建的notebook 可以导出&&导入, 小伙伴们 遇到语法问题(各种疑难杂症),导出notebook,

微信群请教 笔者 samir 和群主大大都可以哈!

640?wx_fmt=gif

下面测试2个简单的scala 语句:

1. 常用if-else 控制语句

2. scala调用linux 命令wget下载文件,ls,pwd等命令。

640?wx_fmt=png


640?wx_fmt=png


打完收工,这次的分享就到这里了。

附上官方操作手册:

https://docs.databricks.com/getting-started/index.html

文章来源:https://blog.51cto.com/13000661/2397948

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值