13、大数据分析之Spark与机器学习入门

大数据分析之Spark与机器学习入门

1. Spark基础操作

Spark是当今大数据领域最突出的技术之一,自2014年推出以来发展迅速,解决了Hadoop的许多缺点,如I/O争用等问题。Databricks是商业版Spark的领先提供商,还提供了免费的社区版,方便用户学习和使用。

1.1 导入笔记本

在弹出菜单中选择“从URL导入”选项,输入相应URL,笔记本将显示在你的邮箱ID下,点击笔记本名称即可加载。

1.2 Spark基础命令

以下是一些基本的Spark Python代码示例:

from pyspark import SparkContext
# sc = SparkContext(appName = "some_application_name") 
# 在Databricks环境中,SparkContext已创建
quote = "To be, or not to be, that is the question: Whether 'tis nobler in the mind to suffer The slings and arrows of outrageous fortune, Or to take Arms against a Sea of troubles, And by opposing end them: to die, to sleep No more; and by a sleep, to say we end the heart-ache, and the thousand natural shocks that F
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值