参照的是这篇文档:
databricks 官方文档 :Databricks Connect
在本地使用pycharm连接databricks,大致步骤如下:
- 首先,为了让本地环境能够识别远端的databricks集群环境,需要收集databricks的基本信息和自己databricks的token,这些信息能够让本地环境识别databricks;
- 接着,需要使用到工具 anaconda创建一个虚拟环境,连接databricks;
- 最后,将虚拟环境导入pycharm。
(下面的图渣渣,因为直接拖进来的)
第0步:检查
检查java版本,需要时1.8开头的版本,如果不是,请到这里下载:https://www.oracle.com/java/technologies/javase/javase-jdk8-downloads.html

第1步:收集databricks的信息
查看python版本 (还不知道怎么看,这里cluster的python版本为3.7)
查看Runtime Version

查看cluster ulr,解析出下面信息

本文档介绍了如何使用PyCharm连接Databricks集群的详细步骤,包括检查Java版本、收集Databricks信息、安装Anaconda、设置集群配置、创建虚拟环境以及在PyCharm中导入该环境。通过这些步骤,可以在本地环境中识别并连接到远程Databricks集群。
最低0.47元/天 解锁文章
1098

被折叠的 条评论
为什么被折叠?



