使用 WSL 进行pyspark + xgboost 分类+特征重要性 简单实践


wsl 简介与安装

WSL 是 Windows Subsystem for Linux windows下的linux子系统,由于直接在windows 上安装pyspark 跑很多基于linux 的库的机器学习库很费劲,有什么办法是省时省力并且占用资源少的方式呢?相比虚拟机动辄8g 左右的内存占用量,wsl 当然是一个非常好的选择。

windows 的说明文档 比以前有了很大进步,以前很多系统设置都得去百度搜半天,现在好了,文档写的很清楚

离线安装wsl

一般来说,都是从应用商店安装,但是现在来说,众所周知的原因,网络不是特别稳定,所以可以离线下载后使用powershell 安装,下载后大约是一个 4、5 百M 的文件:Ubuntu_2004.2020.424.0_x64.appx

下载wsl

虽然给定引用中没有直接关于在WSL的Ubuntu系统中使用Docker部署Superset并连接本地MySQL的内容,但可以根据已有信息推测步骤如下: ### 环境准备 系统要求为Linux(推荐Ubuntu 20.04/22.04)或macOS,Windows可用WSL2,内存建议 ≥ 4GB(Superset + ClickHouse) ,需要安装Docker & Docker Compose(推荐方式,避免环境冲突) [^2]。 ### 使用Docker部署Superset 根据Superset Docker Compose,可参考其PostgreSQL连接信息(虽此处是连接MySQL,但部署思路可借鉴)。在WSL的Ubuntu系统中,先确保Docker和Docker Compose正常运行。之后可通过相关的Docker Compose文件来部署Superset,不过具体的Docker Compose文件内容需进一步查阅官方文档或相关资源进行配置。 ### 连接本地MySQL 要连接本地MySQL,需要在Superset中进行相应配置。首先要知道MySQL的连接信息,如主机名、端口、数据库名、用户名和密码。假设MySQL运行在本地,主机名可能是`localhost` ,端口一般是`3306`。在Superset中配置数据源时,填入这些信息,类似于Superset连接PostgreSQL填入相关信息一样。 示例代码(假设已有合适的Docker Compose文件`docker-compose.yml` ): ```bash # 启动Docker Compose服务 docker-compose up -d ``` 在Superset中配置MySQL数据源的Python代码示例(假设使用Superset的API): ```python # 这里只是示例,实际需要根据Superset的API文档进行调整 import requests # 假设Superset的API地址 superset_api_url = "http://localhost:8088/api/v1/database/" # 假设的MySQL连接信息 mysql_config = { "database_name": "your_database_name", "sqlalchemy_uri": "mysql+pymysql://your_username:your_password@localhost:3306/your_database_name" } # 发送请求添加数据源 response = requests.post(superset_api_url, json=mysql_config) print(response.json()) ```
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

shiter

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值