SAS Kernel for Jupyter 安装与使用教程
1. 项目介绍
SAS Kernel for Jupyter 是一个开源项目,旨在为 Jupyter Notebook 提供一个 SAS 内核。通过这个内核,用户可以在 Jupyter Notebook 环境中直接运行 SAS 代码,并查看结果。这使得用户能够利用 SAS 系统的数据处理和分析能力,同时享受 Jupyter Notebook 的交互式编程体验。
主要特点
- 集成 SAS 功能:在 Jupyter Notebook 中无缝使用 SAS 的数据处理和分析功能。
- 代码共享:通过 Jupyter Notebook 的 JSON 格式,方便地共享代码和结果。
- 兼容性:支持 Python 3 和 Jupyter 4 及以上版本,兼容 SAS 9.4 及以上版本,包括 SAS Viya。
2. 项目快速启动
安装步骤
-
使用 pip 安装:
pip install sas_kernel
-
使用 conda 安装:
conda install -c anaconda sas_kernel
-
从源码安装:
pip install git+https://github.com/sassoftware/sas_kernel.git@main
验证安装
安装完成后,可以通过以下命令验证 SAS Kernel 是否成功安装:
jupyter kernelspec list
你应该会看到类似如下的输出:
Available kernels:
python3 /home/sas/anaconda3/lib/python3.5/site-packages/ipykernel/resources
sas /home/sas/local/share/jupyter/kernels/sas
启动 Jupyter Notebook
启动 Jupyter Notebook 并选择 SAS 内核:
jupyter notebook
示例代码
在 Jupyter Notebook 中,你可以编写并运行如下 SAS 代码:
data iris;
set sashelp.iris;
run;
proc print data=iris(obs=10);
run;
3. 应用案例和最佳实践
数据分析
SAS Kernel 非常适合用于数据分析任务。例如,你可以使用 SAS 的 PROC 过程进行数据清洗、统计分析和可视化。
proc means data=iris;
var SepalLength SepalWidth PetalLength PetalWidth;
run;
机器学习
SAS 提供了强大的机器学习功能,你可以在 Jupyter Notebook 中使用这些功能进行模型训练和评估。
proc logistic data=iris;
model Species = SepalLength SepalWidth PetalLength PetalWidth;
run;
报告生成
通过 Jupyter Notebook,你可以将 SAS 的分析结果直接嵌入到报告中,方便分享和展示。
4. 典型生态项目
SASPy
SASPy 是一个 Python 库,允许你通过 Python 代码与 SAS 进行交互。SAS Kernel 依赖于 SASPy,因此在使用 SAS Kernel 之前,你需要配置 SASPy。
JupyterLab 扩展
SAS Kernel 支持 JupyterLab 扩展,这些扩展可以提高你在 JupyterLab 中的编程效率。你可以通过以下命令安装这些扩展:
pip install sas_kernel[jlab_ext]
NBGrader
NBGrader 是一个用于分配和评分 Jupyter Notebook 的系统,它与 SAS Kernel 兼容。你可以使用 NBGrader 来创建和评分包含 SAS 代码的作业。
通过这些生态项目,SAS Kernel 不仅扩展了 Jupyter Notebook 的功能,还增强了其在数据科学和分析领域的应用能力。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考