一直以来很多粉丝问过东哥这个问题: 有没有一种可以将Python模型转成SAS的工具?
因为我本身是两个技能都具备的,实际工作中一般都是配合使用,也很少想过进行转换。但是,最近东哥逛技术论坛刚好发现了一个骚操作,借助Python的三方库 m2cgen和Python脚本即可完成Python模型到SAS的转换。
m2cgen是什么?
m2cgen 是一个Python的第三方库,主要功能就是将Python训练过的模型转换为其它语言,比如 R 和 VBA 。遗憾的是,目前 m2cgen 尚不支持 SAS ,但这并不影响我们最终转换为 SAS 。
我们仍然使用 m2cgen ,需要借助它间接转换成SAS。具体的方案就是先将Python模型转换为 VBA代码 ,然后再将VBA代码更改为 SAS脚本 ,曲线救国。
如何使用m2cgen?
我直接用一个例子说明下如何操作。
数据我们使用sklearn自带的 iris dataset ,链接如下:
https://scikit-learn.org/stable/auto_examples/datasets/plot_iris_dataset.html
下面,演示一下如何将Python的XGBoost模型转成SAS代码。
首先导入所需的库包和数据。
# 导入库
importpandas aspd
importnumpy asnp
importos
importre
fromsklearn importdatasets
fromxgboost importXGBClassifier
fromsklearn.model_selection importtrain_test_split
fromsklearn.metrics importaccuracy_score
importm2cgen asm2c
# 导入数据
iris =