3、Python数据科学基础:工具、安装与实践

Python数据科学基础:工具、安装与实践

1. 关键Python库介绍

1.1 scikit - learn

自2007年项目启动以来,scikit - learn已成为Python程序员首选的通用机器学习工具包。截至目前,已有两千多名开发者为该项目贡献代码。它包含以下子模块:
- 分类 :支持向量机(SVM)、最近邻算法、随机森林、逻辑回归等。
- 回归 :Lasso回归、岭回归等。
- 聚类 :k - 均值聚类、谱聚类等。
- 降维 :主成分分析(PCA)、特征选择、矩阵分解等。
- 模型选择 :网格搜索、交叉验证、评估指标。
- 预处理 :特征提取、归一化。

1.2 statsmodels

statsmodels是一个统计分析包,起源于斯坦福大学统计学教授Jonathan Taylor的工作,他实现了许多在R语言中流行的回归分析模型。2010年,Skipper Seabold和Josef Perktold正式创建了statsmodels项目,此后该项目吸引了大量用户和贡献者。Nathaniel Smith开发的Patsy项目为statsmodels提供了受R语言公式系统启发的公式或模型规范框架。

与scikit - learn相比,statsmodels包含经典(主要是频率学派)统计和计量经济学的算法,包括以下子模块:
-

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值