数据科学中Python与R的实用包和库
1. 开发者的多元选择策略
聪明的开发者不会仅仅依赖一两个包或库。这就如同调香师制作香水,只用一种花虽然不错,但很难产生惊艳的效果。调香师会去花园挑选合适的花朵,制作出精美的香精油,从而调配出令人陶醉的香水。同理,优秀的开发者会有众多的包和库可供选择,他们会根据特定应用的需求,将这些包和库的功能进行组合。
此外,许多包和库可以弥补不同编程语言功能上的差异。例如,一些Python包可以帮助Python缩小与R在统计分析方面的差距。当使用某种语言几乎能满足特定应用需求,但又不完全满足时,包或库就能发挥作用。
2. 实用的Python包
2.1 使用SciPy获取科学工具
SciPy栈(http://www.scipy.org/)包含许多可以单独下载的包,为数学、科学和工程领域提供支持。获取SciPy时,你会得到一组协同工作以创建各种应用的包,主要包括:
- NumPy
- SciPy
- matplotlib
- Jupyter
- SymPy
- pandas
在SciPy官网(https://www.scipy.org/about.html)深入了解,还能发现围绕SciPy构建的SciPy生态系统中的其他包,如在数据和计算方面的Scikit - image、Scikit - learn、h5py、PyTables。
SciPy本身专注于数值例程,如数值积分和优化,是一个通用包,能为多个问题领域提供功能,也支持特定领域的包,如Scikit - learn、Scikit - image和statsm
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



