NumPy库是Python所有三方库中使用最多的,也是诸如SciPy、Panda等其他三方库的基础库,所以作为基本功是要求务必学习掌握的,这也是后期利用Python进行大数据分析的基础。
下面我将从三个维度将自己学习NumPy库的心得体会进行总结(若是需求更多的学习资料,可以进入我的 Github 进行查阅,里面有详细的学习笔记、完整代码以及思维导图可供下载。),这三个维度分别是:
- NumPy为什么这么重要
- 对多维数组(ndarray)的理解
- NumPy基础操作
NumPy库为什么这么重要
理由很简单,高效。
使用NumPy库可以让你在科学计算中更加效率,占用较小资源完成对大量数据的计算。
平时使用Excel处理数据时,当数据量达到几万或者进行大面积公式计算时,电脑会卡顿。你可想象下当数据量达到上千万甚至上亿级别时的计算量有多大。
你可能会问为什么NumPy可以做到高效处理大量数据。这涉及到一些艰深的计算机原理,简单而言跟数据在内存中的存储方式有关。
我建议初学者对此仅作了解即可,当然若是感兴趣也可以多查些资料,比如像计算机组成原理这种基础知识。这里只告诉你一组对比数据:对比Python自带的列表list,计算相同的数据,NumPy库的计算速度是前者的27倍。
关于效率这个话题,我相信在以后的学习与工作实践当中会经常碰到。
未来智能时代,数据的战略性地位毋庸置疑,数据的不可或缺也将成为社会共识。那么如何用最低的成本利用数据必然会成为大部分企业的普遍诉求。在依托平台化协作方式完成工作之外,大多数中小企业包括个人自由职业者都会想着最小化成本地利用数据。谁能高效地使用数据,谁就能在市场竞争当中取得相对优势。
对多维数组的理解
先来看张图。