快速入门numpy（二）

最新推荐文章于 2021-04-25 21:01:03 发布

原创最新推荐文章于 2021-04-25 21:01:03 发布 · 487 阅读

0 ·

CC 4.0 BY-SA版权

数据分析专栏收录该内容

4 篇文章

订阅专栏

这篇博客主要介绍了numpy的通用函数，包括元素级计算、数组数据处理，特别是where函数的应用。还讨论了数组的输入输出、线性代数操作如矩阵乘法和线性代数函数，以及伪随机数生成。通过实例展示了如何利用numpy进行矢量化运算，提高数据处理效率。

部署运行你感兴趣的模型镜像

在这里插入图片描述

通用函数（元素级）

这边就是一些计算的函数，大家熟悉一下就成，如果用到可以查询相关的文档。
在这里插入图片描述
计算x和y中元素级别最大的元素

modf函数，它会返回浮点数数组的小数和整数部分
在这里插入图片描述

这边放一些函数表
在这里插入图片描述

利用数组进行数据处理

这一部分涉及的内容也比较多，比较重要
NumPy数组使你可以将许多种数据处理任务表述为简洁的数组表达式（否则需要编写循环）。⽤数组表达式代替循环的做法，通常被称为⽮量化。
书上有一个例子，但是为好像不是太理解，这边不影响numpy的学习，所以为就跳过了。

将条件逻辑表述为数组运算
这边其实就一个重要的函数where，注意这是重点

numpy.where函数是三元表达式x if condition else y的⽮量化版
本。

xarr = np.array([1.1, 1.2, 1.3, 1.4, 1.5])
yarr = np.array([2.1, 2.2, 2.3, 2.4, 2.5])
cond = np.array([True, False, True, True, False])

假设我们想要根据cond中的值选取xarr和yarr的值：当cond中的
值为True时，选取xarr的值，否则从yarr中选取。
要想实现这个选择，我们一般会这么写，还是要用到循环

result = [(x if c else y)
          for x, y, c in zip(xarr, yarr, cond)]
result

这样一点都体现不出我们numpy的优势，我们要搞矢量化
在这里插入图片描述

np.where的第⼆个和第三个参数不必是数组，它们都可以是标量值。在数据分析⼯作中， where通常⽤于根据另⼀个数组⽽产⽣⼀个新的数组。假设有⼀个由随机数据组成的矩阵，你希望将所有正值替换为2，将所有负值替换为－2。若利⽤np.where，则会⾮常简单：
在这里插入图片描述
使⽤np.where，可以将标量和数组结合起来。例如，我可⽤常数
2替换arr中所有正的值：

数学和统计⽅法

这⾥， arr.mean(1)是“计算⾏的平均值”， arr.sum(0)是“计算每列
的和”。

累加函数、累乘函数
在这里插入图片描述

其他一些统计函数
在这里插入图片描述

⽤于布尔型数组的⽅法
在上⾯这些⽅法中，布尔值会被强制转换为1（ True）和0（ False）。因此， sum经常被⽤来对布尔型数组中的True值计数：
在这里插入图片描述
另外还有两个⽅法any和all，它们对布尔型数组⾮常有⽤。 any⽤于测试数组中是否存在⼀个或多个True，⽽all则检查数组中所有值是否都是True：