【第2月 day5】 NumPy广播机制

原创于 2025-03-21 13:53:08 发布

· 330 阅读

10 ·

版权

文章标签：

#numpy

python 同时被 2 个专栏收录

175 篇文章

订阅专栏

第二月数据分析和科学计算的基础

15 篇文章

订阅专栏

好的！以下是为小白设计的 NumPy广播机制 学习内容，包含概念、规则、示例和应用场景，尽量用通俗易懂的方式讲解👇

一、什么是广播（Broadcasting）？

1. 一句话理解

广播是NumPy中一种智能的“补全”机制，允许不同形状的数组进行数学运算，自动扩展小数组使其匹配大数组的形状，无需手动复制数据。

2. 为什么需要广播？

假设有一个 3x3 的矩阵和一个 1x3 的行向量，直接相加会报错，但广播机制可以自动将行向量“复制”成 3x3 的矩阵，再相加。

二、广播的核心规则

记住两个关键原则：

维度对齐：从右向左逐个维度对比，两个数组的维度大小要么相等，要么其中一个为1。
缺失维度补1：如果两个数组维度不同，在形状左侧补1，直到维度相同。

举个栗子🌰

数组A形状：(3, 4)
数组B形状：(4,) → 广播时B的形状补为 (1, 4) → 再扩展为 (3, 4)
最终A和B都能变成 (3, 4)，可以运算！

三、广播的实战示例

示例1：数组 + 标量

import numpy as np

a = np.array([[1, 2], [3, 4]])  # 形状 (2, 2)
b = 5                            # 标量（形状视为 (1,1)）

print(a + b)  # 输出：[[6,7], [8,9]]

解释：标量b被广播成 [[5,5], [5,5]]，再与a相加。

示例2：不同维度的数组相加

a = np.array([[1, 2, 3]])        # 形状 (1, 3)
b = np.array([[4], [5], [6]])    # 形状 (3, 1)

print(a + b)
# 输出：
# [[5, 6, 7],
#  [6, 7, 8],
#  [7, 8, 9]]

解释：

a 被广播为 [[1,2,3], [1,2,3], [1,2,3]]（形状 3x3）
b 被广播为 [[4,4,4], [5,5,5], [6,6,6]]（形状 3x3）

示例3：广播失败的情况

a = np.array([[1, 2], [3, 4]])  # 形状 (2, 2)
b = np.array([1, 2, 3])         # 形状 (3,)

print(a + b)  # 报错！无法广播

原因：a的第二个维度是2，b的维度是3，既不相等也不是1，无法对齐。

四、广播的常见应用场景

场景1：数据归一化

将每个特征列减去均值：

data = np.random.rand(100, 3)  # 100个样本，3个特征
mean = data.mean(axis=0)       # 计算每个特征的均值（形状 (3,)）
normalized_data = data - mean  # 自动广播，减去均值

场景2：图像处理

对RGB图像的每个通道加减值：

image = np.random.rand(256, 256, 3)  # 256x256的彩色图像
shift = np.array([10, 20, 30])       # 每个通道的偏移量（形状 (3,)）
shifted_image = image + shift        # 广播到每个像素的对应通道

场景3：矩阵与向量运算

计算每行的加权和：

matrix = np.array([[1, 2], [3, 4], [5, 6]])  # 形状 (3, 2)
weights = np.array([0.5, 0.5])               # 形状 (2,)
result = matrix * weights                    # 广播为 (3,2) * (3,2) → 输出形状 (3,2)