--张量积--

原创已于 2024-03-15 10:40:04 修改 · 2.1w 阅读

25 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #人工智能

于 2019-01-19 10:16:19 首次发布

Geometry 专栏收录该内容

10 篇文章

订阅专栏

本文探讨了张量积和笛卡尔积的概念，通过数学语言解释了它们在实数域上的线性空间中的表现形式，并以苹果的价格为例，生动地阐述了张量积在实际生活中的应用。

部署运行你感兴趣的模型镜像

笛卡尔积

$V$ 是一个域(这里我们取实数域 $R$ )上的m维线性空间. 在 $V$ 中选基矢 $(e_{1}, \cdots, e_{m})$ , $V$ 中元素 $\in V$ :
$\sum_{i=1}^{m} a^{i}e_{i}$
其中 $a^{1}, \cdots, a^{m}$ 均为实数. 对于给定的一组基矢， $a$ 可用 $(a^{1}, \cdots, a^{m})$ 表示.

实数域上n维线性空间 $W$ 选基矢 $(f_{1}, \cdots, f_{n})$ , $W$ 中元素 $b$ :
$\sum_{i=1}^{n} b^{i}f_{i}$
$b$ 可表示为 $(b^{1}, \cdots, b^{n})$ , 其中 $b^{1}, \cdots, b^{m}$ 均为实数.

$\times W$ 是线性空间 $V$ 和线性空间 $W$ 的笛卡尔积. $\times W$ 中元素是一个有序对 $(a, b)$ , 它的基矢可为 $(e_{1}, \cdots, e_{m},f_{1}, \cdots, f_{n})$ . $(a, b)$ 可由 m+n 个实数确定:
$(a^{1}, \cdots, a^{m}, b^{1}, \cdots, b^{n})$

所以 $\times W$ 是 m+n 维空间

张量积

$V^{*} = Hom(V,R)$
是 $V$ 到 $R$ 的同态映射(保持线性空间结构的映射)的集合, 称为 $V$ 的对偶空间. 它是m维线性空间 $V$ 上实线性函数的集合，也是在实数域 $R$ 上的m维线性空间.

$V$ 的对偶空间 $V^{*}$ 中选出一组函数 $\varrho^{1}, \cdots, \varrho^{m})$ , 令
$\varrho^{i}(e_{j}) = \delta^{i}_{j} = \Big \{ \begin{array}{c} 1, ~i = j\\ 0, i \neq j\\ \end{array}$ 则
$\varrho^{i}(a) = \varrho^{i}(a^{j} e_{j}) = a^{j} (\varrho^{i}(e_{j})) = a^{j} \delta^{i}_{j} = a^{i}$

设有 $\in V^{*}$ , 则
$f(a^{i} e_{i}) = a^{i} f(e_{i}) = \varrho^{i}(a) f(e_{i})$
其中 $f(e_{i})$ 是一依赖于 $f$ 的实数，令实数 $f_{i} = f(e_{i})$ , 则
$f_{i}\varrho^{i}(a) = f_{1}\varrho^{1}(a) + \cdots + f_{m}\varrho^{m}(a)$
说明 $f$ 可以表示成 $\varrho^{1}, \cdots, \varrho^{m})$ 的线性组合。
线性函数空间 $V^{*}$ 中的零函数记为0. 设有一组实数 $c_{1}, \cdots, c_{m})$ 使
$c_{1}\varrho^{1} + \cdots + c_{m}\varrho^{m} = 0$
将上式两边同时作用于 $e_{i}$ , 可得 $c_{i} = 0$ . 说明 $\varrho^{1}, \cdots, \varrho^{m})$ 线性无关.

综述所述， $\varrho^{1}, \cdots, \varrho^{m})$ 是空间 $V^{*}$ 的一组基函数。

同理，
$W^{*} = Hom(W,R)$
是n维线性空间 $W$ 上实线性函数的集合，称为 $W$ 的对偶空间. 它是在实数域 $R$ 上的n维线性空间.

$W$ 的对偶空间 $W^{*}$ 中选相应的对偶基矢 $\sigma^{1}, \cdots, \sigma^{n})$ ,
$\sigma^{j}(b) = \sigma^{j}(b^{k} f_{k}) = b^{k} \delta^{j}_{k} = b^{j}$

$\times W$ 上双线性函数集合 $\times W, R)$ 称为 $V^{*}$ 和 $W^{*}$ 的张量积空间, 记为：
$V^{*} \otimes W^{*} = Hom(V \times W, R)$

它也是实数域 $R$ 上线性空间，它的空间维数是 $\times n$ . 这是与笛卡尔积的一个重要区别.

张量积空间的维度为什么是 $\times n$

两个线性空间 $V$ 和 $W$ 的笛卡尔积 $\times W$ 是线性空间，其元素表示为：
$\in V\times W, ~ a\in V, b\in W$

取一个双线性函数 $\in V^{*} \otimes W^{*}$ 作用于 $\times W$ 空间中一个元素 (a,b)

$(\sum^{m}_{i} a^{i} e_{i},\sum^{n}_{j} b^{j}f_{j})> = \sum^{m}_{i} \sum^{n}_{j} a^{i} b^{j}<h; (e_{i}, f_{j})> = \sum^{m}_{i} \sum^{n}_{j} a^{i} b^{j} h_{i,j}$

$h$ 可以表示为
$\sum^{m}_{i} \sum^{n}_{j} h_{i,j} \varrho^{i} \otimes \sigma^{j}$

$h$ 由 $\times n$ 个实数 $\{ h_{i,j}, i = 1, \cdots, m; j = 1. \cdots n \}$ 确定. $\varrho^{i} \otimes \sigma^{j}, i = 1, \cdots, m; j = 1. \cdots n$ 组成线性空间 $V^{*} \otimes W^{*}$ 的一组基. 因此， $V^{*} \otimes W^{*}$ 是 $\times n$ 维线性空间.

一个接地气的例子

张量，张量积，笛卡尔积不仅仅是抽象的数学概念，它们的出现和应用都有具体的物理背景。张量最初见于弹性力学研究中。为了描述弹性体中微元的几何变形和力学状态，出现了应变张量和应力张量等概念。基于这些力学概念以及它们之间的运算规则，进一步抽象出张量等概念。

我们在使用数学分析工具研究现实世界时，通常要将现实世界中的物理量和几何量放置在坐标系中。物理量和几何量坐标值的变化反映了它们在现实世界中的运动与演化. 但是坐标系的改变也会产生坐标值的变化。引入张量的目的就是隔离出坐标系引起的变化。张量描述的不仅仅是不同量之间的多重线性关系，它反映的是现实物质世界中物体在不同的度量空间之间变换背后不变的物理意义。这些概念的应用范围不仅局限于数学, 力学等科学研究领域，在我们的日常生活中，也可以看到它们的身影。为了便于理解，举一个接地气(简单，正确，但不一定精准)的例子。

我们以一堆苹果为研究对象。我们一方面可以度量它的质量，例如，1公斤，2市斤等; 另一方面可以度量它的价值，如7元人民币，1美元等. 我们进而考察苹果的价格，就是在质量(1维坐标系)和价值(1维坐标系)组成的2维坐标系统(笛卡尔积：1 + 1 = 2 )中研究苹果的价格( 张量积: 1*1 = 1).

例如在甲地某商场里的苹果价格是 7 元(人民币)/公斤. 如果我们将价格中的货币单位改为美元. 假设7元人民币兑换1美元(线性变换), 则苹果价格会变为 1 美元/公斤. 价格坐标系变换引起价格度量值的变化，但它们所代表的物理意义(也就是苹果价格)没有变, 也就是：
7 元(人民币)/公斤 = 1 (美元)/公斤 ~~~ 7 元(人民币) = 1 (美元) （协变, 线性关系）

同理有:
7 元(人民币)/公斤 = 3.5 元(人民币)/市斤 ~~~ 1 公斤 = 2 市斤（逆变, 线性关系）

两者组合起来，就是所谓的多重线性。

如果以苹果的价值为线性空间 $V =$ {1元(人民币)，2元(人民币)， $\cdots$ }, 它的基是 1元(人民币)。如果以苹果的质量为线性空间 $W =$ {1公斤，2公斤， $\cdots$ }, 它的基是 1公斤。由于
$\frac{1}{1Kg}\cdot 5Kg = \frac{1}{1Kg}( 5Kg ) = 5$
$\frac{1}{1Kg}()$ 可以看作是线性空间 $W$ 的对偶空间 $W^{*}$ 的基函数。苹果价格 $\in V \otimes W^{*}$ . 因此价格是一个 $_{1}^{,1}$ 型张量，由于质量和价值的维度均为1，则它的基只有 $1 * 1 = 1$ 个，即 1元(人民币)/1公斤
$\sum^{1}_{i} \sum^{1}_{j} h_{i,j} \varrho_{i} \otimes \sigma^{j} =7 (1元(人民币)) \otimes \frac{1}{1公斤} =7 (1元(人民币)) \frac{1}{1公斤}$