Elasticsearch嵌套类型nested使用指南

原创于 2025-11-15 16:27:12 发布 · 788 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#Kyv0v

趁旧智秃1. 引言

复习上一篇文章《最小二乘问题详解1：线性最小二乘》中的知识，对于一个线性问题模型：

(

;

)

那么线性最小二乘问题可以表达为求一组待定值

，使得残差的平方和最小：

min

∥

本质上是求解超定线性方程组：

具体的线性最小二乘解是：

(

)

(1)

2. 求解

2.1 问题

虽然线性最小二乘解已经给出，但是并不意味着在实际的数值计算中就能按照式(1)来进行求解。一个典型的问题就是求逆矩阵：在工程实践和数值计算中，直接求解逆矩阵通常是一个性能消耗大且可能不精确的操作，应该尽量避免。举例来说，我们按照大学本科《线性代数》课程中的方法写程序来求解一个逆矩阵，假设使用伴随矩阵法：

det

(

)

adj

(

)

其中：

det

(

)

是矩阵

的行列式。

adj

(

)

是

的伴随矩阵。

为了求解伴随矩阵

adj

(

)

：

求代数余子式 (Cofactor)：对于矩阵

中的每一个元素

，计算其代数余子式

。

代数余子式

(

)

是删去

的第

行和第

列后得到的子矩阵的行列式（称为余子式）。

构造余子式矩阵：将所有代数余子式

按照原来的位置排列，形成一个新矩阵

（称为余子式矩阵）。

转置：将余子式矩阵

进行转置，得到的矩阵就是伴随矩阵

adj

(

)

。

adj

(

)

代入公式：将

det

(

)

和

adj

(

)

代入公式

det

(

)

adj

(

)

即可。

这里我们大概能估算，使用伴随矩阵法求逆矩阵的理论复杂度是

(

)

，这是一个阶乘级的增长，算法效率非常低。《线性代数》中介绍的另外一种算法高斯消元法也只能达到

(

)

，呈指数级增加。其实效率只是一方面的问题，使用计算机求解的另外一个问题是舍入误差累积：在计算机中，浮点数运算存在固有的舍入误差；求逆过程涉及大量的除法和减法运算，这些误差会在计算过程中不断累积和传播。总而言之，使用通解求解逆矩阵，可能存在不精确且性能消耗大的问题。

2.2 QR分解

那么不使用逆矩阵怎么办呢？我们需要注意的是，最小二乘问题的本质是求解，而不是求逆矩阵，因此关键是要求解正规方程：

对矩阵

作QR分解：

其中:

∈

列正交，满足

；

∈

是上三角矩阵，如果

列满秩，则

的对角元均非零，可逆。

那么把

代入正规方程，得到：

(

)

(

)

(

)

左边整理，因为

：

右边为

因此正规方程等价于

(

)

若

可逆（即

满秩，

rank

(

)

），则

也可逆。左右两边左乘

(

)

，得到：

令

（这是一个长度为

的向量），于是我们得到一个简单的上三角线性系统：

这就是QR方法把正规方程化简得到的核心结果：只需解上三角方程

。

以上只是对

列满秩的情况做了推导，如果

列满秩，那么QR分解可以表示为

；如果

列不满秩（

奇异），需要使用列主元QR方法对

(

)

进行求解，或者干脆使用下面要介绍的SVD分解（奇异值分解）法。

2.3 SVD分解

另外一种求解的方法是SVD分解。对任意矩阵

，存在奇异值分解：

其中:

∈

为正交（列为左奇异向量），

∈

为正交（列为右奇异向量），

∈

为“对角块”矩阵，通常写成

[

]

其中

diag

(

…

)

，

(

≥

)

，

rank

(

)

。

将SVD代入正规方程，先计算

：

(

)

(

)

(

)

注意

。而

是

的对角块矩阵，其非零对角元就是

(

1..

)

，其余为零。

同样的，计算

：

于是正规方程变为：

(

)

两边左乘

，因为

正交，

，得到：

(

)

(

)

(

)

把

与

代入，得到更简单的对角方程：

(

)

接下来按奇异值分块展开对角方程，先写出