机器学习应用数学基础-线性代数

这篇博客介绍了机器学习中线性代数的基础概念,包括向量、矩阵和张量的操作,如相加减、范数计算以及矩阵的逆和伪逆。还探讨了行列式、线性方程组、二次型与正定性以及矩阵分解如Cholesky和LU分解的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

向量,矩阵,张量

  1. 标量: x
    举例:点
  2. 向量:(x1,x2,x3,...,xn)∈Rn(x_1,x_2,x_3,...,x_n)\in R^n(x1,x2,x3,...,xn)Rn
    举例:线(时间序列)或者n维空间里的一个方向
  3. 矩阵(二维下标Ai,jA_{i,j}Ai,j
    举例:面(黑白照片的灰度像素点)
  4. 张量Tensor(多维下标,Ai,j,k,l...A_{i,j,k,l...}Ai,j,k,l...
    举例:立体(魔方)或者 彩色照片(三维张量,三种RGB像素点的叠加)或者 视频(四维张量,在照片基础上增加时间维度)

向量和矩阵运算

相加减

  • 对应项相加减

范数(距离)

L2=∣∣x∣∣2=x12+x22+....+xn2L_2=||x||_2=\sqrt{x_1^2+x_2^2+....+x_n^2}L2=x2=x12+x22+....+xn2
Lp=∣∣x∣∣p=(∑i=1n∣xi∣p)1pL_p=||x||_p=(\sum_{i=1}^n|x_i|^p)^{\frac{1}{p}}Lp=xp=(i=1nxip)p1
L∞=max∣xi∣L_{\infty}=max|x_i|L=maxxi
L0=0或者1L_0=0或者1L0=01

相乘

x∗y=xT∗y=∑1nxiyi∈Rx*y=x^T*y=\sum_{1}^{n}x_iy_i \in Rxy=xTy=1nxiyiR


张量的运算(了解)

  • 导入:
    x∗y=xT∗y=标量x*y=x^T*y=标量xy=xTy=
    x∗y=x∗yT=矩阵x*y=x*y^T=矩阵xy=xyT=(** 升维**)
  • 推广:
    Ai,j∗Bk=Ci,j,kA_i,j*B_k=C_i,j,kAi,jBk=Ci,j,k
    在这里插入图片描述

逆与伪逆

  1. 定义
    A−1A=I=AA−1A^{-1}A=I=AA^{-1}A1A=I=AA1
  2. 含义
    Ab=c:A将b映射到cAb=c:A将b映射到cAb=cAbc
    b=A−1c:A−1将c映射回bb=A^{-1}c:A^{-1}将c映射回bb=A1cA1cb

伪逆

  • 不见得每个矩阵都存在逆矩阵,找到一种与逆相似的Moore penrose伪逆

行列式

  • 矩阵映射到实数上

线性方程组

  1. 定义
    Ax=y:矩阵A将x映射到yAx=y:矩阵A将x映射到yAx=yAxy
  2. 几何属性
    A中的某行元素将x的所有分量映射为y的某一个分量,最终成为一个向量y

二次型与正定性

二次型

  • 定义:函数的所有项都是二次的,例如:
    f(x1,x2,...,xn)=x12+x22+...+xn2+(x1x2+...+xn−1xn)f(x_1,x_2,...,x_n)=x_1^2+x_2^2+...+x_n^2+(x_1x_2+...+x_{n-1}x_{n})f(x1,x2,...,xn)=x12+x22+...+xn2+(x1x2+...+xn1xn)

正定性

如果A可以被分解为:A=VTVA=V^TVA=VTV,矩阵A就是正定的

  • 证明:
    二次型可以转化为:
    a11x12+2a12x1x2+a22x22=[x1x2]×[a11a12a21a22]×[x1x2]=xTAx=XTVTVX=(VX)TVX=yTy=∑yi2≥0 a_{11}x_1^2+2a_{12}x_1x_2+a_{22}x_2^2= \left[ \begin{matrix} x_1 & x_2 \end{matrix} \right] \times \left[ \begin{matrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{matrix} \right] \times \left[ \begin{matrix} x_{1} \\ x_{2} \end{matrix} \right]=x^TAx=X^TV^TVX=(VX)^TVX=y^Ty=\sum y_i^2 \geq 0 a11x12+2a12x1x2+a22x22=[x1x2]×[a11a21a12a22]×[x1x2]=xTAx=XTVTVX=(VX)TVX=yTy=yi20

矩阵分解

  1. Cholesky分解
    A=LTLA=L^TLA=LTL,A是正定的,A可以分解为LLL下三角矩阵和LTL^TLT
  2. LU分解
    mxn的矩阵分解为L(下三角mxk)和U(上三角kxn)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值