一、基础知识(1)-范数、导数

本文介绍了向量和矩阵范数的概念,包括l_p范数、l_{infty}

一、范数

1.1 向量范数

  1. 定义:满足正定、齐次、三角不等式,则称从向量空间到实数域的非负函数的范数
  2. lpl_plp范数:∣∣v∣∣p=(∣v1∣p+∣v2∣p+...+∣vn∣p)1p||v||_p=(|v_1|^p+|v_2|^p+...+|v_n|^p)^{\frac{1}{p}}vp=(v1p+v2p+...+vnp)p1
  3. l∞范数l_{\infty}范数l∣∣v∣∣∞=max(∣vi∣)||v||_{\infty}=max(|v_i|)v=max(vi)

1.2 矩阵范数

  1. l2范数,F范数l_2范数,F范数l2,F∣∣A∣∣F=Tr(AAT)=∑aij2||A||_F=\sqrt{Tr(AA^T)}=\sqrt{\sum{a_{ij}^2}}AF=Tr(AAT)=aij2
    1. 正交不变性:∣∣UAV∣∣F2=Tr(UAVVTATUT)=Tr(UAATUT)=Tr(AATUTU)=Tr(AAT)=∣∣A∣∣F2||UAV||_F^2=Tr(UAVV^TA^TU^T)=Tr(UAA^TU^T)=Tr(AA^TU^TU)=Tr(AA^T)=||A||_F^2UAVF2=Tr(UAVVTATUT)=Tr(UAATUT)=Tr(AATUTU)=Tr(AAT)=AF2
      1. U∈Rm×m、V∈Rn×nU\in R^{m×m}、V\in R^{n×n}URm×mVRn×n是正交矩阵
      2. Tr(X)=∑aiiTr(X)=\sum{a_{ii}}Tr(X)=aii,矩阵的迹,对角线的和。
  2. 核范数:A∈Rm×n,∣∣A∣∣∗=∑i=1rσiA\in R^{m×n},||A||_*=\sum_{i=1}^{r}{\sigma_i}ARm×n,A=i=1rσi
    1. σi为A的所有非零奇异值,r=rank(A)\sigma_i 为A的所有非零奇异值,r=rank(A)σiA,r=rank(A)
    2. 奇异值:设A为m∗nm*nmn阶矩阵,q=min(m,n)q=min(m,n)q=min(m,n)A∗AA*AAA的q个非负特征值的算术平方根叫作A的奇异值。

1.3 矩阵内积

  1. Frobenius内积:常用来表示两个矩阵(张成的空间)之间的夹角
  2. 定义:<A,B>=defTr(ABT)=∑∑aijbij<A,B>\overset{def}{=}Tr(AB^T)=\sum\sum{a_{ij}b_{ij}}<A,B>=defTr(ABT)=aijbij

二、导数

2.1 梯度、海瑟矩阵

  1. 梯度:lim⁡p→0f(x+p)−f(x)−gTp∣∣p∣∣=0\underset{p\rightarrow 0}{\lim}\frac{f(x+p)-f(x)-g^Tp}{||p||}=0p0limpf(x+p)f(x)gTp=0
    • ∣∣⋅∣∣||·||是任意向量范数,g为fff在x点处的梯度
  2. 海瑟矩阵:f(x):Rn→Rf(x):R^n\rightarrow Rf(x):RnR
    在这里插入图片描述
    1. 二阶可微:∇2f(x)\nabla^2f(x)2f(x)在区域D上的每个点x都存在
    2. 二阶连续可微:∇2f(x)\nabla^2f(x)2f(x)在D上还连续,可以证明此时海瑟矩阵还是对称矩阵。
  3. 雅克比矩阵J(x)J(x)J(x),f:Rn→Rmf:R^n\rightarrow R^mf:RnRm是向量值函数
    在这里插入图片描述
  4. 梯度利普希茨连续:
    1. 可微函数fff,若存在L>0L>0L>0,对任意x,y∈domfx,y\in domfx,ydomf∣∣∇f(x)−∇f(y)∣∣≤L∣∣x−y∣∣||\nabla f(x)-\nabla f(y)||\leq L||x-y||f(x)f(y)Lxy,称fff是梯度利普希茨连续的,LLL为相应的函数,称为L−光滑L-光滑L
    2. 二次上界:f(x)可微,且为L−光滑,则f(x)有二次上界:f(y)≤f(x)+∇f(x)T(y−x)+L2∣∣y−x∣∣2f(x)可微,且为L-光滑,则f(x)有二次上界:f(y)\leq f(x)+\nabla f(x)^T(y-x)+\frac{L}{2}||y-x||^2f(x)Lf(x)f(y)f(x)+f(x)T(yx)+2Lyx2
    3. f(x)可微,存在全局极小点x∗,且f(x)为L−利普希茨连续f(x)可微,存在全局极小点x^*,且f(x)为L-利普希茨连续f(x),x,f(x)L则:12L∣∣∇f(x)∣∣2≤f(x)−f(x∗)\frac{1}{2L}||\nabla f(x)||^2\leq f(x)-f(x^*)2L1f(x)2f(x)f(x)

2.2矩阵变量的导数

  1. Gâteaux可微:t→0limf(X+tV)−f(X)−t<G,V>t=0\overset{lim}{t\rightarrow0}\frac{f(X+tV)-f(X)-t<G,V>}{t}=0t0limtf(X+tV)f(X)t<G,V>=0
    • G,V∈Rm×nG,V\in R^{m×n}G,VRm×n

2.3自动微分

  1. 链式法则
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值