机器学习应用数学基础-微分上

最新推荐文章于 2023-10-31 11:39:23 发布

原创最新推荐文章于 2023-10-31 11:39:23 发布 · 177 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #数学

机器学习同时被 2 个专栏收录

6 篇文章

订阅专栏

应用数学

4 篇文章

订阅专栏

本文介绍了大O符号O(n)和小o符号o(n)在算法复杂度中的含义，展示了它们在极限和导数理论中的应用。讨论了导数作为函数变化率的概念，以及在寻找函数极值中的作用。同时，提到了泰勒展开式和函数逼近，以及凸函数的特性。内容涵盖了数学分析的基础概念，对于理解算法效率和优化问题具有重要意义。

部署运行你感兴趣的模型镜像

O(n)和 o(n)

O(n)

$f (x) = O (g (x))$

order 阶，多项式阶
数学表述： $∃X0,M,f(x)≤Mg(x)\exists X_0,M,f(x)\leq Mg(x)$
举例： $M=2，2x^2=O(x^2),x_0任意$

o(n)

数学表述： $∀ε,∃X0,f(x)≤εg(x)\forall\varepsilon,\exists X_0,f(x)\leq \varepsilon g(x)$
意义：当x足够大时，可以在任意 $ε\varepsilon$ 条件下成立

极限

$X->\infty ,\frac{f(x)}{g(x)}->0$
$X->x_1,f(x)->y_1$

导数

基本运算

含义
函数在某一点的变化率
python实现

import sympy as sp  #载入包

str_expr = "x**3-x*3"  
expr = sp.sympify(str_expr)  
print(sp.diff(expr))

求导的方法

（1）四则运算
+： $(f(x)±g(x))′=f(x)′±g(x)′(f(x)\pm g(x))'=f(x)'\pm g(x)'$
$×:(uv)′=u′v+uv′\times:(uv)'=u'v+uv'$
$÷:(uv)′=u′v−uv′v2\div:(\frac{u}{v})'=\frac{u'v-uv'}{v^2}$

（2）复合函数（链式法则）
$f(g(x))]'=f'(g(x_0))*g'(x_0)$
与神经网络关系密切

导数应用

费马定理
$f (x)$ 在区间内，当 $X=x_0$ 时，存在极值=> $f’(x_0)=0$ ；
反之不见得成立（反例： $y=x^3$ ），但可以作为寻找极值的参考。

推导:
$x<x0,lim⁡x−>x0f(x)−f(x0)x−x0≥0x<x_0,\lim_{x->x_0}\frac{f(x)-f(x_0)}{x-x_0}\geq 0$
$x<x0,lim⁡x−>x0f(x)−f(x0)x−x0≤0x<x_0,\lim_{x->x_0}\frac{f(x)-f(x_0)}{x-x_0}\leq 0$
$f′(x)即≥0又≤0，所以f′(x)=0f'(x)即\geq 0又\leq 0，所以f'(x)=0$

函数逼近
$f(x)−f(x0)x−x0=f′(x0)=>f(x)=f(x0)+f′(x0)(x−x0)\frac{f(x)-f(x_0)}{x-x_0}=f'(x_0)=>f(x)=f(x_0)+f'(x_0)(x-x_0)$

意义：非线性的函数可以用斜率为 $f'(x_0)$ 的线性函数近似表示

（1）Rolle中值定理
$f'(x_2)=0, x_0<x_2<x_1,f(x_0)=f(x_1)=0$

（2）拉格朗日中值定理
$x和x0之间的斜率=f(x)−f(x0)x−x0=f′(x1),x0<x1<xx和x_0之间的斜率=\frac{f(x)-f(x_0)}{x-x_0}=f'(x_1),x_0<x_1<x$

泰勒展开

目的：更精细的拟合f(x)
为了研究函数逼近和函数本身差多少，引入泰勒展开：
$函数逼近:f(x)≈f(x0)+f′(x0)(x−x0)函数逼近:f(x)\approx f(x_0)+f'(x_0)(x-x_0)$
$拉格朗日:f(x)=f(x0)+f(x1)(x−x0)，x1∈[x0,x]拉格朗日:f(x)=f(x_0)+f(x_1)(x-x_0)，x_1\in[x_0,x]$
$f(x)=f(x0)+{(x−x0)f′(x0)+...+(x−x0)Nf(N)(x0)N!+o((x−x0)N)}f(x)=f(x_0)+\{(x-x_0)f'(x_0)+...+(x-x_0)^N\frac{f^{(N)}(x_0)}{N!}+o((x-x_0)^N)\}$