2021.7.28魔鬼训练报告

最新推荐文章于 2024-07-25 02:17:32 发布

weeekly

最新推荐文章于 2024-07-25 02:17:32 发布

阅读量162

点赞数

分类专栏： 2021数学表达式魔鬼训练报告

本文链接：https://blog.youkuaiyun.com/qq_35368303/article/details/119190535

版权

2021数学表达式魔鬼训练报告专栏收录该内容

5 篇文章

订阅专栏

这篇博客详述了一次魔鬼训练的内容，包括数学表达式的操作，如累加、累乘、积分，三重累加的应用，定积分的手算与程序验证，最小二乘法的验证例子，线性回归的公式推导，以及逻辑回归的损失函数推导、特点分析。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

数学表达式魔鬼训练

作业

将向量下标为偶数的分量 ( $x_2, x_4, \dots$ ) 累加, 写出相应表达式.
$\sum_{i \mod2 =0} {x_i }$
各出一道累加、累乘、积分表达式的习题, 并给出标准答案.
(1)将100以内的, $\mod3=0$ 的数累加起来
$\sum_{1\leq i \leq100, i \mod3 =0} i$
(2)写出 $1, 2, . . ., 10$ 分之一的积
$\prod_{i = 1}^{10} \frac{1}{i}$
(3)求以原点为中心，半径为R的圆的面积
$\int_{-R}^{+R} 2\pi R \mathrm{d}x$
你使用过三重累加吗? 描述一下其应用.
$\sum_{1\leq i\leq100}\sum_{1\leq j\leq100}\sum_{1\leq k\leq100} \left(x_{ijk}\right)$
给一个常用的定积分, 将手算结果与程序结果对比.
定积分： $\int_{1}^{2} x \mathrm{d}x$
手算： $\int_{1}^{2} x \mathrm{d}x = \frac{1}{2}x^2 |_{1}^2=\frac{3}{2}$
程序：

from sympy import *
x = symbols(‘x’)
print(integrate(x, (x, 1, 2)))

自己写一个小例子来验证最小二乘法.

$\left[\begin{array}{c}\alpha \\ \beta\end{array}\right]=\left(\left[\begin{array}{cc}1 & x_{1} \\ 1 & x_{2} \\ \vdots & \vdots \\ 1 & x_{n}\end{array}\right]^{T}\left[\begin{array}{cc}1 & x_{1} \\ 1 & x_{2} \\ \vdots & \vdots \\ 1 & x_{n}\end{array}\right]\right)^{-1}\left[\begin{array}{cc}1 & x_{1}\\ 1 & x_{2}\\ \vdots & \vdots \\ 1 & x_{n}\end{array}\right]^{T}\left[\begin{array}{c}y_{1} \\ y_{2} \\ \vdots \\ y_{n}\end{array}\right]$

$\mathbf{X} = [1,2,3],\mathbf{Y} = [2,3,7]$
$\begin{bmatrix} \alpha \\ \beta\end{bmatrix}\quad = \begin{bmatrix} 2.5 \\ -1\end{bmatrix}\quad$
得： $y = 2.5 x - 1$
6. 线性回归公式推导
推导过程参考2020年魔鬼训练闵老师授课内容。
损失函数： $\sum_{i=1}^{m}\left(\mathbf{x}_{i} \mathbf{w}-y_{i}\right)^{2}$
矩阵化表达： $\|\mathbf{X} \mathbf{w}-\mathbf{Y}\|^{2}$
矩阵化展开式： $L(\mathbf{X}, \mathbf{Y}, \mathbf{w})=(\mathbf{X} \mathbf{w}-\mathbf{Y})^{\mathrm{T}}(\mathbf{X} \mathbf{w}-\mathbf{Y})$
求解推导： $\begin{aligned} &L(\mathbf{X}, \mathbf{Y}, \mathbf{w}) \\ &=(\mathbf{X} \mathbf{w}-\mathbf{Y})^{\mathrm{T}}(\mathbf{X} \mathbf{w}-\mathbf{Y}) \\ &=\left(\mathbf{w}^{\mathrm{T}} \mathbf{X}^{\mathrm{T}}-\mathbf{Y}^{\mathrm{T}}\right)(\mathbf{X} \mathbf{w}-\mathbf{Y}) \\ &=\mathbf{w}^{\mathrm{T}} \mathbf{X}^{\mathrm{T}} \mathbf{X} \mathbf{w}-\mathbf{w}^{\mathrm{T}} \mathbf{X}^{\mathrm{T}} \mathbf{Y}-\mathbf{Y}^{\mathrm{T}} \mathbf{X} \mathbf{w}+\mathbf{Y}^{\mathrm{T}} \mathbf{Y} \end{aligned}$
对 $\mathbf{w}$ 求导，让其结果为0。由矩阵求导法则得： $\begin{aligned} &\frac{\partial A \mathbf{w}}{\partial \mathbf{w}}=A \\ &\frac{\partial \mathbf{w}^{\mathrm{T}} A}{\partial \mathbf{w}}=A^{\mathrm{T}} \\ &\frac{\partial \mathbf{w}^{\mathrm{T}} A \mathbf{w}}{\partial \mathbf{w}}=2 \mathbf{w}^{\mathrm{T}} A \end{aligned}$
可知：
$\begin{aligned} &\frac{\partial L(\mathbf{X}, \mathbf{Y}, \mathbf{w})}{\partial \mathbf{w}} \\ &=\frac{\partial \mathbf{w}^{\mathrm{T}} \mathbf{X}^{\mathrm{T}} \mathbf{X} \mathbf{w}}{\partial \mathbf{w}}-\frac{\partial \mathbf{w}^{\mathrm{T}} \mathbf{X}^{\mathrm{T}} \mathbf{Y}}{\partial \mathbf{w}}-\frac{\partial \mathbf{Y}^{\mathrm{T}} \mathbf{X} \mathbf{w}}{\partial \mathbf{w}}+\frac{\partial \mathbf{Y}^{\mathrm{T}} \mathbf{Y}}{\partial \mathbf{w}} \\ &=2 \mathbf{w}^{\mathrm{T}} \mathbf{X}^{\mathrm{T}} \mathbf{X}-\mathbf{Y}^{\mathrm{T}} \mathbf{X}-\mathbf{Y}^{\mathrm{T}} \mathbf{X}+0 \\ &=2 \mathbf{w}^{\mathrm{T}} \mathbf{X}^{\mathrm{T}} \mathbf{X}-2 \mathbf{Y}^{\mathrm{T}} \mathbf{X} \end{aligned}$
由
$\hat{\mathbf{w}}^{\mathrm{T}} \mathbf{X}^{\mathrm{T}} \mathbf{X}-2 \mathbf{Y}^{\mathrm{T}} \mathbf{X}=0$
可得
$\hat{\mathbf{w}}^{\mathrm{T}} \mathbf{X}^{\mathrm{T}} \mathbf{X}=\mathbf{Y}^{\mathrm{T}} \mathbf{X}$
两边转置
$\mathbf{X}^{\mathrm{T}} \mathbf{X} \hat{\mathbf{w}}=\mathbf{X}^{\mathrm{T}} \mathbf{Y}$
最后
$\hat{\mathbf{w}}=\left(\mathbf{X}^{\mathrm{T}} \mathbf{X}\right)^{-1} \mathbf{X}^{\mathrm{T}} \mathbf{Y}$
7. 自己推导一遍逻辑回归, 并描述这个方法的特点 (不少于 5 条).
损失函数看做概率问题：下式越大越好 $P\left(y_{i} \mid \mathbf{x}_{i} ; \mathbf{w}\right)=\left(\sigma\left(\mathbf{x}_{i} \mathbf{w}\right)\right)^{y_{i}}\left(1-\sigma\left(\mathbf{x}_{i} \mathbf{w}\right)\right)^{1-y_{i}}$
求似然函数：假设训练样本独立, 且同等重要

为获得全局最优, 将不同样本涉及的概率连乘, 获得似然函数：
$\begin{aligned} L(\mathbf{w}) &=P(\mathbf{Y} \mid \mathbf{X} ; \mathbf{w}) \\ &=\prod_{i=1}^{m} P\left(y_{i} \mid \mathbf{x}_{i} ; \mathbf{w}\right) \\ &=\prod_{i=1}^{m}\left(\sigma\left(\mathbf{x}_{i} \mathbf{w}\right)\right)^{y_{i}}\left(1-\sigma\left(\mathbf{x}_{i} \mathbf{w}\right)\right)^{1-y_{i}} \end{aligned}$
对数函数具有单调性：
$\begin{aligned} l(\mathbf{w}) &=\log L(\mathbf{w}) \\ &=\log \prod_{i=1}^{m} P\left(y_{i} \mid \mathbf{x}_{i} ; \mathbf{w}\right) \\ &=\sum_{i=1}^{m} y_{i} \log \sigma\left(\mathbf{x}_{i} \mathbf{w}\right)+\left(1-y_{i}\right) \log \left(1-\sigma\left(\mathbf{x}_{i} \mathbf{w}\right)\right) \end{aligned}$
损失函数（平均损失）： $\min _{\mathbf{w}} \frac{1}{m} \sum_{i=1}^{m}-y_{i} \log \sigma\left(\mathbf{x}_{i} \mathbf{w}\right)-\left(1-y_{i}\right) \log \left(1-\sigma\left(\mathbf{x}_{i} \mathbf{w}\right)\right)$
优化目标： $\min _{\mathbf{w}} \frac{1}{m} \sum_{i=1}^{m}-y_{i} \log \sigma\left(\mathbf{x}_{i} \mathbf{w}\right)-\left(1-y_{i}\right) \log \left(1-\sigma\left(\mathbf{x}_{i} \mathbf{w}\right)\right)$

梯度下降法，迭代式推导：
由于
$\begin{gathered} l(\mathbf{w})=\sum_{i=1}^{m} y_{i} \log \sigma\left(\mathbf{x}_{i} \mathbf{w}\right)+\left(1-y_{i}\right) \log \left(1-\sigma\left(\mathbf{x}_{i} \mathbf{w}\right)\right) \\ \frac{\partial l(\mathbf{w})}{\partial w_{j}}=\sum_{i=1}^{m}\left(\frac{y_{i}}{\sigma\left(\mathbf{x}_{i} \mathbf{w}\right)}-\frac{1-y_{i}}{1-\sigma\left(\mathbf{x}_{i} \mathbf{w}\right)}\right) \frac{\partial \sigma\left(\mathbf{x}_{i} \mathbf{w}\right)}{\partial w_{j}} \\ =\sum_{i=1}^{m}\left(\frac{y_{i}}{\sigma\left(\mathbf{x}_{i} \mathbf{w}\right)}-\frac{1-y_{i}}{1-\sigma\left(\mathbf{x}_{i} \mathbf{w}\right)}\right) \sigma\left(\mathbf{x}_{i} \mathbf{w}\right)\left(1-\sigma\left(\mathbf{x}_{i} \mathbf{w}\right)\right) \frac{\partial \mathbf{x}_{i} \mathbf{w}}{\partial w_{j}} \\ =\sum_{i=1}^{m}\left(\frac{y_{i}}{\sigma\left(\mathbf{x}_{i} \mathbf{w}\right)}-\frac{1-y_{i}}{1-\sigma\left(\mathbf{x}_{i} \mathbf{w}\right)}\right) \sigma\left(\mathbf{x}_{i} \mathbf{w}\right)\left(1-\sigma\left(\mathbf{x}_{i} \mathbf{w}\right)\right) x_{i j} \\ \quad=\sum_{i=1}^{m}\left(y_{i}-\sigma\left(\mathbf{x}_{i} \mathbf{w}\right)\right) x_{i j} \end{gathered}$
逻辑回归可以自己写例如或者直接调包