Gradient Descent Vectorization

  • 我们假定XXX为数据集,其中每一行x(i)x^{(i)}x(i)为一个样本,列数代表其特征数量;
  • YYY为其真实值,每行y(i)y^{(i)}y(i)与每个输入样本对应;
  • Θ\ThetaΘ为每个特征的权重;
    X=[x0(0)x1(0)⋯xn(0)x0(1)x1(1)⋯xn(1)⋮⋮⋱⋮x0(m)x0(m)⋯x0(m)]=[x(0)x(1)⋮x(m)] X = \left[ \begin{matrix} x_0^{(0)} & x_1^{(0)} & \cdots & x_n^{(0)} \\ x_0^{(1)} & x_1^{(1)} & \cdots & x_n^{(1)} \\ \vdots & \vdots & \ddots & \vdots\\ x_0^{(m)} & x_0^{(m)} & \cdots & x_0^{(m)} \end{matrix} \right] = \left[ \begin{matrix} x^{(0)} \\ x^{(1)} \\ \vdots \\ x^{(m)} \end{matrix} \right] X=x0(0)x0(1)x0(m)x1(0)x1(1)x0(m)xn(0)xn(1)x0(m)=x(0)x(1)x(m)

Y=[y(0)y(1)⋮y(m)] Y = \left[ \begin{matrix} y^{(0)} \\ y^{(1)} \\ \vdots\\ y^{(m)} \\ \end{matrix} \right] Y=y(0)y(1)y(m)

Θ=[θ0θ1⋮θn] \Theta = \left[ \begin{matrix} \theta_0 \\ \theta_1 \\ \vdots \\ \theta_n \\ \end{matrix} \right] Θ=θ0θ1θn

神经网络结构
如图所示为一个简单的神经网络,仅包含一个输入层和一个输出层,没有任何的隐藏层;对于其中的某一个样本x(i)x^{(i)}x(i)来说,其输出的预测值y^(i)\hat y^{(i)}y^(i)为:
(1)y^(i)=θ0x0(i)+θ1x1(i)+...+θnxn(i)=x(i)θ \hat y^{(i)} = \theta_0x_0^{(i)} + \theta_1x_1^{(i)} + ... + \theta_nx_n^{(i)} = x^{(i)}\theta \tag{1} y^(i)=θ0x0(i)+θ1x1(i)+...+θnxn(i)=x(i)θ(1)
则所有样本的预测值Y^\hat YY^为:
Y^=[y^(0)y^(1)⋮y^(m)] \hat Y = \left[ \begin{matrix} \hat y^{(0)} \\ \hat y^{(1)} \\ \vdots \\ \hat y^{(m)} \end{matrix} \right] Y^=y^(0)y^(1)y^(m)
我们以预测值与真实值的平方误差为损失函数LLL
(2)L=1m∑i=1m12(y^(i)−y(i))2=12m∑i=1m(x(i)θ−y(i))2 L = \frac{1}{m}\sum_{i=1}^m\frac{1}{2}(\hat y^{(i)} - y^{(i)})^2 \\ = \frac{1}{2m}\sum_{i=1}^m( x^{(i)}\theta - y^{(i)})^2 \tag{2} L=m1i=1m21(y^(i)y(i))2=2m1i=1m(x(i)θy(i))2(2)
假设我们现在要计算θj\theta_jθj经梯度下降后的更新值,其中α\alphaα为学习率:
(3)θj=θj−α∂L∂θj \theta_j = \theta_j - \alpha\frac{\partial L}{\partial \theta_j} \tag{3} θj=θjαθjL(3)
我们对损失函数,即公式(2)求θj\theta_jθj的微分:
(4)∂L∂θj=1m∑i=1m(x(i)θ−y(i))∂(x(i)θ)∂θj=1m∑i=1m(x(i)θ−y(i))xj(i) \frac{\partial L}{\partial \theta_j} = \frac{1}{m}\sum_{i=1}^m( x^{(i)}\theta - y^{(i)})\frac{\partial( x^{(i)}\theta)}{\partial \theta_j} \\ =\frac{1}{m}\sum_{i=1}^m( x^{(i)}\theta - y^{(i)})x_j^{(i)} \tag{4} θjL=m1i=1m(x(i)θy(i))θj(x(i)θ)=m1i=1m(x(i)θy(i))xj(i)(4)
我们记e(i)=x(i)θ−y(i)e^{(i)} = x^{(i)}\theta -y^{(i)}e(i)=x(i)θy(i),用EEE表示所有的e(i)e^{(i)}e(i)有:
E=[e(0)e(1)⋮e(m)]=[x(0)θ−y(0)x(1)θ−y(1)⋮x(m)θ−y(m)]=XΘ−Y E=\left[ \begin{matrix} e^{(0)} \\ e^{(1)} \\ \vdots \\ e^{(m)} \end{matrix} \right]= \left[ \begin{matrix} x^{(0)}\theta -y^{(0)} \\ x^{(1)}\theta -y^{(1)} \\ \vdots \\ x^{(m)}\theta -y^{(m)} \end{matrix} \right] = X\Theta-Y E=e(0)e(1)e(m)=x(0)θy(0)x(1)θy(1)x(m)θy(m)=XΘY

则公式(4)可表示为:
(5)∂L∂θj=1m∑i=1me(i)xj(i)=1m(xj(0),xj(1),...,xj(m))E \frac{\partial L}{\partial \theta_j}=\frac{1}{m}\sum_{i=1}^me^{(i)}x_j^{(i)} \\ =\frac{1}{m}(x_j^{(0)},x_j^{(1)},...,x_j^{(m)})E \tag{5} θjL=m1i=1me(i)xj(i)=m1(xj(0),xj(1),...,xj(m))E(5)
将公式(5)代入公式(3)中可以得到:
(6)θj=θj−α1m(xj(0),xj(1),...,xj(m))E \theta_j = \theta_j - \alpha\frac{1}{m}(x_j^{(0)},x_j^{(1)},...,x_j^{(m)})E \tag{6} θj=θjαm1(xj(0),xj(1),...,xj(m))E(6)
因此,我们可以得到所有权重的梯度更新为:
Θ=[θ0θ1⋮θn]=[θ0θ1⋮θn]−αm[x0(0)x0(1)⋯x0(m)x1(0)x1(1)⋯x1(m)⋮⋮⋱⋮xn(0)xn(1)⋯xn(m)]E=Θ−αmXTE=Θ−αmXT(XΘ−Y) \Theta = \left[ \begin{matrix} \theta_0 \\ \theta_1 \\ \vdots \\ \theta_n \\ \end{matrix} \right] = \left[ \begin{matrix} \theta_0 \\ \theta_1 \\ \vdots \\ \theta_n \\ \end{matrix} \right] - \frac{\alpha}{m} \left[ \begin{matrix} x_0^{(0)} & x_0^{(1)} & \cdots & x_0^{(m)} \\ x_1^{(0)} & x_1^{(1)} & \cdots & x_1^{(m)} \\ \vdots & \vdots & \ddots & \vdots\\ x_n^{(0)} & x_n^{(1)} & \cdots & x_n^{(m)} \end{matrix} \right]E \\ = \Theta- \frac{\alpha}{m}X^TE=\Theta- \frac{\alpha}{m}X^T(X\Theta-Y) Θ=θ0θ1θn=θ0θ1θnmαx0(0)x1(0)xn(0)x0(1)x1(1)xn(1)x0(m)x1(m)xn(m)E=ΘmαXTE=ΘmαXT(XΘY)

资源下载链接为: https://pan.quark.cn/s/22ca96b7bd39 在 IT 领域,文档格式转换是常见需求,尤其在处理多种文件类型时。本文将聚焦于利用 Java 技术栈,尤其是 Apache POI 和 iTextPDF 库,实现 doc、xls(涵盖 Excel 2003 及 Excel 2007+)以及 txt、图片等格式文件向 PDF 的转换,并实现在线浏览功能。 先从 Apache POI 说起,它是一个强大的 Java 库,专注于处理 Microsoft Office 格式文件,比如 doc 和 xls。Apache POI 提供了 HSSF 和 XSSF 两个 API,其中 HSSF 用于读写老版本的 BIFF8 格式(Excel 97-2003),XSSF 则针对新的 XML 格式(Excel 2007+)。这两个 API 均具备读取和写入工作表、单元格、公式、样式等功能。读取 Excel 文件时,可通过创建 HSSFWorkbook 或 XSSFWorkbook 对象来打开相应格式的文件,进而遍历工作簿中的每个 Sheet,获取行和列数据。写入 Excel 文件时,创建新的 Workbook 对象,添加 Sheet、Row 和 Cell,即可构建新 Excel 文件。 再看 iTextPDF,它是一个用于生成和修改 PDF 文档的 Java 库,拥有丰富的 API。创建 PDF 文档时,借助 Document 对象,可定义页面尺寸、边距等属性来定制 PDF 外观。添加内容方面,可使用 Paragraph、List、Table 等元素将文本、列表和表格加入 PDF,图片可通过 Image 类加载插入。iTextPDF 支持多种字体和样式,可设置文本颜色、大小、样式等。此外,iTextPDF 的 TextRenderer 类能将 HTML、
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值