Task01：线性回归& Softmax与分类模型、多层感知机

最新推荐文章于 2022-01-23 00:20:00 发布

原创最新推荐文章于 2022-01-23 00:20:00 发布 · 223 阅读

CC 4.0 BY-SA版权

2 篇文章

订阅专栏

本文介绍了机器学习中的分类问题，包括监督学习的线性回归、Softmax回归以及多层感知机。深度学习部分讲解了数据操作，如PyTorch中的Tensor运算，以及自动求梯度的重要性。通过实例阐述了广播机制，并讨论了神经网络训练中的梯度下降法。

部署运行你感兴趣的模型镜像

深度学习基于神经网络模型和数据编程思想。

在PyTorch中，Tensor（张量）用于存储数据和变换操作。

增改
- view()改变形状（仅改变了对这个张量的观察角度shape/size，内部数据并为改变）
- clone()创建一个副本再使用view
加减乘
- mm/bmm, 矩阵乘
- t，矩阵求转置
- inverse, 矩阵求逆
- svd，奇异值分解
广播机制
Tensor的shape不一样时，若要进行运算，需要使用广播机制
例如：

x = torch.arange(1, 3).view(1, 2)
print(x)
y = torch.arange(1, 4).view(3, 1)
print(y)
print(x + y)

输出：

tensor([[1, 2]])
tensor([[1],
        [2],
        [3]])
tensor([[2, 3],
        [3, 4],
        [4, 5]])

解释：
由于x和y分别是1行2列和3行1列的矩阵，如果要计算x + y，那么x中第一行的2个元素被广播（复制）到了第二行和第三行，而y中第一列的3个元素被广播（复制）到了第二列。如此，就可以对2个3行2列的矩阵按元素相加。

自动求梯度
PyTorch提供autograd包，能够根据输入和前向传播过程自动构建计算图，并执行反向传播。
Q：为什么要求梯度？
A：构造神经网络，是通过实验方式获得，即通过梯度下降法（Gradient Descent Method，SGD）求得局部机制——凸优化理论

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理