深度学习图像分类:从MLP到CNN的探索
1. 模型输出与离散标签获取
在深度学习中,模型通常会输出与标签 0 到 9 相关的十个概率。可以通过计算这些概率的 Nx.argmax 来获取离散标签,示例代码如下:
probabilities |> Nx.argmax()
输出结果如下:
#Nx.Tensor<
s64
EXLA.Backend<host:0, 0.4078460682.4224843782.56658>
3
>
这就是我们期望的输出。此时,你已经拥有了一个模型、训练好的模型状态,并且能够使用任意输入查询训练好的模型。
2. 深度学习与前馈网络概述
深度学习在处理某些类型的问题时比其他方法更有效。前馈网络(如多层感知机 MLP)是常见的神经网络类型,可用于解决许多复杂问题,但在某些问题上存在局限性。
3. 识别猫和狗的图像分类问题
假设你运营一个社交媒体网站,用户可以发布和查看动物图片。为简化网站,不要求用户为图片添加额外信息,但希望用户能根据图片是猫还是狗来过滤内容。这时可以使用机器学习来实现。
3.1 数据集获取
首先,前往 Kaggle 下载 “Cats vs. Dogs” 训练数据集,该数据集包含 25000 张图片(12500 张猫的图片和 12500 张狗的图片),下载后将其解压到你选择的工作目录下的 t
超级会员免费看
订阅专栏 解锁全文
1617

被折叠的 条评论
为什么被折叠?



