图像数字识别:从基础到验证
1. 机器学习中的距离函数
在机器学习里,距离函数是个关键概念。我们可以通过对图像像素差异求和,用一个数字来概括两张图像的差异程度。相似图像的这个数字小,不相似的则大,这就定义了图像间的“距离”。两张完全相同的图像距离为 0,像素差异越大,距离越大。
不过,这种相似度衡量方法有局限性。比如,将一张图像向左平移一个像素,尽管本质上图像相同,但逐像素计算的距离可能会很大。
距离函数在机器学习中很重要,多数模型都会以某种形式用到它。它能把复杂的图像转化为一个数字,让算法可以据此判断图像是否相似。但这样做也有风险,可能会丢失一些图像的细微特征。
距离函数在机器学习中也常被称为成本函数,只是看待问题的角度不同。例如预测一个数字时,预测误差就是一种距离,误差大意味着“成本高”,优化模型就是降低成本。
2. 从简单方法入手
我们先别过度思考和设计,采用简单易行的方法,后续再进行优化。当要识别图像代表的数字时,我们可以在 50,000 个训练样本库中寻找最相似的图像,然后预测这个图像代表的数字。
算法步骤如下:
1. 计算待识别图像(“Unknown”)与每个训练样本的总差异。
2. 找出差异最小的训练样本(“Closest”)。
3. 预测“Unknown”和“Closest”代表相同的数字。
3. 第一个模型:C# 版本
3.1 数据集组织
首先需要数据,从 http://1drv.ms/
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



