3、图像数字识别:从基础到验证

图像数字识别:从基础到验证

1. 机器学习中的距离函数

在机器学习里,距离函数是个关键概念。我们可以通过对图像像素差异求和,用一个数字来概括两张图像的差异程度。相似图像的这个数字小,不相似的则大,这就定义了图像间的“距离”。两张完全相同的图像距离为 0,像素差异越大,距离越大。

不过,这种相似度衡量方法有局限性。比如,将一张图像向左平移一个像素,尽管本质上图像相同,但逐像素计算的距离可能会很大。

距离函数在机器学习中很重要,多数模型都会以某种形式用到它。它能把复杂的图像转化为一个数字,让算法可以据此判断图像是否相似。但这样做也有风险,可能会丢失一些图像的细微特征。

距离函数在机器学习中也常被称为成本函数,只是看待问题的角度不同。例如预测一个数字时,预测误差就是一种距离,误差大意味着“成本高”,优化模型就是降低成本。

2. 从简单方法入手

我们先别过度思考和设计,采用简单易行的方法,后续再进行优化。当要识别图像代表的数字时,我们可以在 50,000 个训练样本库中寻找最相似的图像,然后预测这个图像代表的数字。

算法步骤如下:
1. 计算待识别图像(“Unknown”)与每个训练样本的总差异。
2. 找出差异最小的训练样本(“Closest”)。
3. 预测“Unknown”和“Closest”代表相同的数字。

3. 第一个模型:C# 版本

3.1 数据集组织

首先需要数据,从 http://1drv.ms/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值