有三AI 1000问回归,备战秋招,更多,更快,更好,等你来战!

有三AI1000问专栏回归,在知识星球中以子版块形式日更。该专栏以引导思考为主,通过知识卡片形式更新,内容聚焦于易被忽视但关键的小问题,旨在激发读者深入思考。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

640?wx_fmt=png

文/编辑 | 言有三

最近遇到了很多朋友来询问《有三AI 1000问》在哪里?本来我做这个专栏的初衷只是想提醒大家要多主动思考,多注意细节,没想到击中了很多同学的痛点,不过之前已经停更了。今天就是要告诉大家,有三AI 1000问回归了,在《有三AI知识星球》中作为一个子板块进行日更


什么是有三AI 1000问

我们有各种各样的技术专栏,不过都是用长文讲述“大”问题,而1000问的内容讲述的是小问题,从内容和形式来说有几个特点。

(1) 内容


讲述足够通用与聚焦,容易被忽视,习以为常但确实很关键的问题,从而激发大家进行更多的思考。


不会入选的内容如:“目标检测的最新进展”,"怎么设计更高效的模型”等主题。会入选的内容如:“为什么图像分类输入大小多是224*224”,“OpenCV中彩色图像的顺序为什么是BGR而不是RGB”。


(2) 创作风格

这一个专栏以引导思考,填补知识空洞为主,用知识卡片(见下文)的形式进行更新。希望大家在比较轻松的进行阅读思考的同时能够获得知识,在即将到来的秋招面试中也能助大家一臂之力。

如何更新内容

接下来这个板块将会在有三AI知识星球中进行连载更新,涉及的内容非常多,暂定以下几个方向,根据安排可能会进行调整。

640?wx_fmt=png

下面就来先感受几个案例吧:

有三AI1000问-模型篇

为什么深度学习图像分类模型输入大小多是224*224呢?

640?wx_fmt=png

做过图像分类项目的小伙伴们应该都知道,在论文中进行各类方法的比较时,要求使用同样的数据集。而为了公平的比较,网络的输入大小通常都是224*224的大小,那为什么呢?有同学思考过这个问题吗?

作者/编辑 言有三

我们都知道,一个图像分类模型通常是如下的流程。

640?wx_fmt=png

输入image->卷积网络层->最后特征图->全连接特征->分类器输出。

最后一个卷积特征图常见的大小可以是3*3,5*5,7*7等等。

特征图如果尺寸太小,那么信息就丢失太严重,如果尺寸太大,信息的抽象层次不够高,计算量也更大,7*7的大小是一个很好的平衡。

另一方面,图像从大分辨率降低到小分辨率,降低倍数通常是2的指数次方,所以图像的输入一定是7*2的指数次方。以ImageNet为代表的大多数分类数据集,图像的长宽在300分辨率左右。

所以要找一个7*2的指数次方,并且在300左右的分辨率作为输入,其中7*2的4次方=7*16=112,7*2的5次方等于7*32=224,7*2的6次方=448,与300最接近的就是224了。

当然对于实际的项目来说,有的不需要这么大的分辨率,比如手写数字识别,有的要更大,比如细粒度分类。

有三AI1000问-机器学习篇

为什么要分验证集和测试集呢?

640?wx_fmt=png

机器学习的教材,很多公开数据集中都会教我们要将数据集分为训练集,验证集和测试集,看起来验证集和测试集并没有区别,为什么要分这两个呢?

作者/编辑 言有三

验证集和测试集的定位是不同的,一个模型需要有好的泛化能力,需要同时在训练过的数据和没训练过的数据集上取得好的结果。

640?wx_fmt=png

我们将训练集用于训练,验证集用于调参数,它们是从同一个数据集进行随机拆分得来,验证集扮演的是一个辅助模型增加泛化能力的作用。


而测试集不同,它仅仅用于最后评估模型的性能,可能也来自于同一个数据集,也可能不是,因此它和训练集/验证集的数据分布有可能不同。对于比赛用的公开数据集,验证集会公开标注,测试集不会公开。

有三AI1000问-图像篇

为什么OpenCV存储的图像格式是BGR呢?

640?wx_fmt=png

做图像处理的我们应该都知道,OpenCV是我们必备的一个工具,在使用OpenCV读取图像时你应该也发现了读取出来的数组是BGR的顺序,而不是我们听的最多,用的最多的RGB格式,这是为什么呢?有同学思考过这个问题吗?

作者/编辑 言有三

当我们用OpenCV库读取图片时,读取后的通道排列是BGR,而用PIL库则是RGB,假如我们将PIL读取的图用OpenCV直接显示,就会如下面右图,颜色是不对的,新手非常容易犯错。

640?wx_fmt=png

之所以这样主要是历史原因。OpenCV在1999年由Intel建立,当时主流的摄像头制造商和软件供应商提供的摄像头采集的图像的通道排列顺序就是BGR。另一方面,Windows中显示图片的基本格式是BMP,其中RGB颜色阵列存储的格式就是按照BGR的顺序。

640?wx_fmt=png

正是基于BGR已经被广泛使用,于是早期OpenCV开发者就选择BGR颜色格式,这也就成为了一种规范一直用到现在。

为什么选择知识星球

AI 1000问会全部在知识星球中输出,每天至少3期。为什么不选择在公众号输出?原因有几个。

(1) 发文次数限制。公众号一天只能发一次文章,无法实时高频次输出。

(2) 无法实时讨论。1000问的问题未必会有唯一答案,应该激发大家进行讨论,社区更适合,而且对于好的回答,我们要给予奖励。

(3) 内容太短。1000问内容都比较短,而我们公众号的内容都是长文,所以不适合在公众号进行连载。

(4) 方便大家保存。有三将所有的内容作成了卡片的形式,方便大家本地存储,随时查看。

(5) 希望大家进一步支持有三AI。我们也做了一年了,一直坚持只做高质量的原创,平台内容都超过70万字,因此也希望铁杆粉丝们能够在有三AI星球中继续支持我们,共同优化我们的学习平台。

话不多说了,需要的朋友就来参与吧。知识星球每日还有模型架构和数据集的干货分享,以有三AI之名,承诺物超所值。

640?wx_fmt=jpeg

转载文章请后台联系

侵权必究

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

言有三

三人行必有AI

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值