深度学习从入门到不想放弃-6

本文介绍了向量距离的不同类型,包括欧氏距离、曼哈顿距离和切比雪夫距离,以及它们在不同场景的应用。此外,讨论了在数据分布的流形面上如何处理距离,并提出了贾卡尔距离和余弦相似度,尤其强调了余弦相似度在处理稀疏数据和评估相关性时的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

   这节要讲完距离基础部分就真完事了,不继续在基础中求得基础了,我发现也没人看

Image

       书接前文深度学习从入门到不想放弃-5 (qq.com)

       前文书写到要合理的设计特征是什么概念,我们再拿两个例子复习一下

      比如一个卖车网站,上节我们讲过对物体识别可以用RGB来表示颜色的维度,那在卖车网站合适吗,其实是不合适的,因为,RGB潜在就有颜色大小区分,比如深蓝,浅蓝,有大小就会产生算法倾斜;那对于一个卖车网站,颜色就15种,你直接one-hot编码15个维度的向量就可以了

Image

      另外比如下图是一个企业级的社交网络简化版,我们就可以通过各个同事之间的关系,来通过one-hot来实现关系的表达

Image

      但是这个东西放微信或者微博里又基本扯淡了,因为上亿用户,所以另一个结论,特征设计,抛开量级不谈即使同一场景也是耍流氓

      由上图也引出了我们今天的内容远近,比如AB和CD究竟谁和谁的关系最好,我们就拿向量的远近来衡量,这个远近就叫做向量距离!

如果两个向量通过距离进行相似度比较,那么以下几条是基本要求:

Image

1-欧氏距离

我们都知道两点之间的距离,线段最短

Image

但是这是针对点来说的,可是我们面对的对象是两个向量做比较,比如:

      

Image

      在这种情况下,我们就需要把两个向量的所有的维度分别做减法,然后进行平方,再做加和做开方,这样的目的是保证欧氏距离不会出现负数,满足基本要求里的非负性

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值