距离度量与房屋价值评估相关知识解析
1. 距离度量概述
距离度量在很多领域都有重要应用,常见的距离类型有几何距离、计算距离和统计距离。
1.1 余弦相似度(Cosine Similarity)
余弦相似度也叫余弦距离,它的优势在于计算稀疏向量间距离的速度极快。例如,若收集了房屋的 1000 个属性,其中 300 个是互斥的(即一个房子有而其他房子没有),那么计算时只需考虑 700 个维度。其函数为:
[d(x, y)=\frac{x \cdot y}{|x||y|}]
这里的 (|x|) 表示前面提到的欧几里得距离。
1.2 计算距离(Computational Distances)
以计算城市中两点间的距离为例,若使用欧几里得距离,通过坐标(经度、纬度)计算,如从华盛顿州肯莫尔的圣爱德华州立公园(47.7329290, -122.2571466)到华盛顿州西雅图国会山的维瓦奇浓缩咖啡店(47.6216650, -122.3213002),计算如下:
(\sqrt{(47.73 - 47.62)^2 + (-122.26 + 122.32)^2} \approx 0.13)
此结果是以经纬度度数表示的,将其转换为英里需乘以 69.055,约为 8.9 英里(14.32 公里),但实际距离是 14.2 英里(22.9 公里),误差较大。这是因为地球是椭球体,距离计算与所在位置有关,不过对于短距离,该近似值还算可用。如果是开车,就需要考虑道路的限制,这引出了计算距离的概念。
- 曼哈顿距离(Manhattan Distance)
超级会员免费看
订阅专栏 解锁全文
1061

被折叠的 条评论
为什么被折叠?



