https://en.wikipedia.org/wiki/Jaccard_index
https://blog.youkuaiyun.com/qq_26710805/article/details/79855226
杰卡德系数(Jaccard Index),也称Jaccard相似系数(Jaccard similarity coefficient),用于比较有限样本集之间的相似性与差异性。如集合间的相似性、字符串相似性、目标检测的相似性、文档查重等。
Jaccard系数的计算方式为:交集个数和并集个数的比值
J ( A , B ) = ∣ A ⋂ B ∣ ∣ A ⋃ B ∣ = ∣ A ⋂ B ∣ ∣ A ∣ + ∣ B ∣ − ∣ A ⋂ B ∣ J(A,B)=\frac{|A\bigcap B|}{|A\bigcup B|}=\frac{|A\bigcap B|}{|A|+|B|-|A\bigcap B|} J(A,B)=∣A⋃B∣

Jaccard相似系数是衡量有限样本集之间相似性和差异性的指标,广泛应用于集合相似性、字符串比较、目标检测等领域。计算公式为交集元素数除以并集元素数。Jaccard距离则是1减去相似系数,表示两集合不同的样本比例。
最低0.47元/天 解锁文章
2927

被折叠的 条评论
为什么被折叠?



