数学在数据与概率中的应用
在数据处理和概率分析的领域中,有许多重要的数学概念和方法。下面将介绍一些关键的数学知识及其应用。
杰卡德度量
杰卡德度量直观上是一个介于 0 和 1 之间的数值。当这个数值接近 0 时,表明人们之间的差异较大;而当数值接近 1 时,则意味着人们彼此相似。
从定义上看,分子代表用户共同喜欢的商店数量,分母代表他们喜欢的所有独特商店的总数。
以下是用 Python 实现杰卡德度量的代码:
user1 = {"Target", "Banana Republic", "Old Navy"}
user2 = {"Banana Republic", "Gap", "Kohl's"}
def jaccard(user1, user2):
stores_in_common = len(user1 & user2)
stores_all_together = len(user1 | user2)
return stores_in_common / stores_all_together
# 使用新的杰卡德函数
print(jaccard(user1, user2)) # 0.2 或 1/5
集合论在概率和处理高维数据时非常重要。我们可以用集合来表示现实世界中发生的事件,而概率则是在集合论的基础上添加了相关的词汇。
线性代数
在电影推荐引擎中,为了给用户提供准确和个性化的推荐,需要运用多个数学概念。当有 10000 部电影可供推荐时,计算效率就成为了关键因
超级会员免费看
订阅专栏 解锁全文
1570

被折叠的 条评论
为什么被折叠?



