
数据科学
bufanq
这个作者很懒,什么都没留下…
展开
-
相关与因果关系
相关表示两个变量之间存在关联,但并不是因果关系。《爱上统计学》一书给了一个例子:在美国中西部的一个小镇,地方警察局局长发现冰淇淋消费量越多,犯罪率就越高。这个例子中,冰淇淋消费量和犯罪率是正相关的,但并不意味着冰淇凌消费的增多导致了犯罪率的上升,更不可能通过减少冰淇凌的销售来降低犯罪率。事实上,存在某个变量同时和冰淇淋消费量、犯罪率相关,这个变量就是室外温度。当室外气温变暖,如在夏天,就会有更多犯...原创 2018-02-09 15:26:04 · 10567 阅读 · 0 评论 -
Pearson相关系数、余弦相似度、修正余弦相似度
Pearson相关系数刻画变量间线性关系的强弱。余弦相似度,指通过计算两个向量的夹角余弦值来评估它们的相似度。修正余弦相似度,指中心化(减去平均值)后再求余弦相似度。1. 从数学角度看,给定向量X和Y,Pearson相关系数和修正余弦相似度的计算是相同的,它们的关系参考下面的链接: https://www.cnblogs.com/tracer-dhy/p/5808323...原创 2018-02-08 09:48:15 · 18073 阅读 · 2 评论