
数据分析
文章平均质量分 74
数据分析方法、算法及代码实现
__Bolide__
命是弱者的借口,运是强者的谦词
展开
-
pandas读取任意列的方法
pandas读取任意列的四种方法(纯干货)原创 2023-03-28 11:18:14 · 1186 阅读 · 1 评论 -
PCA数学推导
A、B均为二维向量,则A点乘B,即A与B的内积为:几何理解:A与B的内积值 = A向B所在直线投影的模 × B的模向量(3,2)包含的定义:以 x 轴和 y 轴上正方向长度为 1 的向量为标准。向量 (3,2) 实际的意思是:这个向量在x轴投影为3,y轴的投影为2即默认此向量在(1,0)与(0,1)这组基下进行投影,因为任意向量与这组基分别求内积得到结果的数值还是自身,所以直接就可以用x、y轴坐标进行表示。由此可以得出结论:准确描述向量要满足两个要点:(1)确定一组基(2)通过分别做内积求出向原创 2024-04-16 20:00:57 · 1223 阅读 · 0 评论 -
三种常用相关性系数总结:概念+代码实现
例如考察两个球队在历年联赛中的战绩之间的关系,得到的数据可能是这样的:A队在2010~2020年间的联赛排名为{1,2,4,5,…有序尺度(Ordinal scales)的数据通常用于以数值的方式来衡量非数值的概念,例如满意度,幸福度等等,还有像成绩排名啊、比赛名次啊之类的。这个单调关系是一个统计意义上的,或者说一种趋势上的,而非严格的单调。由于在皮尔逊相关计算(不管是总体的、还是样本的)中,分子(两者的协方差)和分母(各自的方差)都通过减去均值(中心化,或者均值归一化)将均值的影响消除掉了,因此。原创 2024-04-21 10:50:49 · 4719 阅读 · 0 评论