
数学
文章平均质量分 69
当前与统计和线性代数相关
V丶Chao
记录自己的学习过程,时常反思,时常进步
展开
-
numpy的相关使用方法
20210211 -引言之前的时候,一些关于numpy的内容都记录在另一篇文章中《pandas及numpy - 常用操作》,里面大部分都是pandas的操作,但是最近使用numpy比较多了之后,也积累了一些内容,所以这里专门记录一下。内容列表拼接空数组距离的计算向量的重复生成数组逆序1. 拼接空数组最近的实验中,需要按照列来拼接相应的结果,但是一开始需要一个空数组来指定,代码逻辑就是创建一个空数组,然后在训练中,按照列来拼接,使用的函数就是np.hstack。但是一开始的时候需要创建原创 2021-02-11 21:36:40 · 399 阅读 · 0 评论 -
Mahalanobis距离的计算
20210306 -0.引言通过scipy的距离库[1],可以方便的计算向量空间中两个点的距离,例如欧式距离,cos距离等,使用方法可以见[2]。而这个函数cdist在计算该距离的时候,通过集中方法,结果上却稍有不同,在这里记录一下,主要研究在数据量比较大的时候如何计算,如果仅仅是两个点的距离,直接使用from scipy.spatial.distance import mahalanobis即可,这要是为什么要引入cdist的原因。1. cdist如果是使用cdist的话,使用方法跟欧式距离没有什原创 2021-03-06 21:44:10 · 770 阅读 · 0 评论 -
数学的科普文
20210105这次又是整理自己的书签,然后发现了这个文章,这个文章应该是很久之前的时候我看到的,觉得很有趣,应该是当时学习最小二乘法的时候看到的,所以这篇文章就来记录一些平时看到的不错的科普文,以前很多文章都错过了,挺可惜的。正态分布的前世今生 (上)...原创 2021-01-05 20:58:30 · 797 阅读 · 0 评论 -
先验概率及后验概率等解释
20201010 -0. 引言在学习统计学的时候,在概率估计的部分,经常会遇到最大似然估计,最大后验估计等名词,这些似然和后验,都跟贝叶斯准则中的一些名词定义有关。这里参考书籍《Think Bayes》这部书,来记录这些名词。1. 由糖果例子来解释名词用最简单的一句话来说,贝叶斯准则就是一个公式,这个公式在考试的时候只要你会用,把问题形式化之后,甚至于有些题目直接给你了要求解的最终目标,都不用你对问题进行分析,直接套用公式就行了。但在实际问题的处理中,还是需要对问题的深入理解。考试考了高分,不代表解原创 2020-10-10 22:49:27 · 1768 阅读 · 1 评论 -
异常检测:从异常检测到PCA再到特征向量
20201001 -0. 引言最近的精力比较杂,当时仅仅是想学习《异常点检测》中的某个章节,但是因为遗忘的知识太多,导致又得学习更多的东西,比如线性代数的东西。很多概念在本科的时候都学过,所以捡起来也不是那么难,但是想马上得心应手的用起来,肯定是要花点功夫的。在最近看的几个主体中,我就发现了一个非常重要的概念,那就是特征向量。其实这个东西,本身没什么难点嘛,大一学习的线性代数,不就是几个公式,然后求一求就出来了。当时的应试场景下,这样肯定是没什么问题的,但是当真正需要利用这个东西的实际意义的时候,而不原创 2020-10-01 22:41:38 · 1602 阅读 · 0 评论 -
线性代数 - 矩阵形式下的最小二乘法
20201001 -0. 引言最近在看《异常点检测》的时候,其中在PCA部分(准确来说是前面一小节)在进行推导的时候,使用了最小二乘法。其实这个东西本质上并不难,但是让我比较尴尬的是,很多线性代数的东西有些遗忘了,好在最近直截了当的复习让大部分知识都回顾了。1. 问题关于具体的推导过程就不说了,各种公式都有,直接的结论也都有。但是这里之前的时候,产生了一个问题。本来最小二乘法是利用垂直距离来定义的(也就是预测变量与相应的平面与坐标中平行的距离),但是有些书上都提到了投影距离。然后他们也用了最下二乘法原创 2020-10-01 09:12:37 · 4615 阅读 · 0 评论 -
线性代数 - 特征向量和特征值
今天在看到这个马汉诺拉距离的时候,又看到了这个东西。就是利用特征值来进行协方差方向上的伸缩,突然感觉到了线性代数的作用了。。。。。但是实际上,我今天看到了非常多的内容,但是都没有吸收完,很多内容都是线性代数的东西,但是这些东西我都忘了。。。...原创 2020-09-30 22:11:54 · 655 阅读 · 0 评论 -
线性代数的本质 - 线性变换
20200929 -最近在看《异常点检测》这本书,然后看到了线性模型中的内容,这里涉及到了特征变量的东西。只不过,因为已经很久没有涉及线性代数的东西,这部分内容大部分都遗忘了,但是大致上翻了翻也基本上弄明白了。不过,这里我看到了几个点,后续应该可以用到。首先,矩阵是线性变换的本质,即使不是方阵也是有变换的过程的。然后,就是学习PCA的时候看到的内容,这部分内容是说他本质上就是找特征变量的过程。后面还是要把这部分内容好好记录记录,https://www.bilibili.com/video/BV1原创 2020-09-29 21:33:57 · 907 阅读 · 0 评论 -
大数定理
2017/12/29我一直对这个大数定理不理解,为什么就这么重要。学了这么多年的概率论,而且,这么多年了也一直没事就看到这些东西,但是还真的没有让我感觉的这个东西的重要性。http://www.cnblogs.com/vamei/p/3460965.html这个地方也是把原理给讲出来了,他也没有真正的去说怎么去应用。!!!!!对,这个词说的对, 应该是应用层面的东西没有很好的给解析出...原创 2017-12-29 21:12:34 · 381 阅读 · 0 评论