
数学基础
文章平均质量分 84
数学基础与特征工程
整得咔咔响
再难,我也想和你一起学算法!!!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
矩阵向量求导
矩阵向量的求导在深度学习中要用到。有必要对矩阵向量求导做一个介绍。在微积分里面,我们学过标量y对标量x的求导:我们做一个延申,如果y是一个向量:里面每个yi都对同一个x求导,那么我们称为...原创 2021-01-31 00:00:00 · 2719 阅读 · 1 评论 -
无穷小、梯度向量和泰勒展开
1.梯度方向是函数增加最快的方向2.负梯度方向是函数减小最快的方向3.与梯度正交的方向函数的变化率为零4.梯度为0只是函数取极值的必要条件而不是充分条件,即梯度为0的点可能不是极值点5....原创 2020-10-18 12:30:00 · 1085 阅读 · 0 评论 -
你真的理解【条件概率】吗
1.场景引入条件概率是指,在事件A已经发生的条件下,事件B发生的概率。数学表达式为:P(B|A)它的计算公式为:P(B|A)=P(AB)/P(A)这是高中就学过的概念,对于此大家肯定不陌...原创 2020-08-07 07:15:00 · 1888 阅读 · 1 评论 -
贝叶斯思维
贝叶斯公式本质是观点随事实发生变化(D更新的概率) = P(D|T) = (似然比)X (D的先验概率)似然比衡量的是,该疾病的患者得到阳性检测结果比一般群体要高多少1.观点随事实变化最...原创 2020-08-07 07:15:00 · 1789 阅读 · 0 评论 -
期望、方差、协方差与相关系数
1.利用切比雪夫不等式可以证明方差为0意味着随机变量的取值集中在一点上2.从协方差可以得到两个变量增减的趋势,称为相关性3.“不相关”比“独立”更弱的概念,“独立”必导致“不相关”,“不...原创 2020-09-18 22:30:00 · 4012 阅读 · 0 评论 -
十二种概率分布及python实现
1.常见离散分布有四种:二项分布、泊松分布、超几何分布和几何分布2.常见连续分布有五种:正态分布、均匀分布、指数分布、伽玛分布和贝塔分布3.三大抽样分布为:卡方分布、F分布和t分布4.泊...原创 2020-09-12 10:30:00 · 4071 阅读 · 0 评论 -
高斯分布
1.高斯分布的MLE参数估计的均值是无偏的,方差有偏2.二维正态分布的等概率曲线是一个椭圆3.n维正态分布的边缘分布和条件分布都是正态分布高斯分布是概率论和统计学最重要的分布,在机器学习...原创 2020-09-19 19:30:00 · 1329 阅读 · 0 评论 -
高斯分布补充知识点
为了更好的学习高斯回归过程及后续的更多算法,比如高斯混合模型,高斯回归,贝叶斯优化等。这节对高斯分布基础知识做个补充,高斯分布基础篇请看高斯分布话不多说,先定义问题其中,x|u表示在给定...转载 2020-10-11 15:05:00 · 213 阅读 · 0 评论 -
假设检验(一)
1.假设检验是建立在小概率事件原理上的一种反证法2.小概率事件原理指的是小概率事件在一次随机试验中一般是不可能发生的3.假设检验通常有四步:建立假设;选择检验统计量,给出拒绝域形式;选...原创 2020-08-27 22:23:13 · 1908 阅读 · 0 评论 -
假设检验(二)
1.假设检验可以分为参数检验和非参数检验2.参数检验是在总体服从某一分布情况下,检验其参数的可信度3.参数检验一般包含正态分布参数检验和其他分布参数检验(指数分布、比率p和大样本等)...原创 2020-08-28 22:54:37 · 3692 阅读 · 0 评论 -
假设检验(三)
1.方差分析是检验多个正态分布的均值问题2.其思想是组内均方与组间均方是否有显著差异,从而构造F检验统计量3.方差分析有三假设:每一总体服从正态分布(假设1)且各总体方差相同(假设2),...原创 2020-08-29 12:08:22 · 1422 阅读 · 0 评论 -
假设检验(四)
1.其他参数检验主要有指数分布参数检验、比率p检验和大样本检验2.比率p检验是检验某件事发生的概率,也即0-1分布发生的概率是否显著3.当样本充分大时,比率p检验比较难计算,可利用大样本...原创 2020-08-30 00:01:06 · 1279 阅读 · 0 评论 -
假设检验(五)
1.验证总体是否服从正态分布可用正态性检验,通过正态概率图、W检验和EP检验验证2.游程检验可以对样本进行随机性检验,也可以检验两个总体是否有相同的分布3.符号检验主要用来对总体p分位数...原创 2020-09-01 19:56:26 · 1948 阅读 · 1 评论 -
假设检验(六)
1.卡方拟合优度检验可判断分类变量的k个水平的频数分布是否与理论分布一致2.列联表独立性分析用来考察两个分类变量之间是否相关3.对于2*2列联表分析,要细分三种情形:皮尔逊卡方值检验、连...原创 2020-09-03 12:42:20 · 955 阅读 · 0 评论 -
特征工程之编码化
编码化1.编码化是把变量通过某种方式映射成更符合逻辑或更易入模的特征的一种方法2.特征工程主要有三种编码方法:标签编码、独热编码和woe编码3.标签编码是把定序文本类别变量转化成数值类别...原创 2020-08-09 00:00:00 · 766 阅读 · 0 评论 -
特征工程之归一化
1.归一化是将有量纲的表达式,经过线性变换,化为无量纲的表达式2.目的是为了消除指标之间量纲的影响,以解决数据指标之间的可比性3.归一化能提高梯度下降最优求解速度,还有可能提高精度4.归...原创 2020-08-08 00:00:00 · 874 阅读 · 0 评论 -
特征工程之降维(PCA)
1.降维是指用一组个数为 d 的向量 Zi 来代表个数为 D 的向量 Xi 所包含的有用信息2.数据降维使得数据集更易使用,确保变量之间彼此独立和降低算法计算运算成本3.高维空间上样本是...原创 2020-08-19 08:00:00 · 987 阅读 · 0 评论 -
特征工程之降维(KPCA)
1.KPCA主要思想是先将样本映射到高维空间,再在高维空间中使用线性降维的方法2.核函数可以直接对特征向量的内积进行变换,等价于先对特征向量做核映射然后做内积3.KPCA算法流程有四步:...原创 2020-08-21 00:00:00 · 4386 阅读 · 0 评论 -
特征工程之降维(LDA)
1.LDA是一种特征抽取的技术,用于分类任务的降维方法2.其目标是向最大化类间差异,最小化类内差异的方向投影3.LDA算法实现大致有六步:标准化数据集,均值化每个类别向量,计算类内散度矩...原创 2020-08-20 00:00:00 · 2221 阅读 · 0 评论 -
特征工程之降维(MDS)
MDS是线性降维的一种方法,全称是多维尺度变换算法。该算法以距离为标准,将高维坐标中的点投影到低维坐标中,保持彼此之间的相对距离变化最小。它解决的问题是:当n个对象之间的相似性给定,确定...原创 2020-08-25 09:29:39 · 2530 阅读 · 4 评论 -
python基础班结业回顾
经过一个月的学习,基础班毕业了,首先,恭喜自己考试通过,顺利进入进阶班!在明天正式进入进阶班前,恰逢周末,就把基础班的知识重新梳理一遍,也当做个复习巩固!基础班要掌握的内容有八个模块:上...原创 2018-08-05 21:54:04 · 237 阅读 · 0 评论 -
线程、进程与并发通信
线程和进程是计算机的一种术语,它是操作系统的概念,使得计算机同时运行多个程序。要很好的理解线程和线程,首先要知道一点计算机的底层逻辑:计算机的每一个指令(比如打开QQ,敲一个文字到wor...原创 2018-09-08 19:30:47 · 586 阅读 · 0 评论 -
本地电脑Hive语句实战
Hive是大数据平台的查询语句,其语法基本与SQL类似,小编在自己笔记本电脑上VirtualBox虚拟机上通过docker安装了一个docker-hive-on-tez容器,就可以练习了...原创 2020-08-23 00:00:00 · 496 阅读 · 1 评论