
算法
weixin_42294517
这个作者很懒,什么都没留下…
展开
-
机器学习之线性回归算法原理推导
1、什么是回归假设线性回归是个黑盒子,那按照程序员的思维来说,这个黑盒子就是个函数,然后呢,我们只要往这个函数传一些参数作为输入,就能得到一个结果作为输出。那回归是什么意思呢?其实说白了,就是这个黑盒子输出的结果是个连续的值。如果输出不是个连续值而是个离散值那就叫分类。那什么叫做连续值呢?非常简单,举个栗子:比如我告诉你我这里有间房子,这间房子有40平,在地铁口,然后你来猜一猜我的房子总共值多少...原创 2020-02-14 15:21:35 · 697 阅读 · 0 评论 -
机器学习 数据预处理之标签编码
1、什么是标签编码将字符型的特征映射为整数(将字符串转换为整数)但没有被广泛使用因为求平均值之类的数据会出现问题(不过具体需求具体分析)有[dog,cat,dog,mouse,cat],我们把其转换为[1,2,1,3,2]。这里就产生了一个奇怪的现象:dog和mouse的平均值是cat。所以目前还没有发现标签编码的广泛使用(不过在决策树,随机森林对数据值不做要求的算法中是常见的)调用库包代码...原创 2020-02-13 15:08:37 · 4413 阅读 · 0 评论 -
机器学习 数据预处理之独热编码
1、什么是独热编码让由0和1组成的占位符取表示每列特征,让不同样本之间相同特征之间的两两距离(两两差异)相同例: 特征1 特征2 特征3 数据集 1 3 2 7 5 4 1 8 ...原创 2020-02-13 14:58:02 · 1154 阅读 · 0 评论 -
机器学习 数据预处理之归一化
1、什么是归一化为了用占比表示特征,每个样本的特征值除以该样本的特征值绝对值之和(对行《样本》操作),使得每个样本的特征值绝对值之和为1 (这里的一般可以在某个东西的增长率或者占比的时候使用)例如: python java C PHP2017 30 50 40 ...原创 2020-02-13 14:24:31 · 645 阅读 · 2 评论 -
机器学习数据预处理之范围缩放
1、什么是范围缩放 统一样本矩阵中的不同特征的最大值和最小值的范围。(一般都是0-1) 例如设样本集为X [0, 1, 2, 3,4, 5 ] 范围缩放到【0-1】后 X1 [0, 0.2, 0.4, 0.6, 0.8, 1]kmin+ b = min’ =0 原本特征中的最小值转换为0(每列特征的k.b都不一样)kmax+b = max’=1 原本特征中的...原创 2020-02-13 14:09:58 · 1492 阅读 · 0 评论