
机器学习
随机的未知
随机的未知
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
KNN算法和sklearn中的KNN算法
KNN基本思想 KNN是通过测量不同特征值之间的距离进行分类。它的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别,其中K通常是不大于20的整数。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 使用图来说话比较方便: 原始数据的散点图如下...原创 2018-09-09 15:45:06 · 5221 阅读 · 0 评论 -
在某一地址打开jupyter notebook
解决方法 首先在某一位置新建一个txt文本 写上 rem -- start_ipython_notebook_here.bat --- dir ipython notebook pause 再修改后缀名为 .bat 就可以了 双击它就能在这个地址打开jupyter notebok...原创 2018-09-23 16:23:05 · 2990 阅读 · 0 评论 -
特征归一化
在某些问题中,数据归一化是必不可少的。 线性归一化 公式: 该方法实现对原始数据的等比例缩放,X为原始数据,Xmax、Xmin分别为原始数据集的最大值和最小值。 此归一化方法的优缺点为 优点: 如果方差较小,可以使用此方法将特征差异放大 缺点: 容易受到数据的影响,如噪音,或者最大值最小值太极端的情况。 零均值归一化 其中X是原数据,其中是原数据的均值,是原数据的方差。 ...原创 2018-10-28 20:25:22 · 254 阅读 · 0 评论 -
利用sklearn.preprocessing.PolynomialFeatures生成交叉特征
当我们使用一次多项式拟合一组数据时,可能不太理想,如下图: 如果用直线来进行拟合的话: 如果用三次函数来拟合的话: 如何用python的sklearn库来做呢? import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.preprocessing import Pol...原创 2018-10-28 20:47:06 · 1772 阅读 · 0 评论