- 博客(6)
- 收藏
- 关注
转载 推荐几个python代码规范神器
Python编程语言需要遵循PEP8规范,但是初学者往往记不住这个规范,代码写得比较丑。本文推荐几个神器来拯救奇丑无边的python代码。一、Jupyter notebook 篇Jupyter notebook的代码要想写得规范,推荐用Code prettify插件。安装插件*首先插件Nbextensions执行以下命令:pip install jupyter_contrib_nbex...
2019-07-15 23:03:23
2598
原创 特征降维之PCA
主成分分析简介定义: PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据进行线性变换、映射到低维空间中,使得各维度线性无关的表示,可用于提取数据的主要特征分量。作用:数据维数压缩,尽可能降低原数据的维数(复杂度),损失少量数据信息。应用:回归分析、聚类分析PCA原理简单介绍基变换向量表示向量即有大小和方向的量,例如向...
2019-01-18 19:37:57
4159
原创 windows 10 环境下在anaconda中安装minepy
常规pip安装报错:一般在anaconda中安装包,打开Anaconda Prompt基于windows的终端执行pip install minepy,会出现如下错误:发现又缺少编译器——Visual C++ Build Tools(注:这个是微软为 Python 3.5 提供的编译器),看出错结果显示:error: Microsoft Visual C++ 14.0 is requir...
2019-01-12 20:03:18
4088
6
原创 特征工程之降维
什么是降维降维是指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程为什么降维在实际的机器学习项目中,降维是必须进行的,因为在数据中存在以下几个方面的问题:(1)数据的多重共线性:特征属性之间存在着相互关联关系。多重共线性会导致解的空间不稳定, 从而导致模型的泛化能力弱;(2)高纬空间样本具有稀疏性,导致模型比较难找到数据特征;(3)过多的变量会妨碍模型查找规律...
2019-01-02 22:55:09
2554
原创 特征工程之归一化
为什么要进行数据归一特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响(支配)目标结果,使得一些算法无法学习到其它的特征, 需要用到一些方法进行无量纲化,使不同规格的数据转换到同一规格两种常用归一化方法(1)min-max标准化(线性函数归一化)定义:即离差标准化,是对原始数据的线性变换,使得结果映射到[0,1]之间,其本质就是将数据变换为[0,1]之间的...
2019-01-01 22:56:35
676
原创 特征工程之特征抽取
特征抽取简介将任意数据(如文本或图像)转换为可用于机器学习的数字特征,具体如下几个方面:1、字典特征提取(特征离散化)2、文本特征提取3、图像特征提取(深度学习部分,本文介绍机器学习部分)特征抽取API:sklearn.feature_extraction字典数据特征抽取API介绍:sklearn.feature_extraction.DictVectorizer(sparse...
2018-12-30 19:22:48
488
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人