自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

转载 推荐几个python代码规范神器

Python编程语言需要遵循PEP8规范,但是初学者往往记不住这个规范,代码写得比较丑。本文推荐几个神器来拯救奇丑无边的python代码。一、Jupyter notebook 篇Jupyter notebook的代码要想写得规范,推荐用Code prettify插件。安装插件*首先插件Nbextensions执行以下命令:pip install jupyter_contrib_nbex...

2019-07-15 23:03:23 2598

原创 特征降维之PCA

主成分分析简介定义: PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据进行线性变换、映射到低维空间中,使得各维度线性无关的表示,可用于提取数据的主要特征分量。作用:数据维数压缩,尽可能降低原数据的维数(复杂度),损失少量数据信息。应用:回归分析、聚类分析PCA原理简单介绍基变换向量表示向量即有大小和方向的量,例如向...

2019-01-18 19:37:57 4159

原创 windows 10 环境下在anaconda中安装minepy

常规pip安装报错:一般在anaconda中安装包,打开Anaconda Prompt基于windows的终端执行pip install minepy,会出现如下错误:发现又缺少编译器——Visual C++ Build Tools(注:这个是微软为 Python 3.5 提供的编译器),看出错结果显示:error: Microsoft Visual C++ 14.0 is requir...

2019-01-12 20:03:18 4088 6

原创 特征工程之降维

什么是降维降维是指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程为什么降维在实际的机器学习项目中,降维是必须进行的,因为在数据中存在以下几个方面的问题:(1)数据的多重共线性:特征属性之间存在着相互关联关系。多重共线性会导致解的空间不稳定, 从而导致模型的泛化能力弱;(2)高纬空间样本具有稀疏性,导致模型比较难找到数据特征;(3)过多的变量会妨碍模型查找规律...

2019-01-02 22:55:09 2554

原创 特征工程之归一化

为什么要进行数据归一特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响(支配)目标结果,使得一些算法无法学习到其它的特征, 需要用到一些方法进行无量纲化,使不同规格的数据转换到同一规格两种常用归一化方法(1)min-max标准化(线性函数归一化)定义:即离差标准化,是对原始数据的线性变换,使得结果映射到[0,1]之间,其本质就是将数据变换为[0,1]之间的...

2019-01-01 22:56:35 676

原创 特征工程之特征抽取

特征抽取简介将任意数据(如文本或图像)转换为可用于机器学习的数字特征,具体如下几个方面:1、字典特征提取(特征离散化)2、文本特征提取3、图像特征提取(深度学习部分,本文介绍机器学习部分)特征抽取API:sklearn.feature_extraction字典数据特征抽取API介绍:sklearn.feature_extraction.DictVectorizer(sparse...

2018-12-30 19:22:48 488 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除