自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 Bryan直播:sklearn入门:数据预处理、模型评估、模型融合——学习笔记

1.预处理当我们拿到一批原始数据以后,需要考虑以下问题:1)首先要明确有多少特征,哪些是连续的,哪些是类别特征。2)检查有没有缺失值,选择合适的缺失值填补方法,使数据保持完整。3)对连续的数值型变量进行标准化,使得均值为0,方差为1。4)对类别型的特征进行one-hot编码。5)将需要转换成类别型数据的连续型数据进行二值化。6)为防止过拟合或者其他原因,选择是否要将数据进行正则化。介绍一些pand...

2018-04-28 14:08:57 999

原创 Scrapy学习心得+应用:爬取东方财富网中的要闻精华

1.scrapy简单介绍    scarpy作为一个爬虫框架,为各类使用者提供了一种编写爬虫的模式(笔者是这么认为的)。scrapy的安装本文就不多介绍,网上到处都是。笔者本次讲解以scrapy1.4.0为例,python环境为3.6。当你成功安装scrapy后,在cmd中输入scrapy可以得到以下内容:   说明你已经成功安装scrapy。下面就是要使用scrapy来创建一个爬虫的项目。很简单...

2018-03-15 19:34:41 2810

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除