- 博客(2)
- 收藏
- 关注
原创 Bryan直播:sklearn入门:数据预处理、模型评估、模型融合——学习笔记
1.预处理当我们拿到一批原始数据以后,需要考虑以下问题:1)首先要明确有多少特征,哪些是连续的,哪些是类别特征。2)检查有没有缺失值,选择合适的缺失值填补方法,使数据保持完整。3)对连续的数值型变量进行标准化,使得均值为0,方差为1。4)对类别型的特征进行one-hot编码。5)将需要转换成类别型数据的连续型数据进行二值化。6)为防止过拟合或者其他原因,选择是否要将数据进行正则化。介绍一些pand...
2018-04-28 14:08:57
999
原创 Scrapy学习心得+应用:爬取东方财富网中的要闻精华
1.scrapy简单介绍 scarpy作为一个爬虫框架,为各类使用者提供了一种编写爬虫的模式(笔者是这么认为的)。scrapy的安装本文就不多介绍,网上到处都是。笔者本次讲解以scrapy1.4.0为例,python环境为3.6。当你成功安装scrapy后,在cmd中输入scrapy可以得到以下内容: 说明你已经成功安装scrapy。下面就是要使用scrapy来创建一个爬虫的项目。很简单...
2018-03-15 19:34:41
2810
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人