- 博客(4)
- 收藏
- 关注
原创 数字识别篇 (一) : 了解数据和处理数据
房地产不太景气 在每次开始之前都需要先运行以下代码,不报错方可继续 # Python 的版本需要大于3.5 import sys assert sys.version_info >= (3, 5) # Scikit-Learn的版本需要大于0.20 import sklearn assert sklearn.__version__ >= "0.20" import numpy as np import os #绘图设置 %matplotlib inline import matp
2021-04-16 23:24:05
2470
1
原创 加州房价篇 (三) : 模型的训练,评估和房价的预测
万事俱备! 运行本篇文章代码时必须先按顺序运行加州房价篇 (一) : 了解数据和加州房价篇 (二) : 处理数据中的所有代码 在正式开始之前,我们得先把我们的数据分成训练集(train set)和测试集(test set),因为要避免过度拟合(overfit),在中文里,矫枉过正的意思和过度拟合非常像, 打个比方,我现在在和女生甲谈恋爱,我问甲喜欢什么样的男生,甲说她喜欢短头发的男生,还说她喜欢听歌,喜欢吃辣,合计一百条规矩,我按照这些标准去要求自己,和甲处的很好,后来因为一些原因我和甲分手了,我又和
2021-04-12 16:20:10
833
原创 加州房价篇 (二) : 处理数据
现在是时候对数据动一动手脚了 运行本篇文章代码时必须先运行加州房价篇 (一) : 了解数据中的所有代码 在正式处理数据之前,我们需要先把median_house_value(地区房屋均价)这一特征摘出来,这是我们的目标,无需处理 housing_target = housing["median_house_value"].copy() housing = housing.drop("median_house_value", axis=1) 处理数据 还记得我们在加州房价篇 (一) : 了解数据中一开始
2021-04-12 16:10:39
711
原创 加州房价篇 (一) : 了解数据
加州房价篇 (一) : 了解数据 让我们先从加利福尼亚州的房价说起 如果没有接触过机器学习,需要先进行环境配置 在每次开始之前都需要先运行以下代码,不报错方可继续 # Python 的版本需要大于3.5 import sys assert sys.version_info >= (3, 5) # Scikit-Learn的版本需要大于0.20 import sklearn assert sklearn.__version__ >= "0.20" import numpy as n
2021-04-12 15:59:51
2026
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅