已经搭建好环境,开始学习加州房价机器学习例子,目标理解相关概念,掌握机器学习例子开发流程! 加油,每天一点点进步!
学习前的几点困惑?怎么训练数据集?怎么清洗数据?这个例子用的是线性回归模型?可不可以用别的模型呢?用这个例子的框架,可不可以换成我自己的一个数据集呢,不是房价的,其他的书籍,是不是要修改一些属性,模型本身不用变吧,工作量有多大?怎样让我的应用程序调用这个机器学习例子吗?有接口吗?好多疑问,期待学习之后能够找到答案!
加油!
2025.4.15
参考网址:
按照教程继续补全加州房价例子代码,运行看看结果,边做边学吧!
查看数据统计信息,成功,
增加可视化分布代码,运行失败,提示少matplotlib,用pip安装,再运行,出错,提示少seaborn,继续pip安装,再运行,终于成功了




相关性分析,增加代码,运行成功,但需要关闭上一个柱状图窗口才能看到运行结果
数据清洗与预处理
检查缺失值,成功

数据标准化,运行之后没看到什么结果!待分析
训练一个简单的模型,划分数据集,训练线性回归模型,运行成功

感受:比预想的简单,训练一个线性回归模型,几行代码就实现了,可是很多不明白
线性回归模型不太了解
python编程没变过,代码语法不清楚
数据集格式是是啥,不清楚
怎么输出参数及其权重?哪个参数对房价影响最大,在哪里看,用什么代码?
如果构建自己的模型,改改算法,怎么办?
2005

被折叠的 条评论
为什么被折叠?



