- 博客(6)
- 收藏
- 关注
原创 纯小白的Sklearn学习(决策树)-day(6)
feature_name = ['酒精','苹果酸','灰','灰的碱性','镁','总酚','类黄酮','非黄烷类酚类','花青素','颜色强度','色调','od280/od315稀释葡萄酒','脯氨酸']# 用pandas的concat方法将数据拼接并按照列的方式拼接,具体日后要实验axis参数并加深体会,但是这个数据并没有在下面代码中用到,做他干什么呢?,class_names=["琴酒","雪梨","贝尔摩德"]# 划分训练集和测试集。
2025-03-31 13:53:39
612
原创 纯小白的Sklearn学习(逻辑回归)-day(5)
数据里面包含无效数据“?”,所以在数据处理阶段需要对这些数据进行替换和删除,此两行命令就是这个干这事儿的,将所有?替换成NaN,这里没理解太透彻,就是理解为将一些乱七八糟的无效数据统一替换成NaN,这个叫什么。1、导入数据后是乱的,需要定义column_names列名,然后用names参数添加列名(表头)到数据中,表示缺失值的常量,Numpy库就是这么定义的,想删除数据必须要替换成Nunmy认识的好处理的NaN?,是对数据进行切片截取然后在赋予给x的过程,本案例为取全部行,第一列到倒数第二列的所有数据。
2025-03-28 09:49:13
637
原创 纯小白的Sklearn学习(岭回归)-day(4)
data = pd.read_csv("C:/Python-Project/梯度下降/price_boston_housing.txt")print('模型的偏置是:\n',estimator.intercept_)print('模型的系数是:\n',estimator.coef_)可以正常运行,但是预测结果准确性很差,不知道为什么。# 机器学习,此处为与前面章节的不同指出。print('均方差为:\n',ret)补充波士顿房价预测(岭回归)
2025-03-25 23:51:56
334
原创 纯小白的Sklearn学习(梯度下降)-day(3)
3、读进去后发现pandas的数据格式和Numpy的格式是不一样的,所以就不能按教程一步一步操作了,只能自己摸索。2、读文件,教程里面的读文件是直接在load_boston完成的,不知道怎么的我就不行,所以网上download了txt版本的数据,然后用read方式读进去。# 将数据分离成了数据和目标集合,但是往下不会了,因为train_test_split需要的是array格式,下一步转换数据才能继续进行。重点代码:XX1 = data_1[["CRIM","ZN","INDUS"]]
2025-03-25 00:22:59
558
原创 纯小白的Sklearn学习(线性回归)-day(2)
这比较好理解,没啥说的,主要是用案例补代码基础知识的时候,对文件读取这一步的格式有疑问,报错warning直接扔给大模型基本上就能解决了。就是pd.read_csv我以为可以直接改成txt,后来发现直接读csv也行。print("预测的结果是:\n",estimator.predict(DataFrame_1[["score_1","score_2"]]))print("线性回归的系数是:\n",estimator.coef_)# 读入文件,训练集文件和预测集文件。# 建立线性回归API。
2025-03-22 21:10:25
159
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人