- 博客(4)
- 收藏
- 关注
原创 机器学习过程中的一些小问题
对于回归问题,一般使用其他指标来评估模型的性能,例如均方误差(Mean Squared Error,MSE)、均方根误差(Root Mean Squared Error,RMSE)、平均绝对误差(Mean Absolute Error,MAE)等。当面对数据较少但目标变量过多的回归问题时,由于数据的不足,模型可能难以准确地拟合这么多目标变量,这可能导致R方指标较低。在二分类问题中,F1指标可以用于综合评估模型的性能,尤其在样本不平衡的情况下。它的值介于0和1之间,数值越接近1表示模型的性能越好。
2023-09-16 11:37:06
119
1
原创 怎么修改DataFrame数据类型列名
然后,我们通过字典或函数定义了新的列名。最后,我们使用 rename() 方法或直接赋值给 columns 属性来修改列名。通过 inplace=True 参数或直接赋值来确保修改应用到原始 DataFrame 中。要修改 DataFrame 的列名,可以使用 rename() 方法来实现。rename() 方法允许你指定一个字典或函数来重新命名列名。注意:rename() 方法返回一个新的 DataFrame,而直接修改 df.columns 是在原始 DataFrame 上进行的修改。
2023-09-14 17:19:41
1050
1
原创 数据分析中为什么要进行pd.get_dummies()操作?
请注意,进行独热编码并不是所有情况下都必要的。对于一些算法(如决策树),可以直接使用分类变量,而无需进行独热编码。但对于其他需要数值输入的算法,或者在分类变量中存在多个类别时,独热编码可以提供更好的特征表示。在数据分析中,pd.get_dummies() 是 pandas 库中的一个函数,用于进行独热编码(One-Hot Encoding)。独热编码是将分类变量转换为二进制向量的常用技术。
2023-09-14 14:58:35
811
1
原创 机器学习入门建议
本文将介绍机器学习的基本概念、学习方法,以及本人在学习过程中的感悟,以供初学者参考,希望能够帮以助大家更好地学习《机器学习》这门课程。
2023-09-07 09:24:19
178
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人