- 博客(9)
- 收藏
- 关注
原创 机器学习中独热编码算法介绍及使用举例
独热编码(One-Hot Encoding)是一种将分类数据转换为数值数据的常用方法,特别是在处理机器学习模型时。它将每个类别表示为一个二进制向量,其中只有一个元素为 1,其余元素为 0。许多机器学习模型(如线性回归、逻辑回归、决策树等)无法直接处理分类数据,因为它们只能处理数值数据。独热编码将分类变量转换为数值形式,使模型能够处理这些数据。这种格式可能占用更多内存,但在处理较小数据集时更易于操作和查看。每个类别都被转换成一个长度为 3 的向量,其中对应类别的位置为 1,其余位置为 0。
2024-10-10 21:12:44
330
原创 在线性回归和逻辑回归中添加正则化
高λ值,增加对权重的惩罚(为了降低J,模型在迭代中就会想办法降低参数w的值,过拟合减少,但可能导致模型更简单)低λ值,减少对权重的惩罚,可能使模型更复杂(过拟合风险增加)。
2024-10-10 19:23:00
184
原创 利用python pandas库 手动实现机器学习中的特征缩放算法
此处代码使用kaggle中泰坦尼克号项目预测的数据集用以举例。1,Z-score标准化。
2024-10-10 17:49:50
382
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人