八股文——机器学习基础参数初始化

文章探讨了神经网络训练中将参数初始化为0的可行性,指出这会导致问题。讨论了权重和偏置初始化的不同情况,强调了Xavier和He初始化方法的重要性,以及如何通过调整原始样本空间和类别空间的方差来优化模型训练过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

神经网络训练时是否可以将全部参数初始化为0?

对于逻辑回归把全部参数初始化0是可以的,但在神经网络中,把参数初始化为0梯度下降算法将不会起作用

在神经网络中,参数初始化为0分为三种情况:

1.将权重w初始化为0,将偏置b初始化为0

同一隐藏层的所有神经元的输出都是一致的,对于后期不同的batch,每一隐藏层的权重都能更新,但是存在每一隐藏层的隐藏神经元的权重都是一致的,多个隐藏神经元的作用相当于一个神经元

2.将权重w初始化为0,将偏置b随机初始化

会出现参数更新慢,梯度消失,梯度爆炸等问题

3.将权重和偏置都随机初始化

参数都能更新

参数初始化的方法

整个大型前馈神经网络无非就是一个超级大的映射,将原始样本空间映射到类别空间。如果原始样本空间和类别空间差距较大,比如原始样本空间十分稀疏,类别空间十分稠密,那么在类别空间中得到的用于反向传播的误差对于样本空间根本就是微不足道的,模型训练非常缓慢;反过来如果样本空间十分稠密,类别空间十分稀疏,那么类别空间中得到的用于反向传播的误差对于样本空间就是爆炸性的,导致模型发散震荡,无法收敛。因此,就是要让原始样本空间和类别空间的方差尽量一样大。

1.Xavier初始化

2.He初始化

### 机器学习面试中的常见问题及解决方案 #### 1. 机器学习算法的类型 机器学习算法主要分为监督学习、无监督学习、半监督学习和强化学习四大类。其中,监督学习涉及有标签数据的学习过程,目标是预测未知样本的输出;而无监督学习则处理未标注的数据,主要用于聚类分析或降维等问题[^1]。 #### 2. 监督学习与无监督学习的区别 监督学习依赖于带标签的数据集进行训练,常见的算法包括线性回归和支持向量机等。相比之下,无监督学习不需标签信息即可运行,典型代表为K均值聚类(K-Means) 和主成分分析(PCA)[^2]。 #### 3. Logistic 回归的应用场景 Logistic 回归是一种广泛应用于二分类任务的经典方法。尽管名字中有“回归”,但它实际上用于解决分类问题。该技术通过构建逻辑函数(Sigmoid 函数),将连续变量映射到概率区间 (0,1),从而实现类别判断的目的[^3]。 以下是简单的 Python 实现代码: ```python import numpy as np def sigmoid(z): return 1 / (1 + np.exp(-z)) def logistic_regression(X, y, theta, alpha=0.01, iterations=1000): m = len(y) cost_history = [] for _ in range(iterations): predictions = sigmoid(np.dot(X, theta)) error = predictions - y gradient = (1/m) * np.dot(X.T, error) theta -= alpha * gradient # 记录每次迭代后的代价函数值 cost = (-1/m) * np.sum([y[i]*np.log(predictions[i]) + (1-y[i])*np.log(1-predictions[i]) for i in range(m)]) cost_history.append(cost) return theta, cost_history ``` #### 4. CART 算法的工作原理 CART 是一种决策树算法,在回归任务中采用平方误差最小化标准选取最佳分割特征;而在分类任务里,则利用基尼系数作为衡量指标来决定最优切分点[^4]。这种灵活性使得 CART 成为了许多实际应用中的首选工具之一。 #### 5. 集成学习的优势 集成学习通过组合多个基础估计器形成更强大的预测模型。这种方法不仅能够提升单个弱学习者的泛化能力,而且当各个子模型之间的错误相互独立时,整体效果往往优于任何一个单独组件的表现。 ---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值