- 博客(4)
- 收藏
- 关注
原创 机器学习基本方法
损失函数:若对于给定的输入𝑥,若某个模型的输 出𝑦 '= 𝑓 '(𝑥)偏离真实目标值𝑦,那么就 说明模型存y'偏离𝑦的程度可以用关于𝑦'和𝑦某个函数来表示,作为误差的度量标准;因为如果我们过多的将坏用户当成好用户,这样后续可能发生的违约金额会远超过好用户偿还的借贷利息金额,造成严重偿失。想要预测(检测)的目标是猫,那么在数据集中猫为正样本(Positive),其他狗、兔子、狮子这些数据为负样本(Negative)。召回率越高,代表实际坏用户被预测出来的概率越高,它的含义类似:宁可错杀一千,绝不放过一个。
2024-09-17 16:21:23
1086
原创 机器学习。
传统的神经网络为BP神经网络,基本网络结构为输入层、隐藏层和输出层,节点代表神经元、边代表权重值,对输入值按照权重和偏置计算后将结果传给下一层,通过不断的训练修正权。在模型评估中,我们追求的是不仅在训练集上表现良好,更要在未知数据上保持准确,实现准确性与泛化性的最佳平衡。交叉验证通过多次分割数据训练和测试模型,有效评估模型的泛化能力,避免选择过度拟合训练数据的模型。通过交叉验证技术,如K折交叉验证,可以评估模型假设在不同数据集上的泛化能力,确保模型假设的稳健 .在机器学习中,模型假设是预测准确性的基石。
2024-09-08 00:15:14
1758
原创 机器学习算法与流程
传统的神经网络为BP神经网络,基本网络结构为输入层、隐藏层和输出层,节点代表神经元、边代表权重值,对输入值按照权重和偏置计算后将结果传给下一层,通过不断的训练修正权。深度学习包括:卷积神经网络(CNN),深度神经网络(DNN) ,循环神经网络(RNN),对抗神经网络(GAN)神经网络是基于历史数据构建的分析模型,新数据产生时需要动态优化网络的结构和参数。深度学习中训练集、开发集、测试集的样本比例一般为6:2:2、7:2:1、8:1:1。数据样本需要有足够的覆盖范围,需要覆盖与分析目标相关的维度。
2024-09-07 22:57:33
1793
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人