- 博客(3)
- 收藏
- 关注
原创 机器学习基本方法
举个简单的例子,比如在一个总样本中,正样本占90%,负样本占10%,样本是严重不平衡的。对于这种情况,我们只需要将全部样本预测为正样本即可得到90%的高准确率,但实际上我们并没有很用心的分类,只是随便无脑一分而已。如果这些样本点以(x,y)这样输入,输出二元组的形式出现(有数据标签),那么就可以采用监督学习的算法。训练集增加更多的数据;验证集评估出来的效果并非模型的最终效果,主要是用来调整超参数的,模型最终效果以测试集的评估结果为准。模型的复杂度太高(比如隐藏层层数设置的过多,神经元的数量设置的过大);
2024-09-17 15:16:30
775
原创 机器学习中的统计学习理论
(3)算法复杂性与过拟合:随着算法复杂性的增加,虽能拟合更复杂的数据,但过拟合风险也增大,导致泛化能力下降,需通过正则化等技术平衡。(3)交叉验证验证假设::通过交叉验证技术,如K折交叉验证,可以评估模型假设在不同数据集上的泛化能力,确保模型假设的稳健性。2.交叉验证防过拟合:通过交叉验证将数据集分割成训练集和测试集,评估模型在未见数据上的性能,减少过拟合,选择更泛化的模型。1.交叉验证避免过拟合:交叉验证通过多次分割数据训练和测试模型,有效评估模型的泛化能力,避免选择过度拟合训练数据的模型。
2024-09-07 15:49:35
1064
1
原创 机器学习算法与流程
分类算法包括预测和描述两种,经过训练集学习的预测模型在遇到未知记录时,应用规则对其进行类别划分,而描述型的分类主要对现有数据集中特征进行解释并进行区分,例如对动植物的各项特征进行描述,并进行标记分类,由这些特征来决定其属于哪一类目。深度学习包括了卷积神经网络(CNN)、深度神经网络(DNN)、循环神经网络(RNN)、对抗神经网络(GAN)、深度学习中训练集、开发集、测试集的样本比例一般为6:2:2、7:2:1、8:1:1。模型的输入时某个样本的特征,函数的输出是这一样本的标签。3、机器学习方法的选择。
2024-09-07 15:14:53
1039
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅