深度学习基础

本文介绍了如何划分训练、验证和测试集,并讨论了不同数据规模下的划分比例。此外,还探讨了机器学习中的高偏差和高方差问题及其解决方案,包括通过调整网络结构、使用正则化等方法。

改善深层神经网络:

1、训练、验证、测试集

对于一个需要解决的问题的样本数据,在建立模型的过程中,将问题的data划分为:

(1)训练集(train set):用训练集对算法模型进行训练过程。

(2)验证集(development set):利用验证集或者又称为简单交叉验证集进行交叉验证,选择出最好的模型。

(3)测试集(test set):最后利用测试集对模型进行测试,获取模型运行的无偏估计

 

小数据时代:

100、1000、10000的数据量大小,可以将data划分为:

  1. 无验证集的情况:70% / 30%;

2、有验证集的情况:60% / 20% / 20%;

 

大数据时代:

  1. 100万数据量:98% / 1% / 1%;

2、超百万数据量:99.5% / 0.25% / 0.25%(或者99.5% / 0.4% / 0.1%);

 

注意:

(1)建议验证集要和训练集来自于同一个分布,可以使得机器学习算法变得更快。

(2)如果不需要无偏估计来评估模型的性能,则可以不需要测试集

 

2、机器学习的基本方法:

(1)是否存在High bias 

1>增加网络结构,如增加隐藏层数目;

2>训练更长时间;

3>寻找合适的网络架构,使用更大的NN结构;

(2)是否存在High variance? 

1>获取更多数据

2>正则化

3>寻找合适的网络结构

 

3、正则化:

       利用正则化来解决High variance的问题,正则化是在Cost function中加入一项正则化项,降低惩罚模型的复杂度。

(1)Logistic regression:

       加入正则化项的代价函数

             

 

(2)Neural network:

       加入正则化项的代价函数

 

内容概要:本文介绍了ENVI Deep Learning V1.0的操作教程,重点讲解了如何利用ENVI软件进行深度学习模型的训练与应用,以实现遥感图像中特定目标(如集装箱)的自动提取。教程涵盖了从数据准备、标签图像创建、模型初始化与训练,到执行分类及结果优化的完整流程,并介绍了精度评价与通过ENVI Modeler实现一键化建模的方法。系统基于TensorFlow框架,采用ENVINet5(U-Net变体)架构,支持通过点、线、面ROI或分类图生成标签数据,适用于多/高光谱影像的单一类别特征提取。; 适合人群:具备遥感图像处理基础,熟悉ENVI软件操作,从事地理信息、测绘、环境监测等相关领域的技术人员或研究人员,尤其是希望将深度学习技术应用于遥感目标识别的初学者与实践者。; 使用场景及目标:①在遥感影像中自动识别和提取特定地物目标(如车辆、建筑、道路、集装箱等);②掌握ENVI环境下深度学习模型的训练流程与关键参数设置(如Patch Size、Epochs、Class Weight等);③通过模型调优与结果反馈提升分类精度,实现高效自动化信息提取。; 阅读建议:建议结合实际遥感项目边学边练,重点关注标签数据制作、模型参数配置与结果后处理环节,充分利用ENVI Modeler进行自动化建模与参数优化,同时注意软硬件环境(特别是NVIDIA GPU)的配置要求以保障训练效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值