Machine Learning Yearning15~19

本文介绍了一种基于错误分析改进机器学习模型的方法,包括错误类别表的建立、错误标签的修正策略及Eyeballdevset和Blackboxdevset的有效利用。

1.如何进行错误分析呢?我们将错分类别做一个表。
这里写图片描述
横向是各种各样的error categories。观察多了,对比多了,就会想到各种的错误类别。然后通过这个表,来决定在哪方面投入精力。如上表,相对于狗这类,将方向放到Great cat或者Blurry更好。
2.如果发现被错分类别本身标签是错误的,那么我们需要考虑是否纠正这些错误的标签。这取决于这些标错的数据是否影响我们的判断。如果错分类里边只有很少的一部分是被错标记的,那么我们没有必要花费大的精力去修复这些标签的。
但是要记得,对dev set做的处理要对test set做同样的处理,保证俩者的分布一致性。
如果要提高标签的质量,那么也要检查被所谓正确分类标签的质量。如果只修正错分类别的标签,那么可能对评估引入偏见。这些偏见最多在引用场景被接受,但是在学术研究上是不行的。
3.当然不是对所有的dev set数据进行错误分析。如果dev set太多,则需要花费很多时间。我们将dev set分为俩部分,一部分进行观察(被称为Eyeball dev set),一部分调节参数(被称为Blackbox dev set)。
那么如果我们的Eyeball dev set过拟合怎么办?要门重新选择Eyeball dev set,要么增加Eyeball dev set(减少Blackbox dev set),或者获取新的标记数据。
4.现在讨论Eyeball dev set和Blackbox dev set的数量,多少合适?Eyeball dev set应该能够包含足够数量的我们算法错误分类的数据(比如,错分100个)。我们的分类器错误率越低,为了得到一定量的错分的数据,我们需要更多的Eyeball dev set。Eyeball dev set针对人为分类较好的数据。如果我们自己都很难分类,Eyeball dev set就失去作用了。
Blackbox dev set的目的是调整参数和选择模型。一般是1000~10000。
如果数据量少,把所有数据分为Eyeball dev set。我们可以使用这个Eyeball dev set进行观察,调整参数,选择模型。这样做唯一的缺陷是,Eyeball dev set过拟合的概率增加。
5.如果我们不是一个领域的专家,我们首先需要设计一个基本的系统,通过错误分析帮助我们来决定最优吸引力的方向,然后朝着这个方向不断迭代。
6.如果Eyeball dev set的效果比Blackbox dev set好很多,那么Eyeball dev set过拟合了。

【顶级EI完整复现】【DRCC】考虑N-1准则的分布鲁棒机会约束低碳经济调度(Matlab代码实现)内容概要:本文介绍了名为《【顶级EI完整复现】【DRCC】考虑N-1准则的分布鲁棒机会约束低碳经济调度(Matlab代码实现)》的技术资源,聚焦于电力系统中低碳经济调度问题,结合N-1安全准则与分布鲁棒机会约束(DRCC)方法,提升调度模型在不确定性环境下的鲁棒性和可行性。该资源提供了完整的Matlab代码实现,涵盖建模、优化求解及仿真分析全过程,适用于复杂电力系统调度场景的科研复现与算法验证。文中还列举了大量相关领域的研究主题与代码资源,涉及智能优化算法、机器学习、电力系统管理、路径规划等多个方向,展示了广泛的科研应用支持能力。; 适合人群:具备一定电力系统、优化理论和Matlab编程基础的研究生、科研人员及从事能源调度、智能电网相关工作的工程师。; 使用场景及目标:①复现高水平期刊(如EI/SCI)关于低碳经济调度的研究成果;②深入理解N-1安全约束与分布鲁棒优化在电力调度中的建模方法;③开展含新能源接入的电力系统不确定性优化研究;④为科研项目、论文撰写或工程应用提供可运行的算法原型和技术支撑。; 阅读建议:建议读者结合文档提供的网盘资源,下载完整代码与案例数据,按照目录顺序逐步学习,并重点理解DRCC建模思想与Matlab/YALMIP/CPLEX等工具的集成使用方式,同时可参考文中列出的同类研究方向拓展研究思路。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值