17、时间序列AI模型中的最优控制与数据收集实践

时间序列AI的最优控制与数据生成

时间序列AI模型中的最优控制与数据收集实践

在时间序列AI模型的应用中,最优搜索控制和学习数据收集是两个关键环节。下面将详细介绍大规模搜索的实际终止方法以及如何利用伪阶跃响应生成训练数据。

大规模搜索的实际终止

在AI最优搜索控制中,针对大规模目标的搜索常因状态爆炸而出现不收敛的问题。虽然并行搜索方法可用于处理大状态空间的控制目标,但在实际问题中,追求评估函数的全局最优解并非总是必要的。因为评估函数本身并非对控制价值的精确表示,在接近最优解时,即使不是严格最优,也可能没有实际问题。而且,在复杂控制对象的最优搜索和控制中,若无法在实际时间内完成搜索,即使能得到精确最优解也无意义。

因此,从工程角度出发,当获得足够有意义的搜索结果操作量时,终止搜索是一种实用的方法。但确定搜索终止并非易事,因为难以明确搜索算法得到的解在搜索空间所有评估函数值中的位置,以及比该解更低的评估函数值的数量。所以,基于统计估计来确定搜索的实际终止是一种有效的方法,即了解整个状态空间中评估函数值的统计分布,以及剩余进一步搜索能接近最优真实值的程度。

大规模搜索的审查

为了研究实际搜索的终止,需要明确搜索空间中评估函数值的空间特征和统计性质。以复杂RTP调整函数的搜索空间为例,其参数为 (N_L = 5),(N_b = 2),(N_h = 3),功率限制命令值的模式按特定公式排列。

从相关图形可以看出,搜索空间是一个具有多个局部最小值的多峰空间,全局最小值为128,与局部最小值相比并非特别低。评估函数值的分布通常遵循正态分布,其均值为148,标准差为7.5。根据中心极限定理,随着样本数量的增加,分布会更接近正态分布。即使分布不完全正态,假设其为正态分

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值