30、机器学习在函数优化与TSP问题中的应用

机器学习在函数优化与TSP问题中的应用

1. 机器学习组合优化竞赛(ML4CO)

为了刺激更多探索并吸引更多研究人员进入新兴的组合优化领域,举办了名为“机器学习组合优化(ML4CO)”的竞赛。该竞赛作为神经信息处理系统(NeurIPS)会议的一部分,为参与者提出了独特的挑战,要求他们设计针对三个不同挑战的机器学习模型或算法,每个挑战都对应传统优化求解器中常见的特定控制任务。此竞赛为研究人员提供了探索和测试新型机器学习策略的平台,推动了组合优化领域的发展。

2. 监督式机器学习解决函数优化问题
2.1 摊销优化

摊销优化(Amortized optimization),也称为学习优化,是一种利用机器学习模型快速预测优化问题解决方案的方法。它试图学习决策变量空间与最优或接近最优解空间之间的映射关系。学习到的模型可用于预测目标函数的最优值,从而实现快速求解器。优化过程的计算成本在学习和推理阶段分摊,这也是“摊销优化”名称的由来。

例如,B. Amos 在教程中展示了如何使用摊销优化解决优化问题,如监督式机器学习方法可学习解决球体上的优化问题,目标是找到定义在地球或其他可近似为球体的空间上的函数的极值。

2.2 代码实现步骤

以下是使用监督式学习的摊销优化来解决定义在地球或其他空间上的函数极值问题的代码步骤:

import torch
from torch import nn
import numpy as np
from tqdm import tqdm
import matplotlib.pyplot as pl
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值