机器学习在函数优化与TSP问题中的应用
1. 机器学习组合优化竞赛(ML4CO)
为了刺激更多探索并吸引更多研究人员进入新兴的组合优化领域,举办了名为“机器学习组合优化(ML4CO)”的竞赛。该竞赛作为神经信息处理系统(NeurIPS)会议的一部分,为参与者提出了独特的挑战,要求他们设计针对三个不同挑战的机器学习模型或算法,每个挑战都对应传统优化求解器中常见的特定控制任务。此竞赛为研究人员提供了探索和测试新型机器学习策略的平台,推动了组合优化领域的发展。
2. 监督式机器学习解决函数优化问题
2.1 摊销优化
摊销优化(Amortized optimization),也称为学习优化,是一种利用机器学习模型快速预测优化问题解决方案的方法。它试图学习决策变量空间与最优或接近最优解空间之间的映射关系。学习到的模型可用于预测目标函数的最优值,从而实现快速求解器。优化过程的计算成本在学习和推理阶段分摊,这也是“摊销优化”名称的由来。
例如,B. Amos 在教程中展示了如何使用摊销优化解决优化问题,如监督式机器学习方法可学习解决球体上的优化问题,目标是找到定义在地球或其他可近似为球体的空间上的函数的极值。
2.2 代码实现步骤
以下是使用监督式学习的摊销优化来解决定义在地球或其他空间上的函数极值问题的代码步骤:
import torch
from torch import nn
import numpy as np
from tqdm import tqdm
import matplotlib.pyplot as pl
超级会员免费看
订阅专栏 解锁全文
1738

被折叠的 条评论
为什么被折叠?



