Adaptive Inertia Adai 项目教程-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00548/article/details/141838619

Adaptive Inertia Adai 项目教程

adaptive-inertia-adai[ICML 2022, Oral] The PyTorch Implementation of Adaptive Inertia Methods. The algorithms are based on our paper: "Adaptive Inertia: Disentangling the Effects of Adaptive Learning Rate and Momentum".项目地址:https://gitcode.com/gh_mirrors/ad/adaptive-inertia-adai

项目介绍

Adaptive Inertia Adai 是一个基于 PyTorch 的优化器，旨在通过参数化的动量（momentum）来加速鞍点的逃逸并选择平坦的最小值。该项目在 ICML 2022 上被接受为口头报告（Acceptance Rate ~ 2%）。Adai 结合了 Adam 和 SGD 在鞍点逃逸和平坦最小值选择方面的优势，特别推荐用于 CNN 的训练。

项目快速启动

安装

首先，确保你已经安装了 PyTorch。然后，你可以通过以下命令克隆并安装该项目：

git clone https://github.com/zeke-xie/adaptive-inertia-adai.git
cd adaptive-inertia-adai
pip install -r requirements.txt

使用示例

以下是一个简单的使用示例，展示了如何在 CIFAR-10 数据集上使用 Adai 优化器：

import torch
import torch.nn as nn
import torch.optim as optim
from adai_optim import Adai
from torchvision import datasets, transforms

# 定义数据加载器
transform = transforms.Compose([transforms.ToTensor()])
train_loader = torch.utils.data.DataLoader(
    datasets.CIFAR10(root='./data', train=True, download=True, transform=transform),
    batch_size=64, shuffle=True)

# 定义模型
class SimpleCNN(nn.Module):
    def __init__(self):
        super(SimpleCNN, self).__init__()
        self.conv1 = nn.Conv2d(3, 32, kernel_size=3, stride=1, padding=1)
        self.relu = nn.ReLU()
        self.pool = nn.MaxPool2d(kernel_size=2, stride=2, padding=0)
        self.fc = nn.Linear(32 * 16 * 16, 10)

    def forward(self, x):
        x = self.relu(self.conv1(x))
        x = self.pool(x)
        x = torch.flatten(x, 1)
        x = self.fc(x)
        return x

model = SimpleCNN()

# 定义优化器
optimizer = Adai(model.parameters(), lr=0.001)

# 训练模型
for epoch in range(10):
    for data, target in train_loader:
        optimizer.zero_grad()
        output = model(data)
        loss = nn.CrossEntropyLoss()(output, target)
        loss.backward()
        optimizer.step()