MAML介绍和代码示例

原创于 2025-12-08 08:47:34 发布 · 77 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #人工智能

人工智能专栏收录该内容

82 篇文章

订阅专栏

MAML 介绍

MAML（Model-Agnostic Meta-Learning）是一种元学习算法，旨在通过优化模型的初始参数，使其在少量梯度更新后能够在新任务上表现良好。其核心思想是找到一个初始参数，使得模型在新任务上通过少量梯度更新后能够快速适应。

MAML 的工作原理

初始化模型参数：随机初始化模型的参数。
内循环更新：在每个任务上进行少量梯度更新，计算损失。
外循环更新：根据内循环的损失，更新模型的初始参数。

MAML 代码示例

以下是一个使用 PyTorch 实现 MAML 的代码示例：

Python

Copy

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader
import numpy as np
from copy import deepcopy

# 定义一个简单的二分类模型
class SimpleClassifier(nn.Module):
    def __init__(self, input_dim, hidden_dim, output_dim):
        super(SimpleClassifier, self).__init__()
        self.fc1 = nn.Linear(input_dim, hidden_dim)
        self.fc2 = nn.Linear(hidden_dim, output_dim)
    
    def forward(self, x):
        x = torch.relu(self.fc1(x))
        return torch.sigmoid(self.fc2(x))

# MAML 类
class MAML:
    def __init__(self, model, meta_lr=0.001, inner_lr=0.01, num_inner_steps=5, device='cpu'):
        self.model = model.to(device)
        self.meta_optimizer = optim.Adam(self.model.parameters(), lr=meta_lr)
        self.inner_lr = inner_lr
        self.num_inner_steps = num_inner_steps
        self.device = device

    def fast_adapt(self, task_train_loader, task_valid_loader):
        model_copy = deepcopy(self.model).to(self.device)
        model_copy.train()
        for _ in range(self.num_inner_steps):
            for inputs, targets in task_train_loader:
                inputs, targets = inputs.to(self.device), targets.to(self.device)
                outputs = model_copy(inputs)
                loss = nn.BCELoss()(outputs, targets)
                model_copy.zero_grad()
                loss.backward()
                for param in model_copy.parameters():
                    param.grad *= self.inner_lr
                    param.data -= param.grad
        valid_loss = 0.0
        for inputs, targets in task_valid_loader:
            inputs, targets = inputs.to(self.device), targets.to(self.device)
            outputs = model_copy(inputs)
            valid_loss += nn.BCELoss()(outputs, targets).item()
        valid_loss /= len(task_valid_loader.dataset)
        return valid_loss

    def meta_update(self, meta_train_loader):
        total_loss = 0.0
        for task_train_loader, task_valid_loader in meta_train_loader:
            valid_loss = self.fast_adapt(task_train_loader, task_valid_loader)
            total_loss += valid_loss
        self.meta_optimizer.zero_grad()
        total_loss.backward()
        self.meta_optimizer.step()

    def test(self, meta_test_loader):
        total_acc = 0.0
        total_samples = 0
        for task_test_loader in meta_test_loader:
            model_copy = deepcopy(self.model).to(self.device)
            model_copy.train()
            for _ in range(self.num_inner_steps):
                for inputs, targets in task_test_loader:
                    inputs, targets = inputs.to(self.device), targets.to(self.device)
                    outputs = model_copy(inputs)
                    loss = nn.BCELoss()(outputs, targets)
                    model_copy.zero_grad()
                    loss.backward()
                    for param in model_copy.parameters():
                        param.grad *= self.inner_lr
                        param.data -= param.grad
            model_copy.eval()
            correct = 0
            for inputs, targets in task_test_loader:
                inputs, targets = inputs.to(self.device), targets.to(self.device)
                outputs = model_copy(inputs)
                preds = (outputs > 0.5).long()
                correct += (preds == targets).sum().item()
            total_acc += correct
            total_samples += len(task_test_loader.dataset)
        return total_acc / total_samples

# 示例使用
input_dim = 10
hidden_dim = 64
output_dim = 1
model = SimpleClassifier(input_dim, hidden_dim, output_dim)
maml = MAML(model, meta_lr=0.001, inner_lr=0.1, num_inner_steps=5)

# 准备元训练和元测试数据集及数据加载器
meta_train_tasks = ...  # List of tuples (task_train_loader, task_valid_loader)
meta_test_tasks = ...   # List of task_test_loaders

# 元训练循环
for epoch in range(num_epochs):
    maml.meta_update(meta_train_tasks)

# 元测试
test_accuracy = maml.test(meta_test_tasks)
print(f"Meta-test accuracy: {test_accuracy:.4f}")

代码说明

SimpleClassifier 类：定义了一个简单的二分类模型，包含两层全连接层。
MAML 类：
- 初始化：创建模型实例，设置元学习器（meta_optimizer），定义内部学习率（inner_lr）、内部更新步数（num_inner_steps）和设备（device）。
- fast_adapt 方法：实现内部循环（快速适应阶段）。对给定任务的训练集进行多步梯度更新，然后在验证集上计算损失。
- meta_update 方法：实现外部循环（元学习阶段）。遍历元训练任务，对每个任务调用 fast_adapt 并累加损失，然后反向传播更新模型参数。
- test 方法：在元测试任务上评估模型的快速适应能力。对每个任务进行内部更新后，在测试集上计算准确率，返回所有任务的平均准确率。