- 博客(3)
- 收藏
- 关注
原创 解决ModuleNotFoundError: No module named ‘peft‘,或者别的,但是明明已经安装了该库。
解决:在命令行中显式加入所使用的Python虚拟环境路径:CUDA_VISIBLE_DEVICES=0,1,2 /data/miniconda3/envs/uu/bin/python3.10 -m torch.distributed.run --nproc_per_node=3 train.py。用torchrun进行多卡训练时遇到报错类似:ModuleNotFoundError: No module named 'peft',或者hydra,但是明明虚拟环境中安装了这个库。(例如:子进程使用的是。
2025-05-11 22:19:58
769
原创 解决报错:ValueError: Expected input batch_size (10) to match target batch_size (1).
原做的是二分类,在训练的时候遇到了这个报错。 for i, (inputs, target) in enumerate(trainloader): # forward output = net(inputs) # compute loss loss = criterion(output, target) optimizer.zero_grad() # back
2021-12-08 09:49:15
12247
原创 解决Dataloader报错:ValueError: too many values to unpack (expected 2)
原始代码:# 构建一个能够加载数据集的类class MyDataset(Dataset): # 继承Dataset # 得到一个包含图像和标签的列表 def __init__(self, root, label_root,transform=None,is_aug=None,fix_size=(244, 244)): # 初始化一些属性 data_list = get_data(root) # 得到数据的名字列表 label = get_labe
2021-12-08 09:25:09
4362
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅