- 博客(6)
- 收藏
- 关注
原创 VS Code 终端无法激活 conda 或 pdm 环境,始终进入系统默认的 python 解释器中
摘要:在zsh配置中,重复添加/usr/local/bin到PATH环境变量会导致Python环境选择问题。建议注释掉~/.zshrc中的export PATH=$PATH:/usr/local/bin,因该路径已默认存在。环境变量优先级从左到右,可通过临时修改或编辑配置文件调整路径顺序。当前环境变量可通过echo $PATH查看,注意路径重复问题可能源于未知配置。
2025-12-17 16:15:39
236
原创 transformers 库的 TrainingArguments 无法设置为仅保存最佳模型,不保存训练过程中的所有模型
说设置了“最终加载最佳模型 = True” 就会使得。,那必须设置以下两个参数,且它们的值必须一样。,即使这个值设置为 1,它依旧会保存两个模型。为解决这个问题,需要再加一个参数。之所以这个值设置为 2 ,是因为。失效,但经过实践发现并不会。
2025-12-04 23:38:31
134
原创 自定义 BERT 分类模型时,由于未使用 pooler 层导致的分布式训练梯度同步失败问题解决方法
摘要: 在使用分布式数据并行(DDP)训练BERT模型时出现梯度同步错误,原因是模型最后一层参数未被使用。该问题源于代码直接取倒数第二层的[CLS]标记作为输出,导致最后一层参数不参与loss计算而缺乏梯度。解决方法是在DDP包装模型时设置find_unused_parameters=True参数,使框架自动跳过未使用的参数。该解决方案可确保梯度同步正常进行,同时保持模型原有的功能实现。(146字)
2025-11-10 18:38:37
142
原创 从UndefinedMetricWarning: Recall is ill-defined and being set to 0.0 due to no true samples推测更佳指标计算方式
文章摘要:在处理样本不平衡数据集时,评估指标计算方式会影响结果准确性。常见问题是当批次中全是负样本时,会导致召回率分母为0而无法计算。研究发现两种计算方式存在差异:1)先计算批次指标再求均值时,遇到除0异常会导致整体指标偏低;2)先累积所有预测结果再计算指标则不受影响。文中通过示例展示了两种方法的结果差异(0.67 vs 0.5),并指出精确度计算也会遇到类似问题。建议采用先累积后计算的方式,或设置忽略警告来处理这种情况。
2025-11-05 15:47:55
290
原创 Intel CPU 的 MAC 电脑中由于 torch 官方不再提供高版本包而导致的 torch.load 不可用问题解决方法
提到 MAC(Intel) 电脑无法升级 torch,又遇到了旧版本有安全漏洞被禁止使用预训练模型加载函数。其中提到两个解决办法:使用 colab 把模型转换为。,之前怀疑是 forge 源的 torch 版本比较旧,但是后面发现官方源也最高只支持 2.2.2 版本。如果需要在 MAC 电脑加载预训练模型,需要安装低版本的。但是 Intel CPU 的 MAC 系统最高只可安装。nightly 的也不行。
2025-10-24 18:44:00
172
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅