自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 VS Code 终端无法激活 conda 或 pdm 环境,始终进入系统默认的 python 解释器中

摘要:在zsh配置中,重复添加/usr/local/bin到PATH环境变量会导致Python环境选择问题。建议注释掉~/.zshrc中的export PATH=$PATH:/usr/local/bin,因该路径已默认存在。环境变量优先级从左到右,可通过临时修改或编辑配置文件调整路径顺序。当前环境变量可通过echo $PATH查看,注意路径重复问题可能源于未知配置。

2025-12-17 16:15:39 236

原创 transformers 库的 TrainingArguments 无法设置为仅保存最佳模型,不保存训练过程中的所有模型

说设置了“最终加载最佳模型 = True” 就会使得。,那必须设置以下两个参数,且它们的值必须一样。,即使这个值设置为 1,它依旧会保存两个模型。为解决这个问题,需要再加一个参数。之所以这个值设置为 2 ,是因为。失效,但经过实践发现并不会。

2025-12-04 23:38:31 134

原创 自定义 BERT 分类模型时,由于未使用 pooler 层导致的分布式训练梯度同步失败问题解决方法

摘要: 在使用分布式数据并行(DDP)训练BERT模型时出现梯度同步错误,原因是模型最后一层参数未被使用。该问题源于代码直接取倒数第二层的[CLS]标记作为输出,导致最后一层参数不参与loss计算而缺乏梯度。解决方法是在DDP包装模型时设置find_unused_parameters=True参数,使框架自动跳过未使用的参数。该解决方案可确保梯度同步正常进行,同时保持模型原有的功能实现。(146字)

2025-11-10 18:38:37 142

原创 从UndefinedMetricWarning: Recall is ill-defined and being set to 0.0 due to no true samples推测更佳指标计算方式

文章摘要:在处理样本不平衡数据集时,评估指标计算方式会影响结果准确性。常见问题是当批次中全是负样本时,会导致召回率分母为0而无法计算。研究发现两种计算方式存在差异:1)先计算批次指标再求均值时,遇到除0异常会导致整体指标偏低;2)先累积所有预测结果再计算指标则不受影响。文中通过示例展示了两种方法的结果差异(0.67 vs 0.5),并指出精确度计算也会遇到类似问题。建议采用先累积后计算的方式,或设置忽略警告来处理这种情况。

2025-11-05 15:47:55 290

原创 使用 PDM 管理项目环境

从此可看出,虚拟环境路径是 疑问:这个路径是什么时候指定的此时应当修正 中的 python 版本为:

2025-10-29 01:35:06 121

原创 Intel CPU 的 MAC 电脑中由于 torch 官方不再提供高版本包而导致的 torch.load 不可用问题解决方法

提到 MAC(Intel) 电脑无法升级 torch,又遇到了旧版本有安全漏洞被禁止使用预训练模型加载函数。其中提到两个解决办法:使用 colab 把模型转换为。,之前怀疑是 forge 源的 torch 版本比较旧,但是后面发现官方源也最高只支持 2.2.2 版本。如果需要在 MAC 电脑加载预训练模型,需要安装低版本的。但是 Intel CPU 的 MAC 系统最高只可安装。nightly 的也不行。

2025-10-24 18:44:00 172

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除