anxieming-优快云博客

原创 VS Code 终端无法激活 conda 或 pdm 环境，始终进入系统默认的 python 解释器中

摘要：在zsh配置中，重复添加/usr/local/bin到PATH环境变量会导致Python环境选择问题。建议注释掉~/.zshrc中的export PATH=$PATH:/usr/local/bin，因该路径已默认存在。环境变量优先级从左到右，可通过临时修改或编辑配置文件调整路径顺序。当前环境变量可通过echo $PATH查看，注意路径重复问题可能源于未知配置。

2025-12-17 16:15:39 236

原创 transformers 库的 TrainingArguments 无法设置为仅保存最佳模型，不保存训练过程中的所有模型

说设置了“最终加载最佳模型 = True” 就会使得。，那必须设置以下两个参数，且它们的值必须一样。，即使这个值设置为 1，它依旧会保存两个模型。为解决这个问题，需要再加一个参数。之所以这个值设置为 2 ，是因为。失效，但经过实践发现并不会。

2025-12-04 23:38:31 134

原创自定义 BERT 分类模型时，由于未使用 pooler 层导致的分布式训练梯度同步失败问题解决方法

摘要：在使用分布式数据并行(DDP)训练BERT模型时出现梯度同步错误，原因是模型最后一层参数未被使用。该问题源于代码直接取倒数第二层的[CLS]标记作为输出，导致最后一层参数不参与loss计算而缺乏梯度。解决方法是在DDP包装模型时设置find_unused_parameters=True参数，使框架自动跳过未使用的参数。该解决方案可确保梯度同步正常进行，同时保持模型原有的功能实现。（146字）

2025-11-10 18:38:37 142

原创从UndefinedMetricWarning: Recall is ill-defined and being set to 0.0 due to no true samples推测更佳指标计算方式

文章摘要：在处理样本不平衡数据集时，评估指标计算方式会影响结果准确性。常见问题是当批次中全是负样本时，会导致召回率分母为0而无法计算。研究发现两种计算方式存在差异：1)先计算批次指标再求均值时，遇到除0异常会导致整体指标偏低；2)先累积所有预测结果再计算指标则不受影响。文中通过示例展示了两种方法的结果差异（0.67 vs 0.5），并指出精确度计算也会遇到类似问题。建议采用先累积后计算的方式，或设置忽略警告来处理这种情况。

2025-11-05 15:47:55 290

原创使用 PDM 管理项目环境

从此可看出，虚拟环境路径是疑问：这个路径是什么时候指定的此时应当修正中的 python 版本为：

2025-10-29 01:35:06 121

原创 Intel CPU 的 MAC 电脑中由于 torch 官方不再提供高版本包而导致的 torch.load 不可用问题解决方法

提到 MAC(Intel) 电脑无法升级 torch，又遇到了旧版本有安全漏洞被禁止使用预训练模型加载函数。其中提到两个解决办法：使用 colab 把模型转换为。，之前怀疑是 forge 源的 torch 版本比较旧，但是后面发现官方源也最高只支持 2.2.2 版本。如果需要在 MAC 电脑加载预训练模型，需要安装低版本的。但是 Intel CPU 的 MAC 系统最高只可安装。nightly 的也不行。

2025-10-24 18:44:00 172

m0_47977211的博客

原创 VS Code 终端无法激活 conda 或 pdm 环境，始终进入系统默认的 python 解释器中

原创 transformers 库的 TrainingArguments 无法设置为仅保存最佳模型，不保存训练过程中的所有模型

原创自定义 BERT 分类模型时，由于未使用 pooler 层导致的分布式训练梯度同步失败问题解决方法

原创从UndefinedMetricWarning: Recall is ill-defined and being set to 0.0 due to no true samples推测更佳指标计算方式

原创使用 PDM 管理项目环境

原创 Intel CPU 的 MAC 电脑中由于 torch 官方不再提供高版本包而导致的 torch.load 不可用问题解决方法

空空如也

空空如也

原创 VS Code 终端无法激活 conda 或 pdm 环境，始终进入系统默认的 python 解释器中

原创 transformers 库的 TrainingArguments 无法设置为仅保存最佳模型，不保存训练过程中的所有模型

原创 自定义 BERT 分类模型时，由于未使用 pooler 层导致的分布式训练梯度同步失败问题解决方法

原创 从UndefinedMetricWarning: Recall is ill-defined and being set to 0.0 due to no true samples推测更佳指标计算方式

原创 使用 PDM 管理项目环境

原创 Intel CPU 的 MAC 电脑中由于 torch 官方不再提供高版本包而导致的 torch.load 不可用问题解决方法

空空如也

空空如也

原创自定义 BERT 分类模型时，由于未使用 pooler 层导致的分布式训练梯度同步失败问题解决方法

原创从UndefinedMetricWarning: Recall is ill-defined and being set to 0.0 due to no true samples推测更佳指标计算方式

原创使用 PDM 管理项目环境