- 博客(8)
- 收藏
- 关注
原创 解决HuggingFace模型在远程服务器上加载超时问题
本文针对国内服务器无法访问HuggingFace的问题,提出两种解决方案。重点介绍通过修改配置使用镜像源(如hf-mirror.com)的方法,包括环境变量设置、诊断脚本编写和镜像源切换等技巧。文章详细列出错误识别、快速诊断、三种配置方案(环境变量/Shell脚本/命令行)、备用镜像源和长期设置建议,帮助用户解决模型下载超时问题。文末提供速查表和5步操作指南,确保HuggingFace模型加载顺畅。
2025-11-21 21:41:02
889
1
原创 大语言模型损失屏蔽Loss Masking原理理解
文章摘要:损失屏蔽是微调大语言模型时跳过冗余推理部分损失计算的常见方法。主流实现方式有两种:1)设置特殊标签值(如-100)利用损失函数内置忽略机制;2)构建损失掩码张量进行精细控制。前者更简单直接,后者更灵活。实现时需确保注意力掩码与损失掩码一致,建议用小批量数据调试验证。首选方案是采用HuggingFace Transformers库支持的-100标签方法,既高效又符合框架设计理念。
2025-09-20 21:08:13
403
原创 ccf-csp基础算法模板,stl总结,算法板子
本文总结了C++ STL中常用容器的操作方法和典型应用场景。主要内容包括:1) vector的一维和二维数组操作,如插入、删除、排序查找等;2) stack、queue、deque等线性容器的基本操作;3) set集合的常用方法;4) string字符串的输入输出、转换和常用函数;5) 动态规划中的背包问题(01背包、完全背包、多重背包)实现方法;6) 字符处理函数和子序列查找算法。文章提供了大量实用代码示例,可作为STL容器使用的速查手册。
2025-09-19 02:29:02
943
原创 Autodl使用和心得(LLamaFactory公网能访问,本地却不行问题排错)
摘要(148字) AutoDL平台上的Gradio服务已启动,但本地无法访问127.0.0.1:7861,因该地址指向用户本机而非远程服务器。解决方案: SSH端口转发:执行ssh -L 7861:127.0.0.1:7861 用户名@服务器IP,本地浏览器访问http://127.0.0.1:7861; AutoDL端口映射:通过控制台“应用”功能映射容器端口7861; 服务器本地测试:SSH登录后运行curl http://127.0.0.1:7861验证服务状态。 注意:0.0.0.0为监听所有接口的
2025-09-18 18:14:23
1225
原创 PAT1028 人口普查
题目要求统计有效生日人数并找出最年长和最年轻的人。有效生日范围是1814年9月6日至2014年9月6日。解题时,首先定义结构体存储人员信息(姓名和生日),设定日期边界。处理输入时,检查生日是否在有效范围内,若无效则跳过;若有效则更新最年长和最年轻的记录。最后输出有效人数、最年长和最年轻者的姓名。注意处理无有效数据的情况(输出0)。关键点包括正确比较日期字符串和处理边界条件。
2025-09-12 21:40:13
282
原创 算法的题库总结
对于给定的1≤n≤10,硬币面值数组T和可以使用的各种面值的硬币个数数组Coins,以及钱数m,0≤m≤20001,编程计算找钱m的最少硬币数。例如,当n=3,m=2时,“1-1,1-2,2-1,3-1,3-2,2-2”就是一个给定的安排顺序,即先安排第1个工件的第1个工序,再安排第1个工件的第2个工序,然后再安排第2个工件的第1个工序,等等。由于同一工件都是按工序的顺序安排的,因此,只按原顺序给出工件号,仍可得到同样的安排顺序,于是,在输入数据中,我们将这个安排顺序简写为“1 1 2 3 3 2”。
2025-01-03 01:35:56
754
原创 swustoj 517:作业调度问题(洛谷p1065)
典型的调度问题,目标是最小化完成所有工件所需的总时间。该算法通过模拟调度过程,确保按照给定的顺序安排每个工序,同时遵守约束条件,最终计算出完成所有工序所需的最少总时间。
2024-12-26 16:40:09
1141
2
原创 swust oj980:输出利用先序遍历创建的二叉树的层次遍历序列解答 c++代码 queue队列方法
输入为接受键盘输入的由大写英文字符和"#"字符构成的一个字符串(用于创建对应的二叉树)。输出利用先序遍历创建的二叉树的层次遍历序列 思路 c++代码
2024-05-10 18:01:44
651
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅