自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 两数之和题目

使用哈希表 首先是创建一个新的字典 map,然后遍历原始的数组 下标i和num 再定义一个anthor_num=target-num 再判定anthornum是否在map中 如果在的话 返回map[anthornum]的下标和当前遍历的i 如果没有 那么就把当前的存入到map中 继续遍历。

2025-08-05 21:15:08 135

原创 字母异位词分组

创建一个字典列表 遍历这个字符串数组 每遍历一个元素 把他先排序 然后转换成元祖 当做字典的key 存起来 接下来每个key 在把对应的s存进去 最后输出。为什么使用元组 因为key不能是可变的 为什么使用defaultdict 这样不用判定某个key存不存在需要创建一个新的列表。

2025-08-05 21:08:41 150

原创 最长连续序列

将序列转换成集合 然后定义一个最大长度 变量 依次遍历集合里面的元素 然后判断这个元素是否是第一个 也就是前面是否还有 num-1 是否存在 集合中 如果没有的话就代表是序列的第一个 接下来 判断这个序列有多少个连续 whlie num+1是否在 然后更新curent_num max_len。

2025-08-05 20:48:17 119

原创 训练大模型显存不够解决方案

3 如果大模型送入的prompt太长 需要很多token 占据显存 这时候需要减小token 但是针对数据时候需要删除这一部分超出token数量的数据 而不是保留 留着继续训练可能会导致模型幻觉 因为会截断。4 混合精度训练 在训练神经网络时**同时使用不同的数值精度(主要是 FP16 和 FP32)**来进行计算,以提升训练速度、减少显存占用,同时尽量保持模型性能不下降。到多个 GPU 上,每个 GPU 只负责一部分状态,从而降低显存压力。(2)Zero机制:将模型的状态(如参数、梯度、优化器状态)

2025-07-28 21:28:41 367

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除