- 博客(4)
- 收藏
- 关注
原创 两数之和题目
使用哈希表 首先是创建一个新的字典 map,然后遍历原始的数组 下标i和num 再定义一个anthor_num=target-num 再判定anthornum是否在map中 如果在的话 返回map[anthornum]的下标和当前遍历的i 如果没有 那么就把当前的存入到map中 继续遍历。
2025-08-05 21:15:08
135
原创 字母异位词分组
创建一个字典列表 遍历这个字符串数组 每遍历一个元素 把他先排序 然后转换成元祖 当做字典的key 存起来 接下来每个key 在把对应的s存进去 最后输出。为什么使用元组 因为key不能是可变的 为什么使用defaultdict 这样不用判定某个key存不存在需要创建一个新的列表。
2025-08-05 21:08:41
150
原创 最长连续序列
将序列转换成集合 然后定义一个最大长度 变量 依次遍历集合里面的元素 然后判断这个元素是否是第一个 也就是前面是否还有 num-1 是否存在 集合中 如果没有的话就代表是序列的第一个 接下来 判断这个序列有多少个连续 whlie num+1是否在 然后更新curent_num max_len。
2025-08-05 20:48:17
119
原创 训练大模型显存不够解决方案
3 如果大模型送入的prompt太长 需要很多token 占据显存 这时候需要减小token 但是针对数据时候需要删除这一部分超出token数量的数据 而不是保留 留着继续训练可能会导致模型幻觉 因为会截断。4 混合精度训练 在训练神经网络时**同时使用不同的数值精度(主要是 FP16 和 FP32)**来进行计算,以提升训练速度、减少显存占用,同时尽量保持模型性能不下降。到多个 GPU 上,每个 GPU 只负责一部分状态,从而降低显存压力。(2)Zero机制:将模型的状态(如参数、梯度、优化器状态)
2025-07-28 21:28:41
367
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅