- 博客(14)
- 收藏
- 关注
原创 算法day12--最长子序列
需要注意while循环中 s [ a [ j ] ] -- 而不是 s [ a [ i ] ] --1232-232过程中应该是s[1]--,而不是s[2]--
2025-11-09 17:02:00
61
原创 算法day11--二进制数中1的个数
任何数和1进行与运算相当于二进制的最后一位数和1与运算。1&1==1,其他情况等于0。n是需要判断的数的个数。
2025-11-08 22:06:24
113
原创 土堆Pytorch
help() 查看帮助 e.g. help(torch.cuda.is_available)dir() 查看文件夹中内容 e.g. dir(torch.cuda)
2025-10-31 19:58:52
219
原创 大模型入门(持续更新)
分词之后被送入embedding,这个层是可训练的向量嵌入空间,每个token都被表示为一个向量,并在空间中占据一个独特的位置,词汇表中每个token id都对应一个多维向量,向量可以学习编码输入序列中单个token的含义和上下文。不可以提前决定注意力头将学习语言的哪些方面,每个头的权重都是随机初始化的,给定足够的训练数据和时间,每个头将学习语言的不同方面。基础模型规模从数十亿个参数增长到数百亿数千亿,模型具有的语言理解能力也会相应增长,从而帮助处理,推理和解决给LLM的任务。
2025-10-13 21:19:51
265
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅