- 博客(7)
- 收藏
- 关注
原创 KD树理解,寻找两个集的最近邻点
所以 valid_us_indices = [0, 2],即超声点1和超声点3被保留。KDTree(K维树)是一种空间分割的数据结构,用于快速查找最近邻点。
2025-06-18 10:40:40
157
原创 手撸多头注意力机制Multi-head Attention
context_vec = (attn_weights(b,n_head,n,n)) @ (values(b,n_head,n,head_dim)=(b,n_head,n,head_dim)->转(1,2)=(b,n,n_head,head_dim)->合并(b,n,d_out)(b,n,d_in)->(b,n,d_out)->拆分(b,n,n_head,head_dim)->(转(1,2)=(b,n_head,n,head_dim))代码来源:build llm from scratch。
2025-03-04 14:10:37
160
原创 Conda环境下安装nvcc
如果服务器上没有nvcc且没有sudo权限的话 如何在环境中安装nvcc且设置CUDA_HOME路径。xxx为对应cuda版本,可以根据torch查看。
2024-11-06 14:04:30
1065
2
原创 linux服务器安装docker和nvidia container toolkit
【代码】linux服务器安装docker和nvidia container toolkit。
2024-02-27 15:01:15
511
原创 保姆级VIT详解输入维度变化以及对应代码实现
对于输入(1,3,64,64)和使用 patch size 为 8 的设置,维度变化的步骤可以总结为以下过程:图像块的提取:展平成向量:加入 Class Token 和 位置嵌入:线性投影:多头自注意力机制(Multi-Head Self-Attention):拆分为多头:注意力计算:合并多头输出:图:
2023-12-20 19:30:06
3343
5
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人