- 博客(57)
- 收藏
- 关注
原创 Tiger生成式推荐
召回和排序排序是从召回阶段的候选集中进行精排,强调了召回阶段的重要性。我们提出了一种构建序列推荐生成检索模型的新范式。我们的方法没有使用传统的查询候选匹配方法,而是使用端到端生成模型来直接预测候选 ID。我们的方法没有使用传统的查询候选匹配方法,而是使用端到端生成模型来直接预测候选 ID。TIGER 的独特特征是称为“语义 ID”的项目新颖语义表示——从每个项目的内容信息派生的一系列标记。为每个item分配语义id,然后训练检索模型来预测下一个可能id,然后通过lookup来对应item。
2025-10-15 17:47:51
915
原创 老弓的学习日记-cf、LR
为什么大部分电商不用usercf用itemcf1、user比item多2、user的序列稀疏,不适用于获取正反馈较困难的应用场景好处是用户更新快,预先计算好物品的相似度,预测性能好。
2025-10-06 18:22:12
247
原创 小土堆pytorch
Dataset的使用:数据集的抽象类,需要自定义并实现__len__(数据集大小)和(按索引获取样本)。tensorboard 主要是训练过程可视化transform 图像转化图片->tensor用法:首先要创建一个自己的工具 然后再使用即:先定义再调用dataloader用于从 Dataset 中按批次(batch)加载数据batch_sizeshuffledrop_lastbatch_sizeTruetorch.nn。
2025-10-05 15:13:30
638
原创 10.1 面向长序列建模的高效注意力机制
attention的复杂度是n^2 ,主要来源是Q和K矩阵的相乘 有没有一种办法可以降低时间复杂度呢线性注意力机制先计算k v,
2025-10-01 18:57:10
240
原创 阿里天池-新闻推荐baseline理解
首先回顾一下推荐系统的全链路:召回-粗排-精排-重排-1、核心itemCF:根据物品的相似度来进行用户点击新闻的推荐得到一个相似度矩阵- i2i_sim输入:用户的点击日志(谁在什么时候点击了哪一个)输出:相似度矩阵字典2、召回多路召回首先明确召回的目标:从几十万个文章中筛选出几百-几千个候选集,供后续排序用。而多路召回就是用不同的思路,比如user CF、itemCF、youtubeDNN、embedding等来进行召回,最后进行合并。
2025-09-22 16:57:09
474
原创 9.19复盘
搜索二维矩阵:从右上角开始,如果找到了,就return,如果target<右上角,说明right-1。颜色分类:刷腻子,先全部赋2,然后如果<1,则n1++<0则n0++额外开一个二维数组,记录。如果出现了0,则整行整列设置为True。旋转图像:先沿对角线对折,然后每行翻转reverse。然后遍历矩阵,如果是True,就设置为0,其余不变。如果target>右上角,则top+1。寻找重复数:快慢指针,当成链表做。只出现一次:counter。多数元素:couter。
2025-09-20 00:49:29
162
原创 9.18 复盘
right向右遍历,如果出现右端点元素重复,则左端点移动。set哈希不可以、定长滑动窗口不可以。字典的使用 字典、哈希还是要巩固。3、和为 K 的子数组。
2025-09-18 00:35:24
107
原创 二叉树hot100-中等
dfs(node)返回:如果在node这棵子树里找到了p或q,就返回对应节点。如果没找到,返回None。如果左右子树都找到了,返回当前节点(说明它是最近公共祖先)。
2025-09-13 12:00:18
500
原创 复盘|llm推理加速
实习岗位和目标:我的实习是某中厂研究院的大模型推理加速岗,主要负责探索和实现大模型推理加速与量化算法,目标是降低显存开销、提升推理效率。我实习期间主要负责的是探索如何将业界前沿大模型(如 Qwen2.5-Omni、Qwen3)经过量化压缩后,能够高效部署到PC 的,实现端侧推理加速。
2025-09-12 12:06:13
886
原创 微调|LLM技术
Prefix Tuning:在每层 attention 的 key/value 前加前缀,通常配合一个小的参数生成器(MLP)。P-Tuning v1:只在输入 embedding 前加虚拟 token,并用 MLP 提升表达。P-Tuning v2:去掉 MLP,方法更简洁,同时把 prefix 扩展到每一层,效果最接近全参数微调。
2025-09-07 19:51:40
789
原创 hot100-动态规划
动态规划5步走1、定义dp数组,明白含义2、确定递推公式3、确定初始条件4、确定遍历顺序5、打印dp数组70. 爬楼梯118. 杨辉三角。
2025-09-07 11:53:18
825
原创 513. 找树左下角的值
更加简洁,逻辑是记录每层的第一个节点,最后一次遍历之后,肯定就是最后一层的元素了。可以改进的是,完全不需要两次层序遍历。用层序遍历,很快完成。
2025-03-11 17:47:03
171
原创 111. 二叉树的最小深度
递归的核心思想是逐步计算左右子树的最小深度,然后取最小值加 1。处理树为空和只有一个子树的特殊情况。最终得到从根节点到最近叶子节点的最短路径。
2025-03-04 21:46:05
472
原创 347.前 K 个高频元素
给定一个非空的整数数组,返回其中出现频率前 k 高的元素。最大的问题是怎么对这个代表出现次数的array进行管理。直接找最大 k等于几就要搜几遍,显然是不够高效。
2025-02-26 16:14:34
222
原创 记一次痛的领悟。。。。(Autodl的pycharm配置)
之前发现,即使选了云服务器上配好的python环境,但是新建环境后仍然库里空空,原来是这里!pycharm2024变了一些版本。不能选new,要用existing😭。
2024-12-04 22:14:14
216
原创 11.27 代码随想录 三数之和(梦破碎的地方)
建了一个 代码随想录的打卡群,如果想每天打卡的可以进群交流(不打卡就不进了)可交流DL、ML、,研究生生涯规划,岗实习......
2024-11-27 20:34:34
334
原创 11.26 代码随想录- 四数之和
为了使问题简单化,所有的 A, B, C, D 具有相同的长度 N,且 0 ≤ N ≤ 500。所有整数的范围在 -2^28 到 2^28 - 1 之间,最终结果不会超过 2^31 - 1。给定四个包含整数的数组列表 A , B , C , D ,计算有多少个元组 (i, j, k, l) ,使得 A[i] + B[j] + C[k] + D[l] = 0。,如果想每天打卡的可以进群交流(不打卡就不进了)想进群一起打卡的,可以私信我。
2024-11-26 17:33:53
245
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅