- 博客(85)
- 收藏
- 关注
原创 MMOE+ESSM
另外,Gate网络最后的输出会经过softmax进行归一化。Gate网络最后一层全连接层经过softmax归一化后的输出,对应作用到每一个expert上(图2中GateA输出的红、紫、绿三条线分别作用与expert0,expert1,expert2),注意是通过广播机制作用到expert中的每一个隐藏单元,比如红线作用于expert0的2个隐藏单元。这里gate网络的作用非常类似于attention机制,提供了权重。
2024-08-20 14:08:37
877
原创 常用指标和损失总结
求解 L1 损失的问题通常比求解 L2 损失的问题更难。L1 损失的优化问题是一个非凸问题,而 L2 损失的优化问题是一个凸问题。由于其凸性,L2 损失的优化问题(如最小二乘法)通常更容易解决,并且有多种有效的算法(如梯度下降、牛顿法等)。精确度(precision)/查准率:TP/(TP+FP)=TP/P 预测为真中,实际为正样本的概率。当模型的稀疏性非常重要时,例如在文本分析或生物信息学中,L1 损失是一个很好的选择。当模型的参数需要保留非零值,并且对异常值不太敏感时,L2 损失是一个更常用的选择。
2024-07-18 15:08:39
369
原创 Exploiting Static and Dynamic Human Joint Relations for 3D Pose Estimation via Cascade Transformers
Transformer已经成为自然语言处理(NLP)中的主导模型。研究人员最近试图利用Transformer架构进行各种计算机视觉任务,并取得了有竞争力的结果。然而,很少有工作已经做了探索Transformer架构的三维人体姿态估计(HPE)。在这项工作中,我们提出了级联变压器,一种新的基于变压器的方法,从一个单一的图像三维HPE。具体而言,我们的级联变压器包括两个变压器编码器,分别利用静态和动态的人类关节关系。利用自我注意力模块和级联结构,我们的方法全面模拟静态和动态人体关节关系。
2024-06-13 11:00:41
757
原创 刷题记录(240612)
xiecheng1.给定两个正整数x和p,要求从x中提取出所有的奇数位数字组成一个新数,然后将这个新数对p取模,并输出结果。
2024-06-12 19:56:03
205
转载 mac双屏时程序坞跑到副屏的解决方法
(2) 鼠标回到主屏,放在主屏正下方中间的边缘不要动,主屏能看到扩展坞出现了;(3) 按下 option+command+D,锁定其到主屏;(1) 按下 option+command+D,开启。“自动隐藏”,副屏程序坞消失;
2024-05-29 15:17:54
2655
原创 推荐系统学习笔记(四)--基于向量的召回
离散特征:性别,国籍,英文单词,物品id,用户id处理:建立字典:eg:china = 1向量化:eg:one-hot /embedding(低维稠密向量)
2024-05-21 19:54:52
736
原创 推荐系统学习笔记(三)
Q:假如重合的用户是一个小圈子:在一个群里,毫无关联的笔记也会被同时交互solve:降低小圈子权重--------------swing的主要目的------------给用户加权相似度:a是人工参数,overlap降低小圈子对相似度的影响。
2024-05-21 19:39:19
511
原创 推荐系统学习笔记(二)
1.给定用户id,用户->物品,找到用户近期感兴趣的物品列表(last-n)2.对于last-n中的每个物品,物品->物品,找到top-k相似物品。用户对物品j的兴趣 * 物品j与候选物品的相似度。3.对上面的物品(最多nk个),计算兴趣分数。4.返回分数最高的100个物品,作为推荐结果。没有考虑用户喜欢物品的程度。计算相似度 (0,1)量化用户对物品的兴趣。相似:受众有无重合、索引的意义:避免枚举。
2024-05-16 19:54:44
163
原创 推荐系统学习笔记(一)
同类策略(精排中的两种模型)天然互斥,并且(两条召回通道)效果会相互影响,避免干扰。反转:有的指标立刻影响,有的需要长期观测-------尽快推全也可以长期观测。10%作为holdout桶,实验使用剩余的90%,做diff(需要归一化)不同策略(添加召回通道,优化粗排模型)通常不会干扰,可以作为正交的两层。保留10%,完全不受实验影响,可以考察整个部门对业务指标的贡献。同层互斥----避免一个用户被两个实验影响。不同层正交----每层独立随机分配用户。推全:新层,与其他层正交,90%用户。
2024-05-15 10:53:22
260
原创 RuntimeError: Requested MovieWriter (ffmpeg) not available
这个错误通常发生在使用matplotlib库进行动画制作时,尝试将动画保存为视频文件,但是没有安装必要的。是一个可以用来处理视频、音频和图片的软件,是许多编码和视频处理任务的首选工具。解决这个问题,你需要安装。
2024-04-05 15:41:47
1312
原创 Leetcode 268 火星词典
1)如果相邻字符串在相同位置上的字符不同,那么记录它们之间的转换关系,即将 words[i][j] 转换为 words[i + 1][j],并将其添加到 m[words[i][j]] 集合中。2)如果相邻字符串在相同位置上的字符相同,且已经比较到字符串末尾,并且第一个字符串比第二个字符串长,那么直接返回空字符串,因为没有有效的顺序可以满足这些条件。否则返回空字符串,表示没有有效的顺序。在第一个不同字母处,如果 s 中的字母在这门外星语言的字母顺序中位于 t 中字母之前,那么 s 的字典顺序小于 t。
2024-03-07 11:06:44
433
2
原创 ‘scanf‘: This function or variable may be unsafe. Consider using scanf_s instead.
c++ visual studio出现:解决方法:程序第一行加入成功解决。
2023-10-26 16:57:43
107
原创 Three-Dimensional Human Pose Estimation with Spatial–Temporal Interaction Enhancement Transformer
人体三维姿态估计是计算机视觉领域的一个研究热点。近年来,在从单目视频估计3D人体姿势方面取得了重大进展,但由于自遮挡和深度模糊的问题,这项任务仍有很大的改进空间。一些先前的工作已经解决了上述问题,调查的时空关系,并取得了很大的进展。在此基础上,我们进一步探讨了时空关系,并提出了一种新的方法,称为STFormer。我们的整个框架包括两个主要阶段:(1)独立于时间域和空间域提取特征;(2)跨领域的信息交流建模。将时间依赖性注入空间域,动态修改关节间的空间结构关系。然后,使用结果来细化时间特征。
2023-09-21 16:16:49
175
原创 Retentive Network: A Successor to Transformer for Large Language Models
RetNet
2023-09-17 15:37:41
288
原创 Uplift and Upsample: Efficient 3D Human Pose Estimation with UpliftingTransformers
3D HPE
2023-09-14 14:35:51
204
原创 U-STN:U-shaped spatial–temporal transformer network for 3D human pose estimation
3D HPE
2023-09-08 13:44:48
235
原创 EMHIFormer: An Enhanced Multi-Hypothesis Interaction Transformer for 3D human pose estimation in vid
3d HPE
2023-09-06 17:36:03
115
原创 LGFormer:LOCAL TO GLOBAL TRANSFORMER FOR VIDEO BASED 3D HUMAN POSE ESTIMATION
3D HPE
2023-09-06 10:43:12
877
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人