- 博客(9)
- 收藏
- 关注
原创 【ICRA 2023】SASD 论文阅读笔记:一种安全感知的无监督技能发现方法
Safety-aware unsupervised skill discovery,感觉仍然是加监督信号 加 reward 的方法。
2025-07-21 21:29:11
603
原创 从高维到离散:深入理解 Product Quantization (PQ) 的原理与应用
Product Quantization:分块 → 聚类 → 找最近的聚类中心。
2025-07-16 18:00:00
994
原创 WDM 论文阅读笔记:从信息论到表示学习
把互信息中的 KL(p(xy), p(x)p(y)) 替换成了 W(p(xy), p(x)p(y)),好像性能更好。
2025-07-13 14:09:15
562
原创 eBay 电商搜索新突破:NEAR2 嵌套向量方法,让搜索“又快又准”
NEAR2 提出多维度(64 128 512)embedding 训练技术,为每一维都训练对比学习 loss,使得每一种维度的 embedding 都包含全局信息,且 embedding 头部信息量最大。
2025-07-02 22:40:25
436
原创 非对称模态检索:京东 SMAR 在电商搜索中的创新实践
1. 使用多个任务训练多模态 embedding,2. 训练一个按需使用图片模态的“门控”模块。
2025-07-02 22:14:58
680
原创 五分钟彻底理解 Model-Agnostic Meta-Learning(MAML)
MAML 训练模型的初始参数,使其面对新任务时,只需少量数据 + 几步梯度更新便能快速学习。
2025-04-04 15:29:09
331
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人