transformer_WSZ-优快云博客

原创生成式召回-TIGER范式

TIGER是第一篇将Generative Retrieval 自回归生成方式应用于推荐系统的工作；它通过Semantic ID 和 Seq2Seq Transformer，突破embedding + ANN的传统限制；在冷启动、多样性、效率和泛化能力上展现强优势；适用于大规模推荐场景，尤其是content-rich、item海量、频繁上线新品的平台。

2025-07-27 23:20:07 681

原创 codebook简史

一文详解 codebook 技术史（从 VAE 到 VQ/RQ-VAE 到 FSQ）

2025-07-19 00:24:50 117

原创离线运筹求解流程

基于，概述一下如何用二分搜索来运筹求解λ。more原问题∑imaxjpij−λcij是一个求解λ最优值的线性规划问题，其目标是找到使得目标函数最大化的λ。我们可以使用二分搜索来求解。

2025-07-13 04:21:04 910

原创扭矩&马力

马力和扭矩是衡量发动机性能的两个核心指标，但它们的物理意义和对车辆性能的影响截然不同。家用车马力适中（如150PS）兼顾油耗。（超1,000PS）维持极速。

2025-07-06 20:10:23 185

原创 FLOPS、FLOP/s、TOPS概念

这个模型需要 1 TFLOP/s 的计算量，GPU 的峰值性能是 10 TFLOPS”是常见的术语，但它们有明确的区别和应用场景。“这个模型需要 1 TFLOPS”在计算性能和硬件指标中，

2025-06-29 23:29:27 688

光锥是以某个事件为顶点，以光速传播形成的时空区域边界。设想一个时空中的事件EEE未来光锥（Future Light Cone）是从事件EEE向未来扩展的所有可能被你这次响指影响到的事件区域（以光速或更慢传播）。过去光锥（Past Light Cone）是能影响你打响指的这个事件的所有过去事件区域（信号从它们出发，以光速或更慢速度传到你这里）。光锥外部（Elsewhere）是那些你无法影响，也无法影响你的事件。因为它们之间的传播所需速度超过光速，不符合因果律。

2025-06-18 02:28:30 1043

原创三体问题详解

从物理学角度，三体问题之所以不稳定，是因为三个天体在万有引力作用下相互作用，形成一个非线性耦合系统。我们可以从牛顿经典力学出发，列出具体的运动方程，并说明为何这个系统本质上是混沌的，无法得到一般解析解。more。

2025-06-09 03:24:52 778

原创对数正态分布LogNormal

分母的xxx是数学推导的必然结果，源于概率密度变换的雅可比行列式。它保证了fXxf_X(x)fXx是一个合法的概率密度函数（积分为1）。若替换为ln⁡x\ln xlnx，会破坏分布的正确性。

2025-06-03 15:07:19 939

原创 Zero-Inflated Log-Normal Loss

more针对这种数据分布，Google提出了ZILN Loss，用于更真实地拟合这类零膨胀、长尾的数据。LTV建模如下两个任务：用户是否付费、付多少费，分别对应上述两个问题。μσL1x0;

2025-06-03 03:29:59 786

原创 Shared-Bottom & MoE & MMoE

Shared-Bottom、MoE、MMoE的结构对比如下：more。

2025-05-18 16:02:28 127

原创斯诺克术语

恭喜赵心童夺得世锦赛冠军！

2025-05-14 10:58:09 552

原创策略梯度与Q-Learning的区别

策略梯度（Policy Gradient, PG）是强化学习中的一类直接优化策略的方法，通过梯度上升（Gradient Ascent）更新策略参数，以最大化期望回报。与Q-Learning等基于值函数的方法不同，PG直接对策略πθa∣sπθa∣s（参数为θ\thetaθ）进行优化，适用于连续动作空间或随机策略的场景。离散动作：策略网络输出离散动作的概率分布（如Softmax）。连续动作：策略网络输出高斯分布的参数（μσμσ），通过采样得到连续值。∇θJθE。

2025-04-27 03:21:11 960

原创线性代数-矩阵的秩

矩阵的秩本质上是其行或列向量的独立信息量的度量，决定了矩阵在变换中的“自由度”。理解秩有助于分析方程组、空间变换以及矩阵的稳定性等问题。

2025-04-21 22:48:05 2557

原创赛睿鼠标设置宏

鼠标宏是一种自动化脚本，用于记录并重复执行一系列鼠标操作（如点击、移动、滚轮滚动等），以提高操作效率或实现复杂操作。它通常用于游戏、办公自动化、设计等领域。记录一下赛睿鼠标的宏设置。点击打开编辑器，然后点击启动，就开始录制按键。如果想关闭宏命令，则重新选择默认即可。选择按键之间无延迟，即可快速输入。选择要绑定宏命令的按键，这里以。保存并启动该宏命令。键可以看到自动化输入。

2025-04-21 02:24:24 950

原创 IPW逆概率加权

IPW是个非常优雅的纠偏方法。下面介绍如何利用它来实现纠偏：moreτxμ1xμ0xτxEPY1−Y0∣xEPY∣W1XxEPY∣W0Xxμ1x−μ0xESTRPYW1∣XESCRPYW0∣Xμ1μ0τTRPY∣W1X⋅πPW1∣Xμ1⋅πCRPY∣W0。

2025-04-08 02:26:59 755

原创各开源协议一览

在 GitHub 上，开源项目通常会使用一些常见的开源协议来定义项目的使用、修改和分发规则。

2025-04-07 16:15:30 948

原创 COBRA详解

稀疏ID可以唯一表示item，有很好的区分性，但丧失了对item的细粒度信息刻画。纯文本可以准确可以item属性，但构造成prompt太长，套入到LLM中会导致资源消耗过大。那么如何结合两者的优点呢？COBRA首先根据codebook生成item的稀疏ID，该ID可以理解为item的大类别。既不过于精细，像unique id，又不过于宽泛。然后将ID序列输入到Transformer Decoder中预测稠密向量。

2025-04-03 01:54:43 850

原创基于特征函数的数据蒸馏方法

本篇是CVPR满分作文，聚焦于数据蒸馏工作，创新点在于将数据合成问题建模成对抗性的minmax优化问题。more具体而言，本文引入了基于特征函数的分布差异度量方法，该方法能够完整地刻画一个分布的所有信息（相位和幅度）。利用特征函数的性质，最小化合成数据与真实数据的分布差异实现仿真，优化采样策略来最大化两者分布差异实现多样性和鲁棒性。

2025-04-02 01:24:54 333

原创 VAE讲解

2025-03-31 01:01:34 1101

原创自定义CUDA算子融合实现模型推理加速

对模型进行推理加速的最常用方法就是算子融合，这里用个简单demo记录下：more。

2025-03-31 00:55:10 568

原创有限预算分配下的01背包问题

将上述业务问题抽象成01背包问题就是，在背包容量限制下的物品价值最大化。但传统的背包问题对应的是给同一个用户发多张券，而营销场景则是给多个用户分别只发一张券，相当于二维化传统背包问题了。备注：上述代码实现的时空复杂度过高，一天的预算都有几个亿，不可能初始化这么大的数组，且寻找最优解耗时也长。有限预算的权益分配本质上是个升级版的背包问题。表示券的总数，是个枚举值。

2025-03-29 04:30:44 757

原创用tensorboard支持pytorch训练可视化

在工作用了tensorboard来可视化模型训练过程后，发现还挺香的。另外pytorch也正式支持tensorboard了，这里记录一下。more。

2025-03-22 03:23:38 355

原创测不准关系

在物理学中，测不准关系（Uncertainty Principle），又称为海森堡不确定性原理（Heisenberg Uncertainty Principle），是由德国物理学家维尔纳·海森堡于1927年提出的量子力学的一个基本原理。这个原理表明，在量子尺度上，某些对易不为零的物理量（比如位置和动量）是不可能同时被精确测量的。）的不确定度就会变得非常大，反之亦然。这不是因为测量技术上的限制，而是量子现象固有的特性。测不准关系是量子力学的一个基本特征，它对我们理解微观世界的本质有着深远的影响。

2025-03-14 14:03:14 996

原创 SGM: Sequence Generation Model for Multi-Label Classification

为了建模多标签之间的依赖关系，本篇工作用序列生成的方式来解决该问题。more当前label的预测不仅依赖于输入上下文，也依赖于已输出的所有label。

2025-03-09 03:31:02 822

原创 DCN讲解

DCN是DeepFM的升级版，后者是只能做二阶交叉特征，随着阶数上升，模型复杂度大幅提高，且FM网络层较浅，表达能力有限。google团队通过构建深度交叉网络来自动进行特征的高阶交叉，且时空复杂度均为线性增长，极大提升了模型性能。more。

2025-03-03 00:06:17 232

原创 PEPNet

鉴于PEPNet已经是多场景、多任务建模的baseline，这里有必要详细讲解一下。more。

2025-02-28 02:43:03 915

原创运筹求解的最优点选择

讲述了线上运筹发放红包的流程，但在实践中发现发券分布异常极端，倾向于发在两端，即要么最小面额（占绝大多数），要么最大面额。如果长期按照这种分布发放，将会极大影响用户核销体验以及平台订单的持久增长。上述问题迫使我们思考，除了满足预算约束外，我们的量价模型还应该具备哪些能力？more给出了答案：量价模型预估的核销率需满足单调递增和边际递减。

2025-02-20 02:12:33 798

原创线上运筹优化公式推导

min−∑ijxijpijs.t.xij∈01∑jxij1∑ijxijcij≤Cmin−ij∑xijpijs.t.xijj∑xijij∑xijcij∈011≤Cxijx_{ij}xij表示是否给用户iii发放红包jjjpijp_{ij}pij表示用户iii在红包jjj下的核销率，由量价模型预估产生c。

2025-01-15 19:25:09 571

原创三体中的常见名词

费米悖论：一个关于外星文明存在的著名矛盾问题，由诺贝尔奖得主、物理学家恩里科·费米在 1950 年提出。它的核心问题是：如果宇宙中存在大量可能的外星文明，为什么我们还没有发现任何证据？洛希极限：当一个较小的天体（如卫星或彗星）接近一个较大的天体（如行星或恒星）时，如果距离小于某个临界值，较小的天体将因为较大的天体的潮汐力而被撕裂。幸存派：为“侵略者”三体人服务的人，希望在他们降临地球后，自己的后代能够生存下去（可以理解为汉奸）降临派：对人类的本性绝望的人群，他们认为人类该被彻底毁灭，由三体人来重建地球。

2025-01-14 20:16:30 727

多界面传值

空空如也