Miha_Singh-优快云博客

原创 Fun Papers[4] WWW‘25 基于DPO的推荐系统去偏

大模型和推荐系统结合，应用DPO进行去偏

2025-03-29 16:54:45 933

原创 FunPapers[3]：WWW‘25「快手」生成式回归预测观看时长

连续值预测（Continuous Value Prediction, CVP）是推荐系统和视频平台中的一项重要任务，其目标是对用户的观看时长、评分或其他连续数值进行预测。生成式回归（Generative Regression, GR）是一种新颖的CVP框架，其核心思想是将连续值预测问题转化为序列生成任务，通过逐步生成时间槽序列来逼近目标值。这里的词汇表中是由时间槽（time slot）组成，类似于文本任务中的token，每个时间槽代表预先定义的一定时长，如5秒、10秒等。提出一种新型的连续值预测框架，

2025-03-02 23:14:03 721

原创 LLM规划能力如何成为Agent超级大脑？

LLM在Agent规划模块中的应用越来越广泛，但传统规划方法存在很多局限，比如符号化方法需要人工转换，强化学习方法又需要大量样本。而LLM凭借推理、工具使用、规划、指令遵循等能力，正在改变这一切！今天来给大家介绍一下AI如何成为Agent的大脑——LLM规划能力！都说2025年是Agent落地的元年，让我们一起期待它未来的发展吧！

2025-02-22 09:30:00 304

原创 FunPapers[2]：www‘24 「快手」连续特征单调性建模

深度模型在当前工业推荐系统中引用广泛，数值特征则是深度模型输入的重中之重，但现有研究较少关注数值特征与模型输出之间的单调性关系，而这对于模型的可解释性和准确性具有重要意义，特别是在搜广推领域。

2025-02-16 11:26:35 631

原创 FunPapers[1]: GBDT和DNN强强联手，表格预测新突破！

论文提出了Tree-hybrid MLP（T-MLP）方法，其核心思想是结合GBDT的特征选择和模型集成优势与DNN的高维特征空间和光滑优化特性，通过张量化GBDT特征门、DNN架构剪枝和反向传播协同训练MLP模型，以实现高效、有效的表数据预测。

2025-01-28 10:30:00 369

原创大模型训练工具，小白也能轻松搞定！

常见的大模型微调、训练工具，包括Axolotl、Llama-Factory、Firfly、Xtuner、Swift、Unsloth、Trainer。

2025-01-22 00:42:50 756

原创浅谈文本匹配

本文简单谈了一下笔者关于文本匹配的一些认识，主要以字面匹配和语义匹配的角度为中心。这里没有涉及具体的匹配方法，主要是关于文本匹配的一些理解，以及当前的一些挑战和难点。文本匹配是一个比较具体的任务，离实际的业务比较近，在搜广推都中都有非常广泛的应用，面临的问题也比较具象和琐碎。从“上古”的纯字面匹配，到词向量，再到基于语言模型的语义匹配，文本匹配已经基本完成字面匹配到语义匹配的转换，但仍然有一些语义匹配不能覆盖的点。

2025-01-04 10:36:49 785

原创语言模型文本匹配的主流方法回顾

探索文本匹配的奥秘，一文尽览文本匹配主流方法

2024-12-14 11:04:51 940

原创论文速读记录 - 202410

秋意浓，看几篇论文解解乏吧~

2024-10-31 22:20:15 660

原创论文速读记录 - 202409

9月论文速读记录，KDD 2024论文专场，提前祝大家国庆快乐！

2024-09-29 15:01:06 927

原创论文速读纪录 - 202408

新鲜出炉的八月份论文阅读记录

2024-09-04 01:27:05 1213

原创 Sigir2024 ranking相关论文速读

Sigir2024 ranking 相关论文速读

2024-06-15 18:33:07 945

原创简明Pytorch分布式训练 — DistributedDataParallel 实践

一键带你运行Pytirch分布式模型训练

2024-03-30 23:10:23 1356 2

原创 Huggingface初上手即ERNIE-gram句子相似性实战

大模型如火如荼的今天，不实操一下实在是说不过去了

2024-02-29 22:43:53 1391

原创 RAPTOR：递归摘要与树形检索的结合，提升RAG检索性能

RAPTOR：递归摘要，树形检索，助力RAG中的多粒度语义块检索

2024-02-08 08:50:05 1165

原创 PyTorch数据并行（DP/DDP）浅析

带你一键运行数据并行（DP/DDP）代码

2024-01-05 01:55:12 2061 1

原创 Empowering Long-tail Item Recommendation through Cross Decoupling Network (CDN)

长尾问题是个老大难问题了。在推荐中可以是用户/物料冷启动，在搜索中可以是中低频query、文档，在分类问题中可以是类别不均衡。长尾数据就像机器学习领域的一朵乌云，飘到哪哪里就阴暗一片。今天就介绍来自Google的一篇解决长尾物品推荐的论文。

2023-09-03 00:39:14 662

原创 Improved Deep Metric Learning with Multi-class N-pair Loss Objective

从N-pair loss初探度量学习

2023-08-10 01:14:55 424

原创 Rethinking the Role of Pre-ranking in Large-scale E-Commerce Searching system

这篇论文对粗排的角色进行了分析，讨论了粗排过度模拟精排的问题，分别从离线评估方式、样本构造、目标构造和学习框架上进行了改进。论文没有花太多篇幅在模型框架的创新上，而是在深入的分析和解决真实粗排场景中常见的问题，在各种细节上也处理的很到位，如多个正样本的list-wise损失函数的改造上。完整、仔细地读下来，对理清粗排地整个流程和挑战都很有帮助，值得学习。欣赏一下北京的夜景😀。

2023-07-09 22:13:20 559

原创浅尝Transformer和LLM

大语言模型势不可挡啊。哲学上来说，语言就是我们的一切，语言所不能到达的地方我们也不能达到。就人类来说，语言或许已经不仅仅是一种工具那么简单，其不仅是人类在物理世界进行活动时不可或缺的媒介，也是我们自身构建精神世界时的一砖一瓦。语言的重要性已经无需多言了。教会计算机人类的语言（用人类的语言进行思考）是一项艰巨的任务，或许从计算机发明之初这一征程就已经开始了，然而直到现在我们还有很长的路要走。最近，大语言模型大放异彩让我们看到了更大的希望。

2023-06-22 22:01:26 3912

原创关于大模型对未来影响的一点看法

大模型技术火热异常，未来的生活会是怎样

2023-05-05 18:08:39 866

原创 Addictive & Multiplicative in NN

浅析Addictive和Multiplicative

2023-05-05 18:05:32 505

原创机器学习中常用的模型评价指标及其应用场景

模型性能评估是模型生命周期中重要的一环，有哪些常用的机器学习模型评估方法呢？

2023-04-06 16:52:50 1074

原创一个例子了解operator+

直击 operator+ 底裤

2023-03-07 23:10:18 276

原创庐陵乡土“订婚”文化简记

乡土文化

2023-02-10 01:07:51 184

原创 Spark Shuffle

这一篇主要讲 Spark 中的 Shuffle 机制.将 job 划分成多个 task 后, stage 内的一个 task 可以在一个节点上完成计算, task 内以来的数据可以直接存储在当前结点上 (内存或者磁盘中). 但是 stage 间的 task 可能在不同节点上计算, 那么当前 task 怎么拿到上一 stage 的数据呢?注意到在生成物理执行计划时, 是按照宽依赖对 DAG 进行划分的, 也就是在宽依赖型的 transformation 的输入和输出之间切一刀. 所以这个问题等价于。

2022-10-31 15:50:59 305

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Hello_3D.rar

javafx画板程序

EGE图像说明库

统计学习方法

空空如也