王金-太想进步了-优快云博客

原创 Alias-Free Latent Diffusion Models:Improving Fractional Shift Equivariance of Diffusion Latent Spac

读完论文的主要内容后，我们可以总结论文的贡献：我们追溯了潜扩散模型编辑不稳定的主要原因：缺乏分数平移同变性。我们设计了一种无混叠的潜扩散模型 (AF-LDM)，它能够有效提升 LDM 的平移同变性。从技术贡献上看，我们提出了简明有效的同变损失，以防止加入了抗混叠模块的模型在训练中损失同变性。此外，我们分析了自注意力运算不够稳定的原因，并通过在同变损失里加入同变注意力来提升模型对参考帧的相对同变性。我们在多项任务中展示了 AF-LDM 广泛的应用前景。其中，我认为第一项贡献是最重要的。

2025-04-03 14:01:04 1265

原创 Deepfake Detection of Face Images based on aConvolutional Neural Network——基于卷积神经网络的人脸图像深度伪造检测

假新闻，特别是deepfakes（生成的非真实图像或视频内容）在过去几年中已经成为一个严肃的话题。随着机器学习算法的出现，现在比以往任何时候都更容易生成这种虚假内容，即使是对私人来说。生成的虚假图像的问题在政治和公众人物的背景下尤其重要。我们希望通过构建基于卷积神经网络的模型来解决这一冲突，以便检测此类显示人类肖像的生成和伪造图像。作为基础，我们使用预训练的ResNet-50模型，因为它在分类图像方面很有效。然后，我们采用基本模型来将单个图像分类为真实图像。

2025-03-18 14:52:44 1229

原创 A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第8部分——数据

后训练技术被精心设计以提高LLMs对特定领域或任务的适应性，而数据集则是这一优化过程的基石。对先前研究[457, 82]的仔细审查强调了数据的质量、多样性和相关性如何深刻影响模型的有效性，并经常决定后训练努力的成功与否。为了阐明数据集在此背景下的关键作用，本文提供了对后训练阶段所使用数据集的一个全面回顾和深入分析，并根据其收集方法将它们分类为三种主要类型：人工标记数据、提炼数据和合成数据。这些类别反映了数据管理中的不同策略，模型可能采用单一方法或结合多种类型的混合方法来平衡可扩展性、成本和性能。

2025-03-18 13:06:29 650

原创 A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第9部分——应用

尽管预训练为大型语言模型（LLMs）赋予了强大的基础能力，在现实世界的应用中，这些不足显得尤为重要，因为在这些场景中，精确性、可靠性和伦理一致性是至关重要的。这些问题引发了一些根本性的探讨：(1) 如何系统地提高LLM的表现以满足特定领域的需求？(2) 在实际应用环境中，有哪些策略可以有效缓解内在的实际障碍？后训练成为了一个关键解决方案，通过改进LLMs对特定领域术语和推理模式的识别来增强其适应性，同时保持其广泛的竞争力。

2025-03-18 13:00:18 1183

原创 Post-training Language Models，PoLMs-概况

国内外14家机构的研究人员，用87页文章，对LLM的后训练方法（Post-training Language Models，PoLMs）进行了全面综述该文章追溯了追踪从GPT-3（2020年）→ChatGPT（2022年）→DeepSeek-R1（2025年）的后训练进展，时间线如下：2018-2021年（LLM基础时期） • BERT和GPT确立了预训练和微调范式。• 基于Transformer的模型提升了文本生成和理解能力。2022-2023年（后训练方法的崛起）• 引入了RLHF（人类反

2025-03-17 19:43:46 2262

原创 A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第10部分——开放问题和未来方向

在本节中，我们批判性地评估了大型语言模型（LLMs）后训练方法中的未解决问题和潜在发展轨迹，分析基于OpenAI的o1 [41] 和DeepSeek-R1 [28] 的发布所带来的变革性进展。这些模型利用大规模强化学习（RL），重新定义了推理基准，但它们的出现放大了后训练技术中持续存在的局限性的紧迫性。以下小节概述了六个关键的开放问题，每个问题都强调了其对领域发展的至关重要性和解决的紧迫性，以及推动未来研究并确保LLMs在多样化应用中负责任发展的可行策略。

2025-03-17 19:41:54 1125

原创 AI Agent--李宏毅

目前agent没有统一的定义，有人认为有物理实体的机器人才是AI agent，这没问题，李老师的课程将AI agent的定义限定为能自主完成人类目标的AI。人给一个目标，agent根据环境对目标做出行为，然后环境发生变化，agent再根据环境的变化做出决策，直到结束。举个例子：阿尔法狗。

2025-03-16 17:55:51 2208

原创 A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第2部分

RM1（显式或隐式奖励模型）RM2（点奖励或偏好概率模型）RM3（响应级或令牌级奖励）RM4（正向或负向奖励模型）F（反馈类型：人类或AI）RL1（参考模型或无参考模型的RL）RL2（在线策略或离线策略RL）O（在线/迭代或离线/非迭代优化）通过对这些指标的评估，可以帮助研究人员和实践者根据特定需求选择最适合的对齐方法。这些方法各自具有不同的特点，可以根据应用场景的不同要求进行调整和应用。奖励训练 (Reward Training)

2025-03-15 22:05:37 1128

原创 A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第一部分

大型语言模型（LLMs）的进步构成了自然语言处理（NLP）中的一个关键章节，而后训练方法作为其从通用预训练架构到特定任务自适应系统的演进中的重要催化剂。本节概述了后训练语言模型（PoLMs）的历史轨迹，追溯了它们从BERT [2] 和GPT [1] 等基础预训练里程碑发展到当代如o1 [41] 和DeepSeek-R1 [28] 等先进后训练范式的历程。图3所示的这一进程反映了从建立广泛的语言能力到增强任务特定适应性、伦理对齐、推理复杂性以及多模态集成的转变，标志着LLM能力的一次变革之旅。

2025-03-15 21:43:34 2303

原创 Attributing Fake Images to GANs: Learning and Analyzing GAN Fingerprints————将虚假图像归因于GAN：学习和分析GAN指纹

"Attributing Fake Images to GANs: Learning and Analyzing GAN Fingerprints" 这篇论文在2019年的国际计算机视觉会议（ICCV）上发表。这篇论文《Attributing Fake Images to GANs: Learning and Analyzing GAN Fingerprints》的核心思想是探索和验证生成对抗网络（GANs）生成的图像是否携带独特的“指纹”，这些指纹可以用来识别图像是否由GAN生成以及具体是由哪一个GAN模

2025-03-12 19:33:46 1038

原创自然语言处理

清华大学课程。

2025-03-12 15:17:03 157

原创 L2G2000Lagent 自定义你的 Agent 智能体

Lagent 是一个轻量级开源智能体框架，旨在让用户可以高效地构建基于大语言模型的智能体。同时它也提供了一些典型工具以增强大语言模型的能力。Arxiv 搜索Bing 地图Google 学术搜索Google 搜索交互式 IPython 解释器IPython 解释器PPTPython 解释器。

2025-03-11 15:13:34 988

原创 Exploring Frequency Adversarial Attacks for Face Forgery Detection——探索用于面部伪造检测的频率对抗攻击论文解读（对抗攻击）

现有的攻击方法大多被视为空间对抗攻击，它们在像素级别上修改对抗样本。由于篇幅限制，这里只介绍用于实验比较的两种空间对抗攻击方法。更多变种可以参考。快速梯度符号法 (FGSM)：FGSM [15]是一种单步攻击方法，基于对抗损失的梯度计算扰动。投影梯度下降 (PGD)：PGSM [31]是FGSM的一个多步变体。同时，它采用首次迭代时对扰动的随机初始化。更新过程定义为。

2025-03-09 13:48:02 1023

原创 L1G6000OpenCompass 评测书生大模型实践

本节课程聚焦于大语言模型的评测，在后续的课程中我们将介绍多模态大模型的评测方法。OpenCompass 提供了和两种方式。其中 API 模式评测针对那些以 API 服务形式部署的模型，而本地直接评测则面向那些可以获取到模型权重文件的情况。我们首先在训练营提供的开发机上创建用于评测 conda 环境:cd /rootpip install -e .#等的比较久，不运行这个的话后面会一直报错，缺少各种包的错误，这句运行了，就不用一直安装各种包，避免报错（后面自己装也是会出现版本错误）

2025-03-08 10:22:31 719

原创 L1G5000XTuner 微调个人小助手认知

本节中，我们将演示如何安装 XTuner。推荐使用 Python-3.10 的 conda 虚拟环境安装 XTuner。

2025-03-06 22:19:39 841

原创 L1G4000InternLM + LlamaIndex RAG 实践

Einops主要用于简化和优化深度学习中的张量操作，使得代码更加易读和高效。Protobuf则是一个强大的序列化工具，适合需要高效、可靠地传输和存储结构化数据的应用场景。环境激活后，命令行左边会显示当前（也就是llamaindex。

2025-03-05 21:01:08 986

原创 2. LangGPT结构化提示词

LangGPT 是的简称，中文名为结构化提示词。LangGPT 是一个帮助你编写高质量提示词的工具，理论基础是我们提出的一套模块化、标准化的提示词编写方法论——结构化提示词。我们希望揭开提示工程的神秘面纱，为大众提供一套可操作、可复现的提示词方法论、工具和交流社群。我们的愿景是让人人都能写出高质量提示词。

2025-03-05 15:50:59 1269

原创 L1G2000玩转书生「多模态对话」与「AI搜索」产品

一般情况下主节点会根据子节点得出的结论，总结形成最终回复部分情况下，主节点会根据子节点得到的结论进一步拆解子问题回到步骤 (1) 直到得到最终结论。

2025-03-05 15:39:56 824

原创 L1G3000浦语提示词工程实践

Prompt是一种用于指导以大语言模型为代表的生成式人工智能生成内容(文本、图像、视频等)的输入方式。它通常是一个简短的文本或问题，用于描述任务和要求。Prompt可以包含一些特定的关键词或短语，用于引导模型生成符合特定主题或风格的内容。例如，如果我们要生成一篇关于“人工智能”的文章，我们可以使用“人工智能”作为Prompt，让模型生成一篇关于人工智能的介绍、应用、发展等方面的文章。Prompt还可以包含一些特定的指令或要求，用于控制生成文本的语气、风格、长度等方面。

2025-03-04 17:09:51 740

原创 L1G1000书生大模型全链路开源体系

这些核心技术思路体现了书生大模型在设计和开发过程中的迭代、数据驱动和智能化的特点，旨在通过不断的自我优化和学习，提高模型的性能和适应性，以满足各种复杂的应用场景。经典的问答大模型，智能体MindSearch，能够在挥发时更加的智能，更符合提问的需求，还能由此生成更进一步的内容，类如下图中的思考。数据过滤&智能评估：在模型训练过程中，对收集到的数据进行筛选和清洗，确保只有高质量的数据被用于模型训练，从而提高模型的性能和准确性。利用模型的能力辅助人工标注，提高数据标注的效率和质量，进一步优化模型的训练数据。

2025-03-04 16:15:31 677

Awangjingaaa的博客

原创 Alias-Free Latent Diffusion Models:Improving Fractional Shift Equivariance of Diffusion Latent Spac

原创 Deepfake Detection of Face Images based on aConvolutional Neural Network——基于卷积神经网络的人脸图像深度伪造检测

原创 A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第8部分——数据

原创 A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第9部分——应用

原创 Post-training Language Models，PoLMs-概况

原创 A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第10部分——开放问题和未来方向

原创 AI Agent--李宏毅

原创 A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第2部分

原创 A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第一部分

原创 Attributing Fake Images to GANs: Learning and Analyzing GAN Fingerprints————将虚假图像归因于GAN：学习和分析GAN指纹

原创自然语言处理

原创 L2G2000Lagent 自定义你的 Agent 智能体

原创 Exploring Frequency Adversarial Attacks for Face Forgery Detection——探索用于面部伪造检测的频率对抗攻击论文解读（对抗攻击）

原创 L1G6000OpenCompass 评测书生大模型实践

原创 L1G5000XTuner 微调个人小助手认知

原创 L1G4000InternLM + LlamaIndex RAG 实践

原创 2. LangGPT结构化提示词

原创 L1G2000玩转书生「多模态对话」与「AI搜索」产品

原创 L1G3000浦语提示词工程实践

原创 L1G1000书生大模型全链路开源体系

原创 L0G4000玩转HF/魔搭/魔乐社区2.2 魔搭社区平台

原创 L0G4000玩转HF/魔搭/魔乐社区

原创第3关L0G3000Git 基础知识--GitHub

原创书生-第2关L0G2000Python 基础知识-任务三

原创书生-第2关L0G2000Python 基础知识-任务二--调用书生浦语API实现将非结构化文本转化成结构化json的例子

原创 383. 赎金信

原创 Conda

原创 3.2 进程管理

原创 Linux的基础知识2

原创 2.3. 端口映射、Linux 基础命令1

原创 2.2.3 使用VScode进行SSH远程连接

原创 2.2.2 配置SSH密钥进行SSH远程连接（可选）

原创书生--第1关L0G1000Linux 基础知识

空空如也

空空如也