人工智能技术白皮书
文章平均质量分 86
人工智能专栏致力于呈现AI领域最新理论、关键技术与工程应用。每篇文章从原理出发,兼顾代码实现、实验与产业案例,覆盖基础模型、视觉与语言、多模态、强化学习、可解释性与系统架构等方向。面向研究者与工程师,提供深度解析、实践指南与前瞻讨论,帮助读者把握技术趋势、提升研发能力并将前沿成果快速落地。
VectorShift
985院校硕士毕业,现担任算法研究员一职,热衷于深度学习算法研究与应用。曾获得阿里云天池比赛第三名,CCE比赛第五名,科大讯飞Q比赛第六名
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【无线电控制与数据链探测系统】第1章 理论基础:定义、模型与基本推导
侧重统计推导、算法改进、深度学习与评估(参照第3–6、10章)。:侧重链路预算、算法复杂度、实时实现与优化(参照第5、13章)。:关注指标定义、可测性、数据集与基准(参照第11、14章)。这是天线理论的基本关系(来自天线辐射与接收对偶性)。原创 2025-11-08 01:09:52 · 456 阅读 · 0 评论
-
全局–局部傅里叶神经算子(GL-FNO):原理、严格推导与 PINN 混合策略
本文提出了一种全局-局部傅里叶神经算子(GL-FNO)及其与物理信息神经网络(PINN)的结合方法。主要内容包括: 架构设计:GL-FNO包含两个分支 - 全局分支处理低频结构,使用下采样输入;局部分支处理高频细节,使用全分辨率输入。两分支通过自适应门控机制融合。 理论分析:证明了GL-FNO在"低频全局+高频局部"任务上的优势,给出了误差分解和复杂度分析,并推导了与PINN结合时的渐进一致性条件。 实现方法:采用频谱微分计算物理残差,推导了完整的训练流程,包括数据损失与物理损失的联合优原创 2025-11-19 01:12:56 · 993 阅读 · 0 评论 -
基于傅里叶特征PINN的地震多频波场模拟算法原理
本文提出一种基于傅里叶特征嵌入的物理信息神经网络(PINN)方法,用于高效求解频率域地震波场模拟问题。该方法通过将输入坐标映射到高维傅里叶特征空间,有效解决了传统PINN在高频波场模拟中的"谱偏差"问题。理论分析表明,该方法能重构神经正切核的频谱特性,提升高频成分的学习能力。数值实验显示,在Sigsbee2A复杂模型测试中,该方法的计算效率比传统有限差分频域法提升150倍以上,同时保持高精度。文章详细推导了复数域损失函数和散射场处理公式,并提供了基于PyTorch的高效实现方案,为下一代原创 2025-11-19 00:38:57 · 807 阅读 · 0 评论 -
PINNACLE:PINN自适应配点与实验点选择算法
PINNACLE算法通过引入动态权重机制,实现了PINN训练点选择的自适应优化。该算法基于对训练过程中不同区域学习需求变化的深入理解,设计了平滑过渡的权重函数,确保了模型在不同训练阶段能够优先学习最需要的区域。理论分析和实验结果均表明,PINNACLE不仅能够保证收敛性,而且能够显著提高PINN的性能。这一算法为物理信息神经网络的应用提供了重要支持,尤其适用于复杂PDE问题的求解。原创 2025-11-18 20:13:40 · 954 阅读 · 0 评论 -
AdaI-PINNs:高效求解界面问题的自适应物理信息神经网络框架
例如:圆椭圆不规则曲线任意几何形状主干网络与自适应激活模块完全可以复用。如果你需要,我可以提供:可直接运行的可直接运行的完整工程项目(含训练脚本、绘图脚本、误差评估)AdaI-PINNs 的优势极具工程应用价值:自适应激活使 PINNs 的表达能力随子域变化更快的训练速度(实验中提升 2–6 倍)更高的精度(提升 1–2 个数量级)对激活函数选择不敏感在界面附近不再振荡、不再失真完全保留 PINNs 的物理一致性与灵活性。原创 2025-11-18 13:32:17 · 729 阅读 · 0 评论 -
傅里叶基础混合物理信息神经网络(FMPINN):原理、完整推导与一致性证明
本文提出了一种基于傅里叶特征的混合物理信息神经网络(FMPINN)方法,用于求解多尺度椭圆型偏微分方程。该方法采用混合(flux)变分形式,通过双网络结构分别预测位势和通量。理论分析证明了该方法在能量范数下的连续一致性,并给出了误差分解框架(近似误差、优化误差和数值积分误差)。针对多尺度问题特点,设计了包含傅里叶特征映射和多尺度网络结构的复合网络架构。完整的PyTorch实现支持自动微分、边界条件处理和混合采样策略,实验验证了该方法对高频振荡和多尺度粗糙系数的鲁棒性。代码实现了从数据生成、网络训练到评估的全原创 2025-11-19 01:38:50 · 504 阅读 · 0 评论 -
【PINN系列】PSO-PINN:粒子群优化训练物理信息神经网络的原理与推导
本章从数学与算法角度系统推导把粒子群优化(Particle Swarm Optimization,PSO)用于训练物理信息神经网络(PINN)的理论基础与收敛性质。给出 PINN 的损失函数形式化、PSO 的离散动力学与统计动力学刻画,证明在合理假设下 PSO 动态的有界性与稳定性,并给出 PSO-PINN 联合训练的误差分解与收敛路线图。对每一步推导提供必要的定理、引理与证明要点,保证逻辑严密可供教材或论文方法章节直接采用。原创 2025-11-19 11:39:21 · 633 阅读 · 0 评论 -
第9章 语言级自我改进:Reflexion 与记忆机制
本章深入探讨大语言模型(LLM)实现的核心技术——及其配套的。区别于依赖外部训练数据或人类反馈的改进方式,Reflexion 赋予模型在推理过程中的能力,是构建具备“元认知”能力智能体的关键突破。同时,有效的是支撑这一持续学习过程的基础设施。本章将系统解析 Reflexion 的工作原理、与强化学习的协同策略,以及记忆的全生命周期管理。原创 2026-01-01 23:15:45 · 23 阅读 · 0 评论 -
第8章 强化学习改进(扩展与工程落地):将 ReAct 视为策略(PPO / RL)
高质量 cold-start:用 curated ReAct 轨迹做 SFT,保证语言质量。设计混合 reward:包含 outcome、trajectory、format,同时加 KL 和长度惩罚。低成本试验:先用 GRPO / DPO 验证 reward 设计和样本效率。PPO 精炼:在 LoRA + critic 架构上做最终精调,注意优势标准化与 KL 控制。评估与蒸馏:自动化对抗评估与人类评估;把策略蒸馏成轻量化生产模型。原创 2026-01-01 20:22:40 · 19 阅读 · 0 评论 -
一文搞明白PYTORCH
这是你需要根据自己的数据编写的部分。Python"""初始化:加载文件列表,不要在这里一次性读取所有图片(容易爆内存)。"""self.data_paths = data_paths # 图片路径列表self.labels = labels # 标签列表self.transform = transform # 预处理管道"""告诉 DataLoader 数据集有多大""""""核心:根据索引 idx 返回一个样本 (image, label)"""# 1. 读取数据 (伪代码)原创 2026-01-01 13:35:22 · 14 阅读 · 0 评论 -
第4章 ReAct 的形式化与核心实现
尽管理论上可以建模为完整的 POMDP,实际中由于 LLM 输出不确定性大,我们将其视为非平稳策略驱动的模拟器而非严格贝叶斯推断系统。因此,重点在于设计状态管理器 UpdateState和解析器 Parser来稳定策略执行路径。⚠️ 工程提示:在 prompt 中注入当前预算余量(如),并要求 LLM 在决策中考虑该约束。维度技术要点状态建模明确区分 visible state vs internal state策略控制结合 LLM + Parser + Schema 实现可靠策略。原创 2026-01-01 09:47:32 · 334 阅读 · 0 评论 -
第2章 从 CoT 到 ReAct:智能体认知架构的范式革命
2024年Q2某医疗Agent事故:攻击者通过‘计算BMI’工具注入恶意Python代码,窃取10万患者记录。评估基准:Stanford HELM Enterprise v3 (2024 Q3)实验设计:100个动态变化的医疗诊断场景(如新药副作用公告):计算“若美联储加息50基点,对某科技股期权价格的影响”:在MultiDocQA上减少47%上下文截断错误(:ReAct Agent在美股闪崩时错误执行对冲。,新增模块(记忆/规划)应作为插件而非替代。:在TruthfulQA上减少32%幻觉(原创 2026-01-01 08:48:10 · 399 阅读 · 0 评论 -
第6章 框架整合:LangChain、LangGraph 与自研微服务 ;第7章 追踪、日志与可视化(Observability)
—— 构建可扩展、可维护、生产级的 Agent 系统ReAct 范式与 LangChain 实现的精准对应:核心映射图解: 深度解析: 生产关键改造:常见陷阱与企业级解决方案:生产级 AgentExecutor 模板:6.2 用图式执行器(LangGraph)管理复杂依赖6.2.1 节点/边语义与循环控制策略超越线性流程:当 ReAct 无法满足多分支、条件跳转、并行执行时,LangGraph 提供状态机能力。核心概念映射:循环控制黄金法则:循环防护三原则:LangGraph 的原创 2026-01-01 12:38:04 · 34 阅读 · 0 评论 -
第5章 工具箱设计与安全(Tools & Safety)
— 构建可信、可审计、抗攻击的工具层。原创 2026-01-01 10:36:45 · 46 阅读 · 0 评论 -
第3章 近年关键进展综述:Reflexion、强化学习与层次化规划
特别值得注意的是,在稀疏奖励环境(如ALFWorld,成功路径占比<3%)中,Reflexion展现出显著优势,这归因于其能够从失败中学习的特性。在Meta的AgentBench基准测试中(2024),融合架构相比单一ReAct提升27.3个百分点,平均修正步数从4.7降至1.8,这表明融合系统不仅性能更高,而且效率更优。Reflexion与ReAct的融合代表了当前最先进的智能体架构,通过结合ReAct的"推理-行动"循环与Reflexion的自我改进能力,构建了完整的认知闭环系统。是该方法的核心创新。原创 2026-01-01 09:09:58 · 20 阅读 · 0 评论 -
第 1 章 绪论:智能体的必要性与工程挑战
在流行语境中,“智能体”常被泛化为任何能对话的AI。然而,在工程实践中,我们必须回归其控制论与人工智能领域的本源,给出一个。原创 2025-12-31 23:43:13 · 13 阅读 · 0 评论 -
Word2Vec 学习动力学:从特征提取到矩阵分解的洞见
在表征学习领域,一个核心问题是:模型在训练中究竟学到了什么,以及它是如何逐步习得这些知识的?Word2Vec 作为当代大型语言模型(LLM)的先驱,尽管已广为应用,但长期以来缺乏精确预测其学习轨迹的理论框架。最近的研究揭示,在特定初始化条件下,Word2Vec 的优化过程可简化为一个无权重最小二乘矩阵分解问题,这为理解其内部机制提供了新视角。原创 2025-12-28 23:04:18 · 23 阅读 · 0 评论 -
基于“分而治之”的传递强化学习 (Transitive RL)
在机器人、医疗或对话系统等数据昂贵的领域,我们需要Off-Policy算法(如Q-Learning),利用所有历史数据。然而,传统的Off-Policy算法在**长视界(Long-horizon)**任务中面临严峻挑战。为了演示清晰,我们构建了一个基于 PyTorch 的训练循环框架,包含网络结构、期望损失函数和传递性更新机制。虽然 $n$-step TD 试图折衷,但它只是线性地减少了递归次数,并没有从根本上解决误差累积的数学结构问题。传递强化学习(Transitive RL, TRL)**的核心理念。原创 2025-12-28 22:52:03 · 15 阅读 · 0 评论 -
一文全部读懂人工智能可解释性
两者关系:在类数固定且概率接近时,基尼与熵是单调相关的,经常在实践中相互替代(熵通常对小概率事件更敏感,基尼计算更简洁)。对解释性应用(如信贷审批),对概率的实际变化往往比 OR 更直观,因此建议同时报告 OR 与边际概率变化。满足这些公理的值函数就是上式唯一解。原创 2025-12-22 22:33:58 · 30 阅读 · 0 评论 -
概率神经网络(PNN)详解与现代扩展
使用粒子群优化(PSO)、遗传算法(GA)来自动搜索最优带宽。引出近年在回归、不确定性建模及分布拓展方面的新研究趋势。平滑参数(带宽)的影响及其在 PNN 训练中的重要性。将网络输出从“类别概率”扩展为“预测均值 + 方差”。使用核密度估计(KDE)来估计每个类别的似然概率。介绍概率神经网络(PNN)的起源及其核心思想。说明 PNN 在小样本学习、噪声环境中的优势。适用于分类与回归、均值与方差预测、多分布建模。适用于高风险行业(如金融、医疗、自动驾驶)。指出 PNN 在样本量小、类别不多时的优势。原创 2025-12-06 22:12:00 · 48 阅读 · 0 评论 -
状态空间模型及其在高分辨距离像识别中的应用——配套源码
本文摘要:本文系统性地研究了基于状态空间模型(SSM)的HRRP雷达目标识别方法。主要内容包括:(1)构建HRRP数据处理模块,实现复数信号加载与可视化;(2)提出HRRP预处理流程,包括幂变换、归一化和重心对齐;(3)实现基础Mamba网络,结合局部卷积和全局SSM建模;(4)设计双向Mamba结构,增强空间依赖性捕获能力;(5)开发复数域Mamba,直接处理复数HRRP信号;(6)提出掩码自编码预训练方法,结合时频联合损失提升特征学习。实验验证了各模块有效性,为雷达目标识别提供了端到端的深度学习解决方案原创 2025-12-06 17:16:38 · 25 阅读 · 0 评论 -
状态空间模型及其在高分辨距离像识别中的应用 第二章 状态空间模型基础与 HRRP 预处理
本章系统阐述了高分辨距离像(HRRP)的状态空间模型(SSM)处理框架。首先介绍了HRRP预处理方法,包括强度归一化、距离对齐、动态范围压缩和基于Hankel-SVD/小波的稀疏去噪技术。然后从连续时间线性系统出发,推导了SSM的离散化表达及其卷积等价形式,详细阐述了HiPPO初始化原理和并行扫描/选择性扫描的高效实现算法。在数值稳定性方面,讨论了矩阵参数化技巧和复数域扩展的实现要点。最后提出了HRRP自监督掩码预训练方案和标准化的实验规范,为后续章节的模型实现和实验验证奠定了理论基础。原创 2025-12-06 12:48:59 · 357 阅读 · 0 评论 -
状态空间模型及其在高分辨距离像识别中的应用 绪论部分
摘要(Chapter Abstract)本章从工程与理论双重视角出发,系统阐述高分辨距离像(High-ResolutionRange的物理生成机制与统计特性,明确其在目标识别中所提出的建模挑战;回顾序列建模技术的演进脉络,重点剖析结构化状态空间模型(SSM)及其族系(HiPPO、S4 等)如何为长序列记忆与低复杂度推理提供数学基础;进一步介绍选择性时变 SSM(以 Mamba 为代表)的原理与实现要点,说明其在 HRRP 任务中的适配路径;原创 2025-12-06 12:18:30 · 463 阅读 · 0 评论 -
【多模态视觉革命:架构、生成与安全】第1章 从Attention到状态空间模型(SSM)
CoAtNet(Convolution and Attention Network)提出了一种数学上的统一视角,将深度可分离卷积(Depthwise Convolution)与自注意力机制(Self-Attention)视为同一运算形式的不同特例,并实现了二者的加性融合。在视觉任务中,固定模式的稀疏(如局部窗口)限制了感受野。因此,U-Mamba 在数学上证明了可以用线性成本实现全局上下文建模,而前端的卷积层则保证了局部特征的精细度,完美契合了分割任务对“全局语义定位”与“局部边缘对齐”的双重需求。原创 2025-11-26 23:20:20 · 298 阅读 · 0 评论 -
【图神经网络:原理与实战】第十三章13.1 推荐系统:动态图与自监督实践
本节作为书中算法原理与工程实践的正式章节,系统给出动态图异构图建模与特征流水线、基于异构图的时序模型的严密推导、训练流程与在线A/B测试设计的统计学推导,以及评估指标与冷启动策略的理论与实践要点。章节内所有推导以严密性为首要目标,逐步展开;代码实现置于章节末尾,作为可执行的工程示例(单文件完整实现,注释详尽,代码部分不含理论讲解)。原创 2025-11-21 08:51:35 · 32 阅读 · 0 评论 -
【图神经网络:原理与实战】第十二章 大规模 GNN 系统设计
本章系统阐述大规模图神经网络系统的数据处理、训练优化与工程实现。在数据预处理部分,提出包含一致性校验、去重等步骤的规范化流程,并给出特征工程的设计准则与防信息泄露的切分策略。分布式训练部分推导了数据/模型并行范式,证明了图分区的最优性条件,并给出检查点间隔的解析解。实现优化方面,分析了稀疏算子性能上界,提出GPU内存布局调整方案,建立量化训练误差模型,并设计动态批处理策略。工程保障环节构建了包含CI/CD流水线、漂移检测和差分隐私合规的完整运维体系,所有推导均以数学形式呈现,可直接作为系统实现的规范标准。原创 2025-11-20 21:27:59 · 47 阅读 · 0 评论 -
【图神经网络:原理与实战】第十章 可解释性与可证实性
法规/审计层:解释需满足可证据化和可追溯性(例如展示证据链、决策日志)。工程调试层:解释用于定位错误、发现偏差、指导特征工程。对实时性和可操作性要求高。用户交互层:解释需可被最终用户理解并驱动决策(易读性、最小信息量原则)。不同层的量化指标与方法优先级不同:审计层侧重可证实性与保存性;工程层侧重精度、局部性与可视化;用户层侧重可读性与交互性。输入: 模型 f, 输入 x, 初始掩码 m0 in [0,1]^d, 正则参数 λ1, λ2, 学习率 η, 迭代次数 T输出: 掩码 mm ← m0。原创 2025-11-20 19:57:37 · 31 阅读 · 0 评论 -
PirateNets: Physics-Informed Deep Learning with Residual Adaptive Networks
在你的编辑器中新建文件。把下面与之间的全部内容完整粘贴到该文件。。。BLOG.md(博客文章)、(预测图)、(损失曲线)。原创 2025-11-18 19:48:44 · 27 阅读 · 0 评论 -
贝叶斯物理约束极限学习机(BPIELM):原理与推导、复现
本文推导了贝叶斯物理约束极限学习机(BPIELM)的数学原理与实现方法。首先基于极限学习机(ELM)结构,通过线性化处理将物理约束整合到模型中(PIELM)。然后在输出层引入高斯先验,推导出输出权重的解析高斯后验分布、预测分布及边缘似然函数。针对非线性PDE问题,采用Gauss-Newton迭代策略进行线性化处理,实现了参数估计与不确定性量化。通过Burgers方程的数值实验验证了方法有效性,展示了参数估计、解预测及残差分析结果。该方法在线性化框架下提供了高效的解析解,适用于带有观测噪声的PDE正反问题求解原创 2025-11-18 17:51:19 · 46 阅读 · 0 评论 -
【无线电控制与数据链探测系统】第8章 被动雷达与联合感知(ISAC)
本文介绍了被动雷达及其与联合感知(ISAC)的结合应用。被动雷达利用第三方信号源(如广播、通信基站)进行目标探测,其系统包含机遇照明源、目标和被动接收机三部分。重点分析了使用通信信号(如OFDM、LTE)作为照明源的处理流程及优势,并探讨了ISAC中的资源分配问题及其在特定场景下的应用与限制。该技术为雷达探测提供了新的无源解决方案。原创 2025-11-08 15:08:53 · 65 阅读 · 0 评论 -
现代机器学习研究进展 第三部分 学习范式与训练技巧 第22章 少样本与元学习(Few-Shot & Meta-Learning)
未经版权所有者书面明确许可,任何单位或个人不得以任何形式(包括但不限于复印、转载、摘编、影印、扫描、改编、录入计算机检索系统、互联网传播、网络下载或以其他方式使用)复制、传播或改编本文的全部或任何部分。元学习分类:优化型(MAML)、度量型(ProtoNet、RelationNet)、模型式(meta-learner RNN 等)并给出严格推导。元学习是“在任务分布上学习适应”的双层优化问题;元学习的评测设计(任务分布设计、泛化问题、统计性检验)与理论样本复杂度直觉(任务数与样本数的 trade-off)原创 2025-11-07 17:17:41 · 35 阅读 · 0 评论 -
现代机器学习研究进展 第三部分 学习范式与训练技巧 第 21 章 表征学习的可迁移性(Transferability of Representations)
问题设定可迁移表征的两大核心要素信息性(informativeness):表示应保留对下游任务有判别力的信息。通用性 / 抽象性(genericity):表示不应过度包含仅对源任务相关的“噪声”或任务专属特征(task-specific nuisances)。我们下面用信息论工具与判别理论来量化这些要素。我们列出并详细推导若干常用指标,说明它们如何能(或不能)预测迁移性。如果下游任务与源标签接近(同域分类),监督预训练经常最优或足够好。若下游任务多样(分类/检索/检测),或。原创 2025-11-07 16:25:35 · 59 阅读 · 0 评论 -
现代机器学习研究进展 第三部分 学习范式与训练技巧 第20章 自监督学习:掩码建模与对比学习
对比学习通过 negatives 避免 collapse(所有样本被映射到常向量)。近年出现了 BYOL、SimSiam、VICReg 等无负样本方法;他们避免 collapse 的手段包括:BYOL:使用固定目标网络(momentum encoder)与 stop-gradient 技术;没有 explicit negatives,但通过 asymmetry(预测头 + stop-gradient)与动量目标避免 collapse。原创 2025-11-07 16:02:44 · 48 阅读 · 0 评论 -
现代机器学习研究进展 第三部分 学习范式与训练技巧 第19章 监督学习的工程实战
InfoNCE(基于许多 negatives)在样本效率上优于简单的对比对/三元组,且与互信息最大化有关。Triplet/hinge 直观且易组合 margin,但需要采样策略。温度 τ\tauτ 调节 softmax 的尖锐程度:小 τ\tauτ 强化 hard-negative 对模型的压力,过小会导致训练不稳定或学习率问题。原创 2025-11-07 15:38:29 · 29 阅读 · 0 评论 -
现代机器学习研究进展 第二部分 模型与架构 第18章:模块化与可插拔网络(Adapters / Control Heads / Conditioning Modules)
下面把常见构件写成统一记号并推导其输出、参数量与计算开销。原创 2025-11-07 13:45:01 · 41 阅读 · 0 评论 -
现代机器学习研究进展 第二部分 模型与架构 第17章:模型压缩与结构化稀疏 —— 原理推导
本章聚焦模型压缩的数学原理与证明:包括剪枝(结构化/非结构化)、蒸馏、量化(理论与近似误差)、低秩近似与张量分解(SVD、Tucker、Tensor-Train)、以及将这些方法与推理性能(延迟/能耗)联系起来的工程化成本模型与测量方法。原创 2025-11-07 13:12:56 · 257 阅读 · 0 评论 -
现代机器学习研究进展 第二部分 模型与架构 第 16 章:稀疏激活与大模型(Mixture-of-Experts, MoE)——理论、证明
如果训练过程中路由器把大多数 token 分配到极少数专家,会出现:部分设备过载(compute/VRAM bottleneck),其他设备空闲 → 训练效率低下。专家未被充分训练(长期 low-usage) → 模型容量浪费,且训练不稳定(expert collapse)。因此引入“辅助负载平衡损失”使专家使用频率更均匀。原创 2025-11-07 01:04:21 · 51 阅读 · 0 评论 -
现代机器学习研究进展 第二部分 模型与架构 第 15 章:隐变量模型(VAE、Flow、EBM)
VQ-VAE 不是标准变分框架下的直接 ELBO 最大化;它采用**近似离散化 + 直通估计(straight-through estimator)**以允许编码器获得梯度。严格化的解释:在将离散化视作具有噪声/近似的隐变量时,可把其视为对某个在分布空间上的 ELBO 的近似优化。更为谨慎的处理需构建明确的离散变分后验并用 Gumbel-Softmax 等连续松弛替代直通估计以获得严格的变分下界。这里列出工程实现时必须考虑的理论与数值问题,并给出对策。原创 2025-11-07 00:45:00 · 42 阅读 · 0 评论 -
现代机器学习研究进展 第二部分 模型与架构 第14章:生成对抗网络(GANs)
目录14.1 GAN 基础:Minimax、判别器与生成器架构14.1.1 GAN 基本思想14.1.2 Minimax 目标函数14.1.3 最优判别器14.1.4 生成器架构14.1.5 判别器架构14.2 稳定性问题:模式坍缩、训练震荡与谱约束14.2.1 模式坍缩 (Mode Collapse)14.2.2 训练震荡14.2.3 谱归一化 (Spectral Normalization, SN)14.3 损失函数与评价:WGAN、LSGAN 等14.3.1 LSGAN14.3.2 WGAN:Wass原创 2025-11-07 00:20:06 · 136 阅读 · 0 评论 -
现代机器学习研究进展 第二部分 模型与架构 第13章:能量模型(EBM)与 Score-based 表示 —— 原理、推导
的严格数学联系讲清楚,并给出可工程化的训练/采样范式、稳定性建议与伪代码。为了便于实现,推导尽量完整、逐步进行;需要的假设、边界项也会明确指出。、采样方法(Langevin、SGLD)以及与。原创 2025-11-06 23:51:18 · 39 阅读 · 0 评论
分享