巴伦是只猫-优快云博客

原创分布式事务解决方案——Seata

在实际应用中，可以根据业务特点组合使用这些模式，例如支付核心用TCC，周边业务用AT或Saga。根据undo_log生成反向SQL。根据undo_log生成反向SQL。执行SQL1(XA START)执行SQL2(XA START)执行SQL1(携带XID)执行SQL2(携带XID)异步删除undo_log。异步删除undo_log。执行成功(XA END)执行成功(XA END)服务A Confirm。服务B Confirm。写入undo_log。写入undo_log。服务A Cancel。

2025-08-05 14:39:05 767

原创模型训练部署流程

”立即回滚至前一版本，同时排查：1. 输入数据分布变化 2. 特征管道故障 3. 外部依赖变更（如Embedding服务）”：”Model Registry管理生产模型版本，Git触发CI/CD：代码更新→自动化测试→Canary发布”：”基于吞吐量要求：CPU处理<100QPS轻量模型；GPU用于高并发或大模型（>50ms推理）”：采用LightGBM+特征缓存+Go语言API。：CTR预估模型部署延迟<50ms。：怎样选择CPU/GPU部署？：如何处理线上模型性能下降？：模型版本管理怎么做？

2025-07-26 17:08:48 935

原创 spring Could 高频面试题

【代码】spring Could 高频面试题。

2025-07-26 17:01:57 989

原创 Java 高频算法

以下是Java面试中常见的高频算法题目，涵盖了数据结构、算法思想和实际应用场景。

2025-07-23 11:37:39 431

原创线性回归 - 似然函数

在线性回归中，使用似然函数、求导以及追求极值（最小化或最大化）是统计学和优化理论的核心思想。

2025-07-22 16:04:39 376

原创分类模型（BERT）训练全流程

BERT (Bidirectional Encoder Representations from Transformers) 是一种强大的预训练语言模型，在各种NLP任务中表现出色。下面我将详细梳理使用BERT实现文本分类模型的完整训练过程。1.2 选择BERT版本BERT-base (110M参数)BERT-large (340M参数)中文BERT (如bert-base-chinese)领域特定BERT (如BioBERT, SciBERT)2. 数据准备2.1 数据格式2.2 数

2025-07-22 13:24:10 1090

原创模型使用流程

模型从开发到实际生产环境中的落地使用是一个系统工程，涉及多个关键环节。

2025-07-22 10:13:45 653

原创【深度学习笔记 Ⅱ】11 学习率衰减

学习率衰减（Learning Rate Decay）是优化深度学习模型的重要技术，它通过在训练过程中逐渐降低学习率来提高模型性能。

2025-07-21 16:34:21 536

原创【深度学习笔记 Ⅱ】10 Adam优化算法

RMSprop（Root Mean Square Propagation）是由Geoffrey Hinton提出的一种自适应学习率优化算法，是梯度下降法的改进版本。它通过调整每个参数的学习率来解决传统梯度下降中学习率单一的问题。RMSprop是一种非常有效的优化算法，特别适合处理非平稳目标和递归神经网络中的优化问题。它通常比标准SGD表现更好，且计算开销不大，是深度学习中的常用优化器之一。

2025-07-21 15:58:30 1400

原创【深度学习笔记 Ⅱ】9 动量梯度下降法 &RMSprop

动量梯度下降法（Momentum）是一种改进的梯度下降优化算法，它通过引入"动量"的概念来加速收敛并减少震荡。积累历史梯度：在更新参数时不仅考虑当前梯度，还考虑之前梯度的加权平均模拟物理动量：类似于小球滚下山坡时积累的动量，帮助越过局部极小值和鞍点。

2025-07-21 14:21:23 612

原创【深度学习笔记 Ⅰ】6 He initialization

相比零初始化、普通随机初始化和 Xavier 初始化，它在 ReLU 网络中表现最优，是现代深度学习模型（如 CNN、ResNet）的标配初始化方法。He 初始化通过调整方差（( \sqrt{2/n^{[l-1]}} )），使得 ReLU 的输入分布更合理，减少神经元死亡的概率。本文将从 He 初始化的原理出发，分析其相对于零初始化（Zeros）、随机初始化（Random）和 Xavier 初始化的优势，并探讨为何它在深层神经网络中表现更优。通过调整方差，使各层的输出保持合理的范围，避免梯度不稳定问题。

2025-07-19 16:14:15 708

原创【深度学习笔记 Ⅱ】8 mini-batch 梯度下降法

每次迭代使用**一小批样本（Batch）**计算梯度（平衡Batch GD和SGD）。通过合理配置Mini-batch训练，可高效利用计算资源并加速模型收敛。是其最常用的变体，兼顾了计算效率和收敛稳定性。：需手动调整Batch Size。（(m) 为Batch Size）是最基础的优化算法，而。

2025-07-19 13:02:03 850

原创【深度学习笔记 Ⅰ】5 参数和超参数

是模型训练中两个核心概念，它们共同决定了模型的性能，但作用方式和优化方法截然不同。理解二者的差异与协作方式，是高效训练深度学习模型的基础。

2025-07-19 11:45:11 867

原创【深度学习笔记 Ⅰ】4 前向传播和反向传播

是神经网络训练的核心机制，分别负责计算预测输出和更新模型参数。通过链式法则计算损失函数对每个参数的梯度，从输出层反向传播至输入层。数据从输入层经过隐藏层逐层计算，最终得到输出层预测值的过程。理解这两大过程是调试模型、设计架构的基础。

2025-07-19 11:41:55 519

原创【深度学习笔记 Ⅱ】7 梯度数值逼近&双边梯度检验

双边梯度检验（Two-sided Gradient Checking）**是验证反向传播实现正确性的重要技术，尤其在自定义层或复杂损失函数时至关重要。梯度表示损失函数 (J(\theta)) 对参数 (\theta) 的敏感度。在深度学习中，**梯度数值逼近（Numerical Gradient Approximation）通过梯度检验，能有效避免反向传播的隐蔽错误，确保模型训练的理论正确性。对每个参数 (\theta_i) 进行双边差分，得到。用于验证反向传播计算的梯度。通过反向传播得到梯度值。

2025-07-19 11:28:57 937

原创【深度学习笔记 Ⅱ】6 权重初始化

是模型训练的关键步骤，直接影响梯度流动、收敛速度和最终性能。不合理的初始化可能导致梯度消失/爆炸或模型陷入局部最优。He初始化通过调整方差（(\sqrt{2/n_{\text{in}}})）补偿ReLU的“死区”效应。初始化应使各层输出的方差近似相等，避免深层网络梯度不稳定。通过合理初始化，模型能更快收敛并避免早期训练失败。（适用于Sigmoid/Tanh）（适用于ReLU及其变种）

2025-07-19 11:21:05 629

原创【深度学习笔记 Ⅱ】5 梯度消失和梯度爆炸

梯度爆炸（Exploding Gradients）**是训练深层神经网络时的两大常见问题，它们与反向传播中的梯度计算直接相关。反向传播通过链式法则计算梯度。在深度学习中，**梯度消失（Vanishing Gradients）

2025-07-19 11:18:02 1384

原创【深度学习笔记 Ⅱ】4 归一化输入

是数据预处理的关键步骤，旨在加速模型训练、提高稳定性并改善泛化性能。调整到相似的数值范围（如均值为0，方差为1），消除不同特征之间的量纲差异。通过合理归一化，模型能更快收敛并避免不必要的数值问题。，因其对异常值鲁棒性更强。归一化是指将输入数据。

2025-07-19 10:57:38 620

原创【深度学习笔记 Ⅱ】3 正则化&Dropout

是两种关键的技术，用于防止模型过拟合（Overfitting）并提升泛化能力。正则化是通过在损失函数中添加额外的约束（惩罚项），限制模型参数的大小，从而防止模型过度拟合训练数据。Dropout 是一种。

2025-07-19 10:54:08 1187 1

原创【深度学习笔记 Ⅱ】2 方差偏差

偏差：模型是否足够强大以学习数据规律。方差：模型是否过度依赖训练数据的特定噪声。关键：通过模型设计、数据扩充和正则化技术，在二者之间取得平衡，实现最优泛化性能。

2025-07-19 10:48:54 1112

原创【深度学习笔记 Ⅱ】1 数据集的划分

在深度学习中，**训练集（Training Set）、验证集（Validation Set）和测试集（Test Set）交叉验证（Cross-Validation）**是一种更鲁棒的评估方法。

2025-07-19 10:44:52 692

原创【深度学习笔记 Ⅰ】3 step by step （jupyter）

【代码】【深度学习笔记】3 step by step （jupyter）

2025-07-16 11:08:18 469

原创【深度学习笔记 Ⅰ】2 浅层神经网络

的神经网络，是深度学习发展早期的经典结构。与之相对的是“深层神经网络”（Deep Neural Network，DNN），后者通常包含多个隐藏层（如10层、100层甚至更多）。浅层网络适合简单任务或计算资源受限的场景，而深层网络在复杂任务（如计算机视觉、自然语言处理）中表现更优。：输入层 → 1个隐藏层 → 输出层。：仅输入层直接连接输出层（本质是。

2025-07-14 17:08:14 611

原创【深度学习笔记 Ⅰ】1 Deep Learning

开始进行深度学习笔记自用欢迎大家一起学习讨论

2025-07-12 11:36:05 451

原创【机器学习笔记 Ⅲ】5 强化学习

是机器学习的一个分支，其核心思想是让智能体（Agent）通过与环境（Environment）的交互学习最优策略（Policy），以最大化长期累积奖励（Reward）。它模拟了人类或动物通过“试错”进行学习的过程，广泛应用于游戏AI、自动驾驶、机器人控制、推荐系统等领域。尽管面临样本效率、稳定性等挑战，但结合深度学习后，在复杂任务（如游戏、机器人）中展现了强大潜力。其中 ( \gamma )（折扣因子，0 ≤ γ ≤ 1）权衡当前奖励与未来奖励的重要性。智能体的目标是学习一个策略 ( \pi )，最大化。

2025-07-08 17:23:37 813

空空如也

企业微信 分片拉取多媒体数据 第二个512k报错10000

企业微信分片拉取多媒体数据第二个512k报错10000