COOCC1-优快云博客

原创从零开始搞懂 AI Agent

工作循环框架目标：人类给定的终点（如 “赢围棋”）。观察：感知当前环境（如 “棋盘棋子位置”）。行动：根据观察结果执行操作（如 “落子”）。循环：持续调整策略直至目标达成。案例：AlphaGo 通过 “扫描棋盘→计算落子→对手回应→再观察” 的循环实现自主对弈。

2025-05-17 11:43:26 744

限制激活范围，适合低精度设备（如移动端 float16/int8），避免数值溢出。：多分类任务输出层，将 logits 转化为概率（值域 [0,1]，和为 1）。：Swish 的特例（β=1），平滑且非单调，PyTorch 中已内置。：x≥0 时线性输出，x<0 时恒为 0，导函数为 0 或 1。：ReLU 的平滑版本，输出非负，0 点可导，但计算量较大。：S 型曲线，值域 [0,1]，导函数最大值 0.25。：S 型曲线，值域 [-1,1]，关于原点对称。：λ 为固定超参数，可能影响模型灵活性。

2025-05-16 14:34:14 1349

原创 PyTorch 实战：从 0 开始搭建 Transformer

GCT 建议添加在 Conv 层前，一般可以先冻结原来的模型，来训练 GCT，然后解冻再进行微调。

2025-05-08 15:32:19 1527 1

原创卷积神经网络（CNN）硬核解析，一文读懂！

卷积神经网络（CNN）是深度学习领域的重要模型，它是一类包含卷积计算且具有深度结构的前馈神经网络，灵感源自生物学上的感受野机制，专门用于处理具有网格结构的数据，像时间序列数据和图像数据。CNN 主要由卷积层、池化层和全连接层构成，各层相互协作，实现对数据的特征提取与分类。

2025-04-28 17:58:08 329

原创探秘卷积神经网络：深度学习的图像识别利器

在深度学习领域，卷积神经网络（Convolutional Neural Networks，CNN）是图像识别任务的关键技术。它的起源可以追溯到 20 世纪 80 - 90 年代，但受限于当时的软硬件条件，其发展一度停滞。随着深度学习理论的不断突破和数值计算设备的飞速发展，CNN 得以蓬勃发展，在图像识别、目标检测等众多领域取得了卓越成就。

2025-04-26 17:58:11 811

原创全面解析 UGC 平台物品冷启动策略

在 UGC 平台中，物品冷启动是新发布物品面临的关键问题。由于新物品缺乏用户交互数据，难以融入常规推荐流程，其曝光与精准推荐成为挑战。有效的冷启动策略不仅能提升用户体验，增强作者创作动力，还能挖掘潜在优质内容，对平台发展至关重要。下面将深入探讨 UGC 平台物品冷启动的优化目标、评价指标、召回通道、流量调控以及 AB 测试等关键内容。

2025-04-24 18:02:45 477

原创推荐系统排序阶段核心要点：多目标排序模型详解

在推荐系统中，排序阶段分为粗排和精排，二者原理相似，粗排旨在快速筛选，减轻精排计算负担。本部分聚焦多目标排序模型，深入剖析其关键内容。

2025-04-23 17:44:13 263

原创推荐系统召回层策略全解析：从协同过滤到多元召回

推荐系统召回层作为推荐系统的关键环节，承担着从海量物品中快速筛选出与用户潜在兴趣相关物品的重任。其策略丰富多样，每种策略都有独特的原理和应用场景。下面深入剖析各主要召回策略，助力理解推荐系统的核心运作机制。

2025-04-22 18:12:05 850

原创一文读懂推荐系统：概念、链路与 A/B 测试

推荐系统在互联网产品中至关重要，以小红书为例，其涵盖用户行为分析、多种指标评估、复杂链路处理以及严谨的 A/B 测试环节，每个部分紧密协作，共同为用户提供个性化推荐服务。

2025-04-21 17:34:36 873

原创 PyTorch 实战：Transformer 模型搭建全解析

Transformer 作为一种强大的序列到序列模型，凭借自注意力机制在诸多领域大放异彩。它能并行处理序列，有效捕捉上下文关系，其架构包含编码器与解码器，各由多层组件构成，涉及自注意力、前馈神经网络、归一化和 Dropout 等关键环节。下面我们深入探讨其核心要点，并结合代码实现进行详细解读。

2025-04-21 17:30:09 1184

原创 Transformer 全解析：从序列模型到训练过程

在深度学习领域，Transformer 模型凭借其卓越性能，在自然语言处理、语音识别等众多领域取得显著成果。本文将围绕 Transformer 展开，深入剖析序列到序列模型的应用、Transformer 的结构以及训练过程，助力读者全面理解这一重要模型。

2025-04-21 17:26:32 373

原创算法工程师（NLP / 搜索推荐 / 机器学习）面试核心要点

不同激活函数（如 Sigmoid、ReLU 等）各有优缺点，例如 Sigmoid 函数存在梯度消失问题，ReLU 函数则可能导致神经元死亡，但计算效率较高。其核心在于选择合适的划分特征和划分点，以最大化信息增益或最小化不纯度，常见的划分准则有信息增益、信息增益比、基尼指数等。相比于均方误差（MSE），交叉熵更易找到全局最优解，因为 MSE 可能存在多个局部最优解，训练效果受初始权值影响较大。因其仅关注样本排序效果，不受预测分数绝对值影响，且对正负样本采样不敏感，能更稳定地反映模型的优劣。

2025-04-19 17:15:11 1029

原创人工智能面试知识要点汇总

深度学习是机器学习的重要分支，因其能从大量数据中获取有用信息而备受关注。近年来，数据量增长和硬件资源提升推动了深度学习的发展。它在多领域广泛应用，如语言翻译、语音识别、计算机视觉、医疗等。

2025-04-19 17:09:05 666

原创深度学习核心算法体系综述

核心机制：典型应用：关键技术演进：核心机制：典型应用：关键模型改进：局限性与替代：核心机制：典型应用：关键变体：核心机制：典型应用：优势：核心机制：关键变体：典型应用：核心框架：经典算法：挑战：核心机制：基础模型：典型应用：核心机制：优势：代表工作：关键挑战：

2025-04-19 17:04:49 1109

原创深度学习面试必知：图像算法核心要点

深度学习在图像算法领域应用广泛，相关知识是深度学习面试的重点。下面围绕神经网络、CNN、RNN 等关键内容，梳理核心知识点，为面试备考提供清晰指引。

2025-04-18 17:06:24 697

原创机器学习核心知识全解析

避免过拟合的方法有提前结束训练、数据集扩增、正则化、Dropout、批量标准化、减小模型复杂度、Bagging、贝叶斯方法和决策树剪枝等。欠拟合则是模型复杂度低或数据集小，导致对数据拟合程度差，可通过增加样本数量和特征个数、扩展特征维度、减少正则化参数和使用集成学习方法改善。朴素贝叶斯分类效率稳定，适合小规模数据和多分类问题，对缺失数据不太敏感，但对输入数据表达形式敏感，当特征相关性较大时分类效果不佳。决策树优点是可读性好、效率高，缺点是易过拟合、对中间值缺失敏感、ID3 算法易偏向数值多的特征。

2025-04-18 17:05:33 677

原创传统图像处理面试必备知识点汇总

在图像处理领域，掌握基础且核心的知识对于面试至关重要。下面将围绕传统图像处理中常见的面试问题进行详细总结，帮助大家深入理解相关概念。

2025-04-18 16:54:47 360

原创 YOLO 系列算法深度剖析：从 v3 到 v5 的演进

网络输出顺序改变，从小目标到大目标，增强了特征融合程度。小于阈值的为负样本。以 Yolov5s 为例，608×608×3 的图像经切片和卷积操作，变成 304×304×32 的特征图，实现多尺度特征融合，增大感受野，其功能与 YOLOv2 中的 Passthrough layer 类似。这是因为其扩充了预测框数量，增加了 grid cell 个数，采用多尺度预测（类似 FPN 结构），改进了损失函数（惩罚小框项），优化了网络结构（骨干网络与跨层连接），还使用了更合理的正负样本定义和标签方式。

2025-04-17 17:52:19 927

原创 YOLOv1 和 YOLOv2 面试要点梳理

每个 bounding box 需预测 x、y、w、h 四个位置参数（x、y 是中心点坐标，取值在 0 - 1 之间，w、h 可能大于 1）和位置置信度 confidence（0 或 1 乘以 IOU 值），每个网格还要预测 C 个类别的分数（预测目标对应类别分数为 1，否则为 0）。预测阶段，输入图像被划分为 7×7 网格，每个网格生成 2 个预测框，每个框包含 4 个位置参数和 1 个置信度参数，每个网格还预测一组条件类别概率。在 YOLOv1 出现前，目标检测领域主要有滑窗检测算法和区域检测算法。

2025-04-17 17:49:41 766

原创目标检测算法超全解析：从传统方法到前沿技术

目标检测作为计算机视觉领域的核心任务，致力于识别图像或视频中的目标物体，并确定其位置。这一技术广泛应用于安防监控、自动驾驶、智能医疗等众多领域，是推动人工智能发展的关键力量。本文将全面梳理目标检测算法，涵盖传统方法与当下热门的深度学习算法，为你深入剖析其原理与应用。

2025-04-17 17:39:52 975

原创深度学习数据增强全攻略：从基础操作到猫狗训练实战

【代码】深度学习数据增强全攻略：从基础操作到猫狗训练实战。

2025-04-16 17:36:49 337

原创深度学习：概念、问题与发展历程深度解读

深度学习尚无统一标准定义，通常被视作机器学习中人工神经网络的高级模型，是实现人工智能的重要手段。其发展历程可追溯至 20 世纪 50 年代，当时出现的感知机堪称人工神经网络的雏形。此后，人工神经网络研究在 60 年代蓬勃发展，但 1969 年《感知器》一书揭示了感知机的致命缺陷，致使 70 年代该领域陷入低谷，被众多学者冷落。到了 80 年代，随着误差反向传播算法的诞生，人工神经网络研究再度兴起。这一时期，深度神经网络（DNN）、循环神经网络（RNN）和卷积神经网络（CNN）等相继问世。

2025-04-16 17:21:38 520

原创掌握这十大经典算法，玩转机器学习不再难

2025-04-16 17:13:43 246

原创深度学习核心技术、算法模型及多元应用场景全解析

模型评估是确保模型质量的重要步骤，通过选择合适的评估指标，如准确率、召回率等，运用交叉验证等技术防止过拟合，并借助混淆矩阵、ROC 曲线等工具深入分析模型的性能。模型部署则是将训练好的模型应用到实际场景中，需要将模型转换为合适的格式，并选择匹配的硬件和软件平台，以满足性能和可扩展性的需求。生成对抗网络由生成器和判别器组成，通过两者的对抗训练，生成器可以生成逼真的数据样本，在图像生成、语音合成等领域有广泛应用，但训练过程较为复杂，容易出现不稳定和模式崩溃的情况。除了深度学习本身，该页面还涉及多种其他技术。

2025-04-15 18:09:49 717