- 博客(26)
- 收藏
- 关注
原创 从零开始搞懂 AI Agent
工作循环框架目标:人类给定的终点(如 “赢围棋”)。观察:感知当前环境(如 “棋盘棋子位置”)。行动:根据观察结果执行操作(如 “落子”)。循环:持续调整策略直至目标达成。案例:AlphaGo 通过 “扫描棋盘→计算落子→对手回应→再观察” 的循环实现自主对弈。
2025-05-17 11:43:26
744
原创 激活函数全解析:定义、分类与 17 种常用函数详解
限制激活范围,适合低精度设备(如移动端 float16/int8),避免数值溢出。:多分类任务输出层,将 logits 转化为概率(值域 [0,1],和为 1)。:Swish 的特例(β=1),平滑且非单调,PyTorch 中已内置。:x≥0 时线性输出,x<0 时恒为 0,导函数为 0 或 1。:ReLU 的平滑版本,输出非负,0 点可导,但计算量较大。:S 型曲线,值域 [0,1],导函数最大值 0.25。:S 型曲线,值域 [-1,1],关于原点对称。:λ 为固定超参数,可能影响模型灵活性。
2025-05-16 14:34:14
1349
原创 PyTorch 实战:从 0 开始搭建 Transformer
GCT 建议添加在 Conv 层前,一般可以先冻结原来的模型,来训练 GCT,然后解冻再进行微调。
2025-05-08 15:32:19
1527
1
原创 卷积神经网络(CNN)硬核解析,一文读懂!
卷积神经网络(CNN)是深度学习领域的重要模型,它是一类包含卷积计算且具有深度结构的前馈神经网络,灵感源自生物学上的感受野机制,专门用于处理具有网格结构的数据,像时间序列数据和图像数据。CNN 主要由卷积层、池化层和全连接层构成,各层相互协作,实现对数据的特征提取与分类。
2025-04-28 17:58:08
329
原创 探秘卷积神经网络:深度学习的图像识别利器
在深度学习领域,卷积神经网络(Convolutional Neural Networks,CNN)是图像识别任务的关键技术。它的起源可以追溯到 20 世纪 80 - 90 年代,但受限于当时的软硬件条件,其发展一度停滞。随着深度学习理论的不断突破和数值计算设备的飞速发展,CNN 得以蓬勃发展,在图像识别、目标检测等众多领域取得了卓越成就。
2025-04-26 17:58:11
811
原创 全面解析 UGC 平台物品冷启动策略
在 UGC 平台中,物品冷启动是新发布物品面临的关键问题。由于新物品缺乏用户交互数据,难以融入常规推荐流程,其曝光与精准推荐成为挑战。有效的冷启动策略不仅能提升用户体验,增强作者创作动力,还能挖掘潜在优质内容,对平台发展至关重要。下面将深入探讨 UGC 平台物品冷启动的优化目标、评价指标、召回通道、流量调控以及 AB 测试等关键内容。
2025-04-24 18:02:45
477
原创 推荐系统排序阶段核心要点:多目标排序模型详解
在推荐系统中,排序阶段分为粗排和精排,二者原理相似,粗排旨在快速筛选,减轻精排计算负担。本部分聚焦多目标排序模型,深入剖析其关键内容。
2025-04-23 17:44:13
263
原创 推荐系统召回层策略全解析:从协同过滤到多元召回
推荐系统召回层作为推荐系统的关键环节,承担着从海量物品中快速筛选出与用户潜在兴趣相关物品的重任。其策略丰富多样,每种策略都有独特的原理和应用场景。下面深入剖析各主要召回策略,助力理解推荐系统的核心运作机制。
2025-04-22 18:12:05
850
原创 一文读懂推荐系统:概念、链路与 A/B 测试
推荐系统在互联网产品中至关重要,以小红书为例,其涵盖用户行为分析、多种指标评估、复杂链路处理以及严谨的 A/B 测试环节,每个部分紧密协作,共同为用户提供个性化推荐服务。
2025-04-21 17:34:36
873
原创 PyTorch 实战:Transformer 模型搭建全解析
Transformer 作为一种强大的序列到序列模型,凭借自注意力机制在诸多领域大放异彩。它能并行处理序列,有效捕捉上下文关系,其架构包含编码器与解码器,各由多层组件构成,涉及自注意力、前馈神经网络、归一化和 Dropout 等关键环节。下面我们深入探讨其核心要点,并结合代码实现进行详细解读。
2025-04-21 17:30:09
1184
原创 Transformer 全解析:从序列模型到训练过程
在深度学习领域,Transformer 模型凭借其卓越性能,在自然语言处理、语音识别等众多领域取得显著成果。本文将围绕 Transformer 展开,深入剖析序列到序列模型的应用、Transformer 的结构以及训练过程,助力读者全面理解这一重要模型。
2025-04-21 17:26:32
373
原创 算法工程师(NLP / 搜索推荐 / 机器学习)面试核心要点
不同激活函数(如 Sigmoid、ReLU 等)各有优缺点,例如 Sigmoid 函数存在梯度消失问题,ReLU 函数则可能导致神经元死亡,但计算效率较高。其核心在于选择合适的划分特征和划分点,以最大化信息增益或最小化不纯度,常见的划分准则有信息增益、信息增益比、基尼指数等。相比于均方误差(MSE),交叉熵更易找到全局最优解,因为 MSE 可能存在多个局部最优解,训练效果受初始权值影响较大。因其仅关注样本排序效果,不受预测分数绝对值影响,且对正负样本采样不敏感,能更稳定地反映模型的优劣。
2025-04-19 17:15:11
1029
原创 人工智能面试知识要点汇总
深度学习是机器学习的重要分支,因其能从大量数据中获取有用信息而备受关注。近年来,数据量增长和硬件资源提升推动了深度学习的发展。它在多领域广泛应用,如语言翻译、语音识别、计算机视觉、医疗等。
2025-04-19 17:09:05
666
原创 深度学习核心算法体系综述
核心机制:典型应用:关键技术演进:核心机制:典型应用:关键模型改进:局限性与替代:核心机制:典型应用:关键变体:核心机制:典型应用:优势:核心机制:关键变体:典型应用:核心框架:经典算法:挑战:核心机制:基础模型:典型应用:核心机制:优势:代表工作:关键挑战:
2025-04-19 17:04:49
1109
原创 深度学习面试必知:图像算法核心要点
深度学习在图像算法领域应用广泛,相关知识是深度学习面试的重点。下面围绕神经网络、CNN、RNN 等关键内容,梳理核心知识点,为面试备考提供清晰指引。
2025-04-18 17:06:24
697
原创 机器学习核心知识全解析
避免过拟合的方法有提前结束训练、数据集扩增、正则化、Dropout、批量标准化、减小模型复杂度、Bagging、贝叶斯方法和决策树剪枝等。欠拟合则是模型复杂度低或数据集小,导致对数据拟合程度差,可通过增加样本数量和特征个数、扩展特征维度、减少正则化参数和使用集成学习方法改善。朴素贝叶斯分类效率稳定,适合小规模数据和多分类问题,对缺失数据不太敏感,但对输入数据表达形式敏感,当特征相关性较大时分类效果不佳。决策树优点是可读性好、效率高,缺点是易过拟合、对中间值缺失敏感、ID3 算法易偏向数值多的特征。
2025-04-18 17:05:33
677
原创 传统图像处理面试必备知识点汇总
在图像处理领域,掌握基础且核心的知识对于面试至关重要。下面将围绕传统图像处理中常见的面试问题进行详细总结,帮助大家深入理解相关概念。
2025-04-18 16:54:47
360
原创 YOLO 系列算法深度剖析:从 v3 到 v5 的演进
网络输出顺序改变,从小目标到大目标,增强了特征融合程度。小于阈值的为负样本。以 Yolov5s 为例,608×608×3 的图像经切片和卷积操作,变成 304×304×32 的特征图,实现多尺度特征融合,增大感受野,其功能与 YOLOv2 中的 Passthrough layer 类似。这是因为其扩充了预测框数量,增加了 grid cell 个数,采用多尺度预测(类似 FPN 结构),改进了损失函数(惩罚小框项),优化了网络结构(骨干网络与跨层连接),还使用了更合理的正负样本定义和标签方式。
2025-04-17 17:52:19
927
原创 YOLOv1 和 YOLOv2 面试要点梳理
每个 bounding box 需预测 x、y、w、h 四个位置参数(x、y 是中心点坐标,取值在 0 - 1 之间,w、h 可能大于 1)和位置置信度 confidence(0 或 1 乘以 IOU 值),每个网格还要预测 C 个类别的分数(预测目标对应类别分数为 1,否则为 0)。预测阶段,输入图像被划分为 7×7 网格,每个网格生成 2 个预测框,每个框包含 4 个位置参数和 1 个置信度参数,每个网格还预测一组条件类别概率。在 YOLOv1 出现前,目标检测领域主要有滑窗检测算法和区域检测算法。
2025-04-17 17:49:41
766
原创 目标检测算法超全解析:从传统方法到前沿技术
目标检测作为计算机视觉领域的核心任务,致力于识别图像或视频中的目标物体,并确定其位置。这一技术广泛应用于安防监控、自动驾驶、智能医疗等众多领域,是推动人工智能发展的关键力量。本文将全面梳理目标检测算法,涵盖传统方法与当下热门的深度学习算法,为你深入剖析其原理与应用。
2025-04-17 17:39:52
975
原创 深度学习:概念、问题与发展历程深度解读
深度学习尚无统一标准定义,通常被视作机器学习中人工神经网络的高级模型,是实现人工智能的重要手段。其发展历程可追溯至 20 世纪 50 年代,当时出现的感知机堪称人工神经网络的雏形。此后,人工神经网络研究在 60 年代蓬勃发展,但 1969 年《感知器》一书揭示了感知机的致命缺陷,致使 70 年代该领域陷入低谷,被众多学者冷落。到了 80 年代,随着误差反向传播算法的诞生,人工神经网络研究再度兴起。这一时期,深度神经网络(DNN)、循环神经网络(RNN)和卷积神经网络(CNN)等相继问世。
2025-04-16 17:21:38
520
原创 深度学习核心技术、算法模型及多元应用场景全解析
模型评估是确保模型质量的重要步骤,通过选择合适的评估指标,如准确率、召回率等,运用交叉验证等技术防止过拟合,并借助混淆矩阵、ROC 曲线等工具深入分析模型的性能。模型部署则是将训练好的模型应用到实际场景中,需要将模型转换为合适的格式,并选择匹配的硬件和软件平台,以满足性能和可扩展性的需求。生成对抗网络由生成器和判别器组成,通过两者的对抗训练,生成器可以生成逼真的数据样本,在图像生成、语音合成等领域有广泛应用,但训练过程较为复杂,容易出现不稳定和模式崩溃的情况。除了深度学习本身,该页面还涉及多种其他技术。
2025-04-15 18:09:49
717
原创 剖析深度学习优化算法中的超参数调优策略
深度学习作为机器学习的关键分支,近年来在多领域取得重大突破,极大地推动了人工智能的发展。以下将对深度学习的概念、研究现状、模型结构等方面进行深入剖析。
2025-04-15 18:05:57
600
原创 深度学习于自然语言处理中的情感分析技术
深度学习在当今科技领域占据着极为关键的地位,对众多行业的发展产生了深远影响。它作为机器学习的一个重要分支,通过构建多层神经网络来自动提取数据的高层次特征,让机器能够像人类一样对复杂数据进行学习和理解。接下来,将从深度学习的基础概念、发展历程、核心技术、应用场景以及未来挑战等多个方面进行详细剖析。
2025-04-15 18:01:32
437
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人