自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 从零开始搞懂 AI Agent

工作循环框架目标:人类给定的终点(如 “赢围棋”)。观察:感知当前环境(如 “棋盘棋子位置”)。行动:根据观察结果执行操作(如 “落子”)。循环:持续调整策略直至目标达成。案例:AlphaGo 通过 “扫描棋盘→计算落子→对手回应→再观察” 的循环实现自主对弈。

2025-05-17 11:43:26 744

原创 激活函数全解析:定义、分类与 17 种常用函数详解

限制激活范围,适合低精度设备(如移动端 float16/int8),避免数值溢出。:多分类任务输出层,将 logits 转化为概率(值域 [0,1],和为 1)。:Swish 的特例(β=1),平滑且非单调,PyTorch 中已内置。:x≥0 时线性输出,x<0 时恒为 0,导函数为 0 或 1。:ReLU 的平滑版本,输出非负,0 点可导,但计算量较大。:S 型曲线,值域 [0,1],导函数最大值 0.25。:S 型曲线,值域 [-1,1],关于原点对称。:λ 为固定超参数,可能影响模型灵活性。

2025-05-16 14:34:14 1349

原创 PyTorch 实战:从 0 开始搭建 Transformer

GCT 建议添加在 Conv 层前,一般可以先冻结原来的模型,来训练 GCT,然后解冻再进行微调。

2025-05-08 15:32:19 1527 1

原创 卷积神经网络(CNN)硬核解析,一文读懂!

卷积神经网络(CNN)是深度学习领域的重要模型,它是一类包含卷积计算且具有深度结构的前馈神经网络,灵感源自生物学上的感受野机制,专门用于处理具有网格结构的数据,像时间序列数据和图像数据。CNN 主要由卷积层、池化层和全连接层构成,各层相互协作,实现对数据的特征提取与分类。

2025-04-28 17:58:08 329

原创 探秘卷积神经网络:深度学习的图像识别利器

在深度学习领域,卷积神经网络(Convolutional Neural Networks,CNN)是图像识别任务的关键技术。它的起源可以追溯到 20 世纪 80 - 90 年代,但受限于当时的软硬件条件,其发展一度停滞。随着深度学习理论的不断突破和数值计算设备的飞速发展,CNN 得以蓬勃发展,在图像识别、目标检测等众多领域取得了卓越成就。

2025-04-26 17:58:11 811

原创 全面解析 UGC 平台物品冷启动策略

在 UGC 平台中,物品冷启动是新发布物品面临的关键问题。由于新物品缺乏用户交互数据,难以融入常规推荐流程,其曝光与精准推荐成为挑战。有效的冷启动策略不仅能提升用户体验,增强作者创作动力,还能挖掘潜在优质内容,对平台发展至关重要。下面将深入探讨 UGC 平台物品冷启动的优化目标、评价指标、召回通道、流量调控以及 AB 测试等关键内容。

2025-04-24 18:02:45 477

原创 推荐系统排序阶段核心要点:多目标排序模型详解

在推荐系统中,排序阶段分为粗排和精排,二者原理相似,粗排旨在快速筛选,减轻精排计算负担。本部分聚焦多目标排序模型,深入剖析其关键内容。

2025-04-23 17:44:13 263

原创 推荐系统召回层策略全解析:从协同过滤到多元召回

推荐系统召回层作为推荐系统的关键环节,承担着从海量物品中快速筛选出与用户潜在兴趣相关物品的重任。其策略丰富多样,每种策略都有独特的原理和应用场景。下面深入剖析各主要召回策略,助力理解推荐系统的核心运作机制。

2025-04-22 18:12:05 850

原创 一文读懂推荐系统:概念、链路与 A/B 测试

推荐系统在互联网产品中至关重要,以小红书为例,其涵盖用户行为分析、多种指标评估、复杂链路处理以及严谨的 A/B 测试环节,每个部分紧密协作,共同为用户提供个性化推荐服务。

2025-04-21 17:34:36 873

原创 PyTorch 实战:Transformer 模型搭建全解析

Transformer 作为一种强大的序列到序列模型,凭借自注意力机制在诸多领域大放异彩。它能并行处理序列,有效捕捉上下文关系,其架构包含编码器与解码器,各由多层组件构成,涉及自注意力、前馈神经网络、归一化和 Dropout 等关键环节。下面我们深入探讨其核心要点,并结合代码实现进行详细解读。

2025-04-21 17:30:09 1184

原创 Transformer 全解析:从序列模型到训练过程

在深度学习领域,Transformer 模型凭借其卓越性能,在自然语言处理、语音识别等众多领域取得显著成果。本文将围绕 Transformer 展开,深入剖析序列到序列模型的应用、Transformer 的结构以及训练过程,助力读者全面理解这一重要模型。

2025-04-21 17:26:32 373

原创 算法工程师(NLP / 搜索推荐 / 机器学习)面试核心要点

不同激活函数(如 Sigmoid、ReLU 等)各有优缺点,例如 Sigmoid 函数存在梯度消失问题,ReLU 函数则可能导致神经元死亡,但计算效率较高。其核心在于选择合适的划分特征和划分点,以最大化信息增益或最小化不纯度,常见的划分准则有信息增益、信息增益比、基尼指数等。相比于均方误差(MSE),交叉熵更易找到全局最优解,因为 MSE 可能存在多个局部最优解,训练效果受初始权值影响较大。因其仅关注样本排序效果,不受预测分数绝对值影响,且对正负样本采样不敏感,能更稳定地反映模型的优劣。

2025-04-19 17:15:11 1029

原创 人工智能面试知识要点汇总

深度学习是机器学习的重要分支,因其能从大量数据中获取有用信息而备受关注。近年来,数据量增长和硬件资源提升推动了深度学习的发展。它在多领域广泛应用,如语言翻译、语音识别、计算机视觉、医疗等。

2025-04-19 17:09:05 666

原创 深度学习核心算法体系综述

核心机制:典型应用:关键技术演进:核心机制:典型应用:关键模型改进:局限性与替代:核心机制:典型应用:关键变体:核心机制:典型应用:优势:核心机制:关键变体:典型应用:核心框架:经典算法:挑战:核心机制:基础模型:典型应用:核心机制:优势:代表工作:关键挑战:

2025-04-19 17:04:49 1109

原创 深度学习面试必知:图像算法核心要点

深度学习在图像算法领域应用广泛,相关知识是深度学习面试的重点。下面围绕神经网络、CNN、RNN 等关键内容,梳理核心知识点,为面试备考提供清晰指引。

2025-04-18 17:06:24 697

原创 机器学习核心知识全解析

避免过拟合的方法有提前结束训练、数据集扩增、正则化、Dropout、批量标准化、减小模型复杂度、Bagging、贝叶斯方法和决策树剪枝等。欠拟合则是模型复杂度低或数据集小,导致对数据拟合程度差,可通过增加样本数量和特征个数、扩展特征维度、减少正则化参数和使用集成学习方法改善。朴素贝叶斯分类效率稳定,适合小规模数据和多分类问题,对缺失数据不太敏感,但对输入数据表达形式敏感,当特征相关性较大时分类效果不佳。决策树优点是可读性好、效率高,缺点是易过拟合、对中间值缺失敏感、ID3 算法易偏向数值多的特征。

2025-04-18 17:05:33 677

原创 传统图像处理面试必备知识点汇总

在图像处理领域,掌握基础且核心的知识对于面试至关重要。下面将围绕传统图像处理中常见的面试问题进行详细总结,帮助大家深入理解相关概念。

2025-04-18 16:54:47 360

原创 YOLO 系列算法深度剖析:从 v3 到 v5 的演进

网络输出顺序改变,从小目标到大目标,增强了特征融合程度。小于阈值的为负样本。以 Yolov5s 为例,608×608×3 的图像经切片和卷积操作,变成 304×304×32 的特征图,实现多尺度特征融合,增大感受野,其功能与 YOLOv2 中的 Passthrough layer 类似。这是因为其扩充了预测框数量,增加了 grid cell 个数,采用多尺度预测(类似 FPN 结构),改进了损失函数(惩罚小框项),优化了网络结构(骨干网络与跨层连接),还使用了更合理的正负样本定义和标签方式。

2025-04-17 17:52:19 927

原创 YOLOv1 和 YOLOv2 面试要点梳理

每个 bounding box 需预测 x、y、w、h 四个位置参数(x、y 是中心点坐标,取值在 0 - 1 之间,w、h 可能大于 1)和位置置信度 confidence(0 或 1 乘以 IOU 值),每个网格还要预测 C 个类别的分数(预测目标对应类别分数为 1,否则为 0)。预测阶段,输入图像被划分为 7×7 网格,每个网格生成 2 个预测框,每个框包含 4 个位置参数和 1 个置信度参数,每个网格还预测一组条件类别概率。在 YOLOv1 出现前,目标检测领域主要有滑窗检测算法和区域检测算法。

2025-04-17 17:49:41 766

原创 目标检测算法超全解析:从传统方法到前沿技术

目标检测作为计算机视觉领域的核心任务,致力于识别图像或视频中的目标物体,并确定其位置。这一技术广泛应用于安防监控、自动驾驶、智能医疗等众多领域,是推动人工智能发展的关键力量。本文将全面梳理目标检测算法,涵盖传统方法与当下热门的深度学习算法,为你深入剖析其原理与应用。

2025-04-17 17:39:52 975

原创 深度学习数据增强全攻略:从基础操作到猫狗训练实战

【代码】深度学习数据增强全攻略:从基础操作到猫狗训练实战。

2025-04-16 17:36:49 337

原创 深度学习:概念、问题与发展历程深度解读

深度学习尚无统一标准定义,通常被视作机器学习中人工神经网络的高级模型,是实现人工智能的重要手段。其发展历程可追溯至 20 世纪 50 年代,当时出现的感知机堪称人工神经网络的雏形。此后,人工神经网络研究在 60 年代蓬勃发展,但 1969 年《感知器》一书揭示了感知机的致命缺陷,致使 70 年代该领域陷入低谷,被众多学者冷落。到了 80 年代,随着误差反向传播算法的诞生,人工神经网络研究再度兴起。这一时期,深度神经网络(DNN)、循环神经网络(RNN)和卷积神经网络(CNN)等相继问世。

2025-04-16 17:21:38 520

原创 掌握这十大经典算法,玩转机器学习不再难

2025-04-16 17:13:43 246

原创 深度学习核心技术、算法模型及多元应用场景全解析

模型评估是确保模型质量的重要步骤,通过选择合适的评估指标,如准确率、召回率等,运用交叉验证等技术防止过拟合,并借助混淆矩阵、ROC 曲线等工具深入分析模型的性能。模型部署则是将训练好的模型应用到实际场景中,需要将模型转换为合适的格式,并选择匹配的硬件和软件平台,以满足性能和可扩展性的需求。生成对抗网络由生成器和判别器组成,通过两者的对抗训练,生成器可以生成逼真的数据样本,在图像生成、语音合成等领域有广泛应用,但训练过程较为复杂,容易出现不稳定和模式崩溃的情况。除了深度学习本身,该页面还涉及多种其他技术。

2025-04-15 18:09:49 717

原创 剖析深度学习优化算法中的超参数调优策略

深度学习作为机器学习的关键分支,近年来在多领域取得重大突破,极大地推动了人工智能的发展。以下将对深度学习的概念、研究现状、模型结构等方面进行深入剖析。

2025-04-15 18:05:57 600

原创 深度学习于自然语言处理中的情感分析技术

深度学习在当今科技领域占据着极为关键的地位,对众多行业的发展产生了深远影响。它作为机器学习的一个重要分支,通过构建多层神经网络来自动提取数据的高层次特征,让机器能够像人类一样对复杂数据进行学习和理解。接下来,将从深度学习的基础概念、发展历程、核心技术、应用场景以及未来挑战等多个方面进行详细剖析。

2025-04-15 18:01:32 437 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除