自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 【LangChain使用概述】

LangChain是由哈佛大学Harrison Chase于2022年10月开发的开源框架,专注于大语言模型(LLM)驱动的应用开发。其核心功能是连接LLM、外部数据与工具,支持智能体、问答系统等应用搭建,并集成主流LLM如GPT、Claude。LangChain生态包含核心组件(Chains、Agents)、第三方集成(langchain-community)、基础抽象层(langchain-core),以及进阶工具LangGraph(多组件协作)和LangSmith(生产级运维)

2025-12-31 12:03:26 688

原创 【EM算法】

EM算法是一种迭代优化方法,用于估计含有隐变量的概率模型参数。其核心思想是通过交替进行E步(期望步)和M步(最大化步)来逼近最大似然估计。E步基于当前参数计算隐变量的后验概率;M步利用这些概率重新估计参数,使对数似然函数的下界最大化。通过反复迭代,参数逐渐收敛到最优解。EM算法广泛应用于聚类分析、缺失数据处理等场景,因其简单稳定而受到青睐。

2025-10-23 17:45:00 3328

原创 手撕Transformer(一):注意力机制与位置编码

本文介绍Transformer相关知识,其因2018年Google的BERT模型受关注,核心优势在于支持分布式GPU并行训练及擅长捕捉长文本语义关联。Transformer架构含输入、输出、编码器、解码器部分,输入含文本嵌入层与位置编码器以处理词汇表示和位置信息。编码器由多头自注意力等子层构成,掩码张量(padding-mask和look-ahead mask)用于遮掩无效字符和未来信息,注意力机制及多头注意力机制是其核心计算组件。

2025-09-15 16:17:08 1036 4

原创 AI 突进 70 年:从诞生到 GPT-5

本文梳理人工智能 70年 发展脉络:1956年达特茅斯会议正式提出“人工智能”概念,开启探索之路。从早期基于规则的系统、统计机器学习,到2012年AlexNet推动深度学习崛起,再到2017年Transformer架构革新、AlphaGo引爆关注。2022年ChatGPT 开启大模型时代,GPT-3.5、GPT-4等持续迭代,2025年GPT-5 引入通用智能。同时涵盖技术分支(NLP、CV等)及主流大模型发展,展现 AI从诞生到智能爆发的演进历程。

2025-08-19 11:30:00 2096 1

原创 数据结构(一):算法的时间复杂度和空间复杂度

🔍 算法效率分析指南:时间复杂度与空间复杂度详解 本文系统讲解了算法效率评估的核心指标: 1️⃣ 时间复杂度 使用大O渐进法分析基本操作执行次数 常见复杂度:O(1)<O(logN)<O(N)<O(N²)<O(2^N) 重点案例:斐波那契递归O(2^N) vs 二分查找O(logN) 2️⃣ 空间复杂度 关注算法运行时的动态内存占用 递归算法需特别注意栈空间消耗 典型示例:冒泡排序O(1) vs 递归阶乘O(N) 💡 关键结论:现代开发中更关注时间复杂度优化,但递归算法等场景仍需警惕空间消耗。

2025-10-28 12:00:00 2147

原创 C语言初阶——手把手教零基础/新手入门

本文为C语言初学者提供了一站式的入门指南,涵盖了C语言的基础知识、开发环境搭建、核心语法等内容,帮助读者快速掌握C语言编程。

2025-09-28 12:36:22 1790

原创 从0到1——手搓【Transformer】底层代码

Transformer是NLP领域的革命性架构,核心包含位置编码(用正余弦函数注入位置信息)、多头自注意力(多子空间捕捉序列关联)、编码器层(注意力+前馈网络+残差与层归一化)等模块,可有效捕捉序列长距离依赖。文中还结合IMDB情感分析实战,从词表构建、数据集预处理(`Dataset`/`DataLoader`),到模型超参数设置、损失函数与优化器选择,再到训练与测试循环,完整展示了基于Transformer的文本分类全流程,助力读者掌握其原理与应用。

2025-09-20 09:39:33 1804 2

原创 【Transformer】 一招搞定IMDB评论数据集的情感分析

本文基于 Hugging Face 平台与 Transformer 模型,开展 IMDB 电影评论情感二分类任务。先介绍 Hugging Face 生态与 IMDB 数据集获取;再进行数据预处理(分词、构建词表等),并自定义 Dataset 和 DataLoader 实现数据加载;随后搭建含位置编码。

2025-09-19 12:59:57 1033 1

原创 【Pytorch】2025 Pytorch基础入门教程(完整详细版)

PyTorch张量操作指南摘要: 本文介绍了PyTorch核心张量操作,包含三部分内容:1)张量创建方法,包括torch.tensor、指定类型张量和随机/线性张量生成;2)特殊张量创建,如全0/1张量和指定填充值张量;3)随机数原理,解释了伪随机数特性及种子设置的重要性。文中提供了详细的代码示例和数据类型对照表,帮助开发者快速掌握PyTorch张量基础操作,为深度学习模型开发奠定基础。关键点包括张量的GPU加速优势、数据类型选择及随机结果复现方法。

2025-09-09 17:15:07 2061 4

原创 【Claude Code】 保姆级教程

这篇教程详细介绍了如何从零开始安装配置Claude Code。首先需要安装Git并获取API密钥,然后通过Git Bash克隆仓库、运行安装脚本。接着根据提示选择模型并应用配置,最后输入命令即可成功运行Claude Code。教程还说明了如何更换不同模型的API密钥,全程配有图文指引,适合新手按步骤操作。整个流程涵盖了从环境准备到最终使用的完整步骤,帮助用户快速上手Claude Code。

2025-09-08 10:17:07 1738 5

原创 规划问题(二):整数规划

本文介绍整数规划这一运筹学重要分支,聚焦决策变量取整数的优化问题,分纯整数、混合整数、0-1 整数规划三类,给出整数线性规划一般模型。通过背包问题、标准指派问题、旅行商问题三个经典例题,详细分析问题并建立对应 0-1 或整数规划模型。还讲解 MATLAB 中 intlinprog 函数的语法、参数及注意事项,以具体指派问题为例,提供完整求解代码,展示目标函数处理、约束构建及结果输出过程,体现整数规划在实际决策中的应用价值。

2025-09-04 12:55:00 1813

原创 规划问题(一):线性规划

线性规划是运筹学中解决资源优化分配问题的数学方法,其模型由决策变量、目标函数和约束条件三要素构成。标准形式通过矩阵表示,分为求最大值或最小值的线性目标函数,在等式或不等式约束下求解。Matlab提供了linprog函数求解线性规划问题,需将问题转化为标准形式。某些非线性问题(如绝对值最小化)也能通过变量替换转化为线性规划问题。灵敏度分析则用于评估参数变化对最优解的影响。该方法广泛应用于生产管理、供应链优化等领域,帮助在资源限制下实现效益最大化。

2025-09-03 18:53:02 1763 1

原创 深度学习基础教程(四):文本预处理

本文针对 NLP 模型效果不达预期的痛点,点明文本预处理的核心价值,系统拆解其关键环节与实操方法。首先介绍预处理的作用(规范模型输入、指导超参数选择)及包含的文本处理、张量表示等模块;再详解文本处理(jieba 分词多模式、命名实体识别、词性标注)、文本张量表示(one-hot、Word2Vec、动态 / 静态词嵌入)与文本数据分析(标签分布、句子长度等),并附代码示例;最后指出这些技巧可解决数据问题,为情感分析等 NLP 任务筑牢建模基础,提升开发效率。

2025-09-01 17:26:36 5242 9

原创 用【Coze】实现文案提取+创作

本文围绕扣子Coze平台展开,先介绍其作为字节跳动打造的一站式AI Bot开发平台,能降低开发门槛,让无编程经验者也可搭建智能Bot,还具备多场景适配、可视化调试等优势。接着讲解AI工作流,它可借助AI技术拆分并自动化业务流程,在多领域落地。最后详细阐述了Coze从开发平台创建、智能体与工作流添加,到工作流搭建、模型发布的完整步骤。

2025-08-30 18:46:48 1536 1

原创 当哈利·波特遇到【Cursor】

本文详细阐述霍格沃茨魔法画图室网页的全流程搭建,从项目规划与设计起步,明确以魔法主题在线绘画为定位,面向哈利波特爱好者等群体,确定 HTML5、CSS3 等技术栈与霍格沃茨风格设计方向,划分四大功能模块。随后依次讲解基础架构搭建(含 HTML 结构、页面分层与文件组织)、样式设计(全局样式、各页面美化及魔法元素融入)、核心与高级功能开发(Canvas 绘画、图片管理、撤回保存、魔法特效等),还涵盖用户体验优化、测试与部署维护,最终呈现兼具实用性与趣味性、符合现代 Web 开发实践的魔法绘画平台。

2025-08-27 18:51:26 1343 2

原创 使用【阿里云百炼】搭建自己的大模型

本文介绍阿里云百炼大模型平台,其为企业级服务平台,融合通义千问等模型,支持多模态能力,提供一站式工具降低开发门槛。重点讲解智能体应用及大模型搭建步骤,含进入创新应用界面、选模型配参数、输指令、导数据、加载知识库、获取API Key、加样例库、配置MCP,还提及模型调试与多平台发布,并附试用链接,助力企业与开发者快速搭建适配业务的AI模型。

2025-08-26 19:36:40 4024 2

原创 深度学习基础教程(三):模型训练核心技巧

本文围绕深度学习训练核心技巧展开,包括参数初始化、优化方法、正则化及批量归一化。参数初始化中,推荐均匀分布、Kaiming和Xavier初始化,避免全0、全1等方式。优化方法有Momentum(平滑梯度)、AdaGrad(自适应学习率)、RMSProp(优化学习率衰减)及融合两者的Adam。Dropout通过随机丢弃神经元降低复杂度以缓解过拟合。批量归一化控制数据分布,稳定训练并加速收敛,这些技巧共同助力模型高效训练。

2025-08-25 17:44:33 1320

原创 深度学习基础教程(二):反向传播篇

本文围绕“掌握梯度下降、链式法则、反向传播”目标,详解多层神经网络训练技术。先回顾梯度下降,说明参数更新公式及学习率影响,解析Epoch、Batch、Iteration概念,对比BGD、SGD、Mini-Batch差异;再讲前向传播数据流转、反向传播误差传递逻辑,借复合函数示例讲链式法则,附常用函数导数;结合PyTorch代码实现网络构建、正反向传播与参数更新;最后通过计算图和Softmax推导,厘清反向传播原理,为神经网络训练提供理论与实践指导。

2025-08-25 09:00:00 1355 3

原创 深度学习基础教程(一):常见激活函数篇

本文围绕深度学习展开,先阐明人工智能、机器学习、深度学习的层级关系,指出深度学习无需人工提取特征但可解释性差。接着介绍神经网络模仿生物神经元,含输入、隐藏、输出层。还详解激活函数(注入非线性),常见类型(sigmoid、tanh、ReLU 等)及特性,分析梯度消失 / 爆炸问题,并给出隐藏层与输出层激活函数的选择建议,助力理解深度学习核心原理。

2025-08-24 09:30:00 909

原创 【三种解决Visual Studio中scanf函数报错的方法】

本文剖析VS2022中 `scanf` 报错根源(C6031 忽略返回值、C4996 安全风险),详解三类方案:① 加宏快速关警告,简便但存溢出隐患;② 借 Everything 定位模板文件,修改后一劳永逸(附实操);③ 改用 `scanf_s`,需显式传缓冲区大小,却兼容性受限 。代码+步骤双指引,高效攻克编译难题。

2025-08-23 14:10:00 2029

原创 【Pytorch】2025 Pytorch进阶教程

本文是一份 PyTorch 核心操作实用教程,聚焦张量与模型的关键处理技能。首先详解张量形状操作,涵盖 reshape、transpose、permute 等函数用法,助于适配网络层间数据传递;接着介绍张量均值、求和、平方等常见运算函数;还阐述自动微分模块的梯度计算方法,包括单标量 / 向量梯度求解及梯度清零、控制计算等技巧;最后说明模型保存(参数 / 全模型)与加载方法,强调结构一致性、设备兼容性等注意事项。帮助读者掌握从数据处理到模型管理的核心能力。

2025-08-22 21:42:41 1424

原创 C 语言进阶 分支语句和循环语句

掌握了分支与循环,你就握住了 C 语言逻辑的 “方向盘”。从简单的 if 判断 “是与否”,到 switch 高效处理多分支,从 while 循环的灵活迭代,到 for 循环的精准控制,再到 do-while 的 “至少一次” 执着 —— 这些语句看似基础,却是构建复杂程序的 “乐高积木”。猜数字游戏的趣味互动、折半查找的高效定位、关机程序的逻辑设计…… 你会发现,那些曾经觉得 “复杂” 的功能,不过是这些基础语句的巧妙组合。

2025-08-22 15:31:06 1167

原创 C 语言入门知识大全(二)

本文介绍C语言核心知识:函数是模块化编程核心,分库函数与自定义函数,含定义、调用、参数返回值及递归等;数组为相同类型元素有序集合,介绍定义、初始化及使用;罗列算术、移位等多种操作符;详解类型、循环控制等关键字及typedef、static等用法;说明指针存储内存地址的特性、使用及大小规律;阐述结构体的定义、初始化、成员访问及应用场景,助于掌握C语言基础与核心概念。

2025-08-21 15:57:35 1257

原创 C 语言入门知识大全(一)

本文介绍了C语言的基础核心内容:作为通用底层、面向过程的编程语言,其有ANSI C、C11等标准,跨平台性强。还讲解了编译器选择(如VS2022)、开发流程,以及数据类型、变量常量、字符串、转义字符、注释、选择语句、循环语句等核心语法,辅以第一个程序示例,助入门者掌握C语言基础。

2025-08-21 10:30:00 1817

原创 【Pytorch】2025 Pytorch基础入门教程

PyTorch已成为深度学习核心工具,从科研到工业广泛应用。本文介绍PyTorch安装和基础语法,包括张量创建、形状调整等关键操作。与TensorFlow、PaddlePaddle对比,PyTorch凭借动态图调试和Pythonic设计优势,2023年工业界使用率达36.8%。通过10分钟快速入门指南,读者可掌握PyTorch核心技能,轻松上手深度学习开发。

2025-08-20 20:04:04 1389

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除