自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

哒哒哒哒 哒哒

你好哇 欢迎你 Hi~ o(* ̄▽ ̄*)ブ

  • 博客(211)
  • 收藏
  • 关注

原创 【1min 速通 -- PyTorch 张量数据类型】张量类型的获取、转化与判别

本文介绍了PyTorch中张量数据类型的常用操作:1)使用.type()获取张量类型;2)通过.type(目标类型)或.目标类型()进行类型转换;3)利用isinstance()函数检测张量类型是否合法。示例代码展示了如何对2×3的随机张量执行上述操作,包括获取其类型为FloatTensor、转换为DoubleTensor以及验证类型匹配情况。这些操作在PyTorch数据处理过程中较为常用。

2025-11-07 15:14:02 277

原创 【超简单】Anaconda 安装教程(Windows 图文版)

本文提供了Windows系统下Anaconda的详细安装教程,适合零基础用户。首先介绍了Anaconda作为Python发行版的优势,然后分步骤指导下载和安装过程,包括环境变量配置等关键设置。安装完成后,提供了两种验证方法,并演示了如何创建Python 3.9虚拟环境及安装PyTorch等库。教程图文并茂,涵盖了从安装到基础使用的完整流程,帮助用户快速搭建Python开发环境。

2025-09-09 22:22:14 1836 1

原创 【1分钟速通】 HTML快速入门

本文介绍了HTML的基础知识和常用标签。主要内容包括:1)HTML的骨架结构(DOCTYPE、html、head、body);2)常用标签如标题、段落、链接、图片、列表、表格、表单等;3)区块元素div和span的区别。HTML作为网页的基础,通过标签描述页面结构,配合CSS和JavaScript实现完整网页功能。文章还提供了各类标签的语法示例和属性说明,适合初学者快速了解HTML的基本用法。

2025-09-09 22:20:53 833

原创 PyTorch 模型保存与加载 (速查版)

本文介绍了PyTorch模型保存与加载的3种常见场景:1)推理时保存和加载模型权重;2)继续训练时保存和加载完整状态(包括模型、优化器、调度器);3)微调时部分加载预训练权重。关键点包括:使用state_dict()保存模型参数,注意设置strict=False处理部分加载情况,加载时指定map_location="cpu"增强通用性,以及切换model.eval()/train()模式。速记口诀总结了不同场景下的最佳实践。

2025-09-08 18:23:44 291

原创 【一文搞懂】软件测试基础入门到项目实战

本文系统介绍了软件测试的基本概念和核心方法。主要内容包括:1.软件测试定义及主流技能(功能测试、自动化测试、接口测试、性能测试);2.测试分类(按阶段分为单元/集成/系统/验收测试,按代码可见度分为黑盒/灰盒/白盒测试);3.质量模型评估维度(功能、性能、兼容性等);4.测试流程(需求评审到测试报告);5.测试用例设计方法,重点展示了等价类划分法(处理输入框测试)、边界值分析法(处理边界条件)和判定表法(处理多条件组合)的实际应用案例,包含详细用例模板和测试数据。文章为软件测试工作提供了系统性的方法论指导。

2025-09-08 18:20:17 1207

原创 Qwen Agent 入门介绍与简单使用示例

Qwen Agent 是由阿里巴巴推出的多模态大模型 Qwen 系列中的智能 Agent 框架。让开发者能够快速构建“能思考、会规划、能调用工具”的 AI 智能体!!!简单来说,Qwen Agent 让大模型变成“会干活的 AI 助手”,而不仅是一个聊天机器人。

2025-08-08 22:40:10 590

原创 【入门教程】GraphRAG 结构化检索增强生成 :从原理到实战

GraphRAG是一种基于知识图谱的检索增强生成方法,相比传统RAG具有显著优势。它通过将文本转化为知识图谱,利用实体和关系进行结构化检索,能够处理跨文档、多跳推理等复杂问题。GraphRAG流程分为索引和查询两阶段:先构建知识图谱并检测社区,再通过全局和局部检索生成连贯答案。这种方法特别适合需要深度推理的场景,如跨文档问答、知识管理等。虽然计算成本较高,但能提供更精准、更具逻辑性的回答。微软已开源GraphRAG实现,用户可通过准备数据、构建索引、运行查询等步骤进行实践应用。

2025-08-08 22:09:47 819

原创 RAFT:让语言模型更聪明地用文档答题

RAFT是一种新的语言模型训练方法,旨在提升模型基于文档回答问题的能力。它通过模拟"开卷考试"的方式,在训练时给模型提供相关文档和干扰文档,让模型学会辨别、引用和推理。RAFT的关键创新包括:1)控制黄金文档的出现比例,平衡查找和记忆能力;2)要求模型输出带有引用标记的推理链答案。实验表明,RAFT在医学问答等任务上显著优于传统方法,最高提升达74分。适度的干扰文档反而能增强模型鲁棒性。不过RAFT需要额外训练,计算成本较高,适合有特定领域需求的企业级应用。

2025-08-05 15:44:30 837

原创 RAG常见问题与优化方法全解析|从新手到高手的实践指南

📌 RAG系统优化指南:从数据准备到答案生成的全流程解决方案 本文系统梳理了检索增强生成(RAG)系统开发中的常见问题和优化策略。针对数据准备阶段,建议构建数据处理流水线并使用智能文档解析技术;知识检索阶段推荐查询转换和混合检索+重排序方法;答案生成阶段强调提示词优化和动态防护栏的应用。文章还分享了向量模型选择、本地部署方案等实践经验,并解答了"长上下文是否替代RAG"的疑问。通过这套方法论,开发者可构建更高效、透明、安全的问答系统,实现从基础搭建到专业优化的能力跃升。

2025-08-04 22:12:37 786 1

原创 【保姆级 - 大模型应用开发】DeepSeek + Faiss + langchain 从零搭建本地知识库 检索 | 理论 + 代码实战

RAG(检索增强生成)技术结合信息检索与文本生成,通过实时检索增强生成结果的时效性和准确性。其流程分为三大步骤:数据预处理(知识库构建、文档分块、向量化)、检索(查询处理、相关性排序)、生成(上下文组装、回答生成)。实战部署包括PDF文本提取、知识库构建和问答系统搭建,使用嵌入模型(如BGE-M3)和向量数据库实现高效检索。该技术特别适用于需要动态更新知识的场景,产品如NotebookLM已展现其应用潜力。不同嵌入模型适配多语言、轻量级或专业领域需求,开发者可通过开源工具快速实现RAG系统。

2025-08-04 18:18:20 1599 1

原创 Linux 文件与目录操作命令宝典

本篇聚焦于 Linux 中最常见和实用的文件与目录操作命令,适用于 Ubuntu、RedHat、CentOS 等主流发行版。

2025-08-03 23:23:33 357

原创 RAG 中常见的文本分块(chunk)方法及实战代码示例

在 RAG 场景中,我们会把一整篇文档切成多个“小段”,每一段叫一个 chunk被转成向量存入向量数据库(如 Faiss / Milvus)后续检索时再被组合成上下文用于大模型生成。

2025-08-03 23:15:54 841

原创 ModuleNotFoundError: No module named ‘pip‘ 解决方案

(xxx 是你之前想要安装的包)应该可行了~

2025-08-03 22:09:27 177

原创 【保姆级 - 大模型应用开发】 零基础 10 行代码实现词向量训练 | 代码实战

本文介绍了使用Python+jieba+Word2Vec实现中文词向量训练的全流程。首先安装jieba和gensim库,准备原始中文文本。通过jieba自动分词后,使用gensim的Word2Vec模型进行训练,可调整参数如vector_size、window大小等。训练完成后可计算词语相似度或查找最相似词语,最后保存模型供后续使用。文章提供了完整代码和示例输出,帮助读者快速掌握中文词向量训练的基本方法,适合想了解NLP基础实践的初学者参考。

2025-08-01 18:14:16 305

原创 【保姆级 - 大模型应用开发】零基础 10 行代码实现内容推荐系统 | 代码实战

本文介绍了一个基于TF-IDF和余弦相似度的简单内容推荐系统实现方法。通过10行核心Python代码,使用scikit-learn库完成文本特征提取和相似度计算。文章包含示例数据准备、TF-IDF向量化、余弦相似度计算及结果展示等步骤,并提供了使用N-Gram提升语义捕捉能力的进阶方案。此外还介绍了如何衔接向量数据库处理大规模数据,以及Word2Vec/BERT等延伸方向。配套完整注释代码,适合初学者快速实现基础推荐功能。

2025-08-01 16:38:55 1305

原创 【保姆级 - 大模型应用开发】DeepSeek R1 本地部署全攻略:Ollama + vLLM + PyTorch 多选方案

本文介绍了三种本地部署DeepSeek-R1大模型的方法:Ollama、vLLM和原生PyTorch,适合不同需求的开发者。Ollama提供最简单的一键式部署,适合新手;vLLM支持高性能推理和量化,适合中高端GPU用户;PyTorch方案则最灵活可控。文章详细说明了各方案的安装步骤、运行命令和硬件需求,并对比了它们的优缺点。建议根据实际场景选择1.5B到70B不同规模的蒸馏模型,在保证效果的同时节省资源。DeepSeek系列模型性能优异,部署简单,是本地化大模型应用的良好选择。

2025-07-29 17:52:38 622

原创 【保姆级 - 大模型应用开发】DeepSeek 的创新全解析 | 快速了解

模型推理精度显存优化本地部署开源许可✅ 超强✅ Ollama/VLLM 支持OpenAI o1强❌❌❌ 商用受限LLaMA3中✅✅❌ 有限制DeepSeek 正逐步改变国产大模型生态,值得持续关注与使用。

2025-07-29 17:38:19 3541

原创 【保姆级 - 大模型应用开发】Function Call 让 AI 调用函数 | 代码实战

Function Call 是一种让大语言模型主动调用预定义函数的技术。本文演示了如何通过API实现时间查询功能:用户提问"现在几点了?"时,模型会调用开发者预先编写的get_current_time()函数获取当前时间。文章提供了完整的Python代码示例,包括API请求构建、函数定义和结果处理流程,并展示了预期输出。这种技术扩展了模型能力,使其不仅能理解问题,还能执行具体操作。最后建议开发者尝试替换其他功能函数或添加多个函数供模型选择调用。

2025-07-24 23:39:56 403

原创 【保姆级 - 大模型应用开发】零基础调用大模型 API | 代码实战

随着大模型技术的火热,很多人都想在自己的项目中接入 GPT 等智能能力。但一提到 “API 调用”,不少人就头大。其实只需要 **不到 20 行代码**,你就可以让自己的程序拥有 “智能大脑”!

2025-07-24 17:22:31 494

原创 【分配问题】linear_sum_assignment 极速教程

【代码】【分配问题】linear_sum_assignment 极速教程。

2025-06-03 15:26:44 436

原创 【深度强化学习 DRL 快速实践】稀疏奖励问题 sparse reward

比如,你要用强化学习让一个机械手臂学会开门,训练过程中只有开门成功后才能获得对应的奖励 【sparse reward】:想办法设计一些辅助的 reward 来引导 agent 实现你想要的目标:例如手臂朝门移动就给一点 reward。:增加一个 Curiosity 奖励项,鼓励冒险 (偏向导致难以预测的。:从宏观大任务,再拆解完成小任务 (如下图,粉红色的标识就是高层的规划):任务由简单开始,逐渐增加难度。

2025-04-26 18:21:02 466

原创 【深度强化学习 DRL 快速实践】Deep Q-learning

Q-learning 快速实践:model-free, off-policy, Value-based

2025-04-26 14:08:55 1120

原创 【深度强化学习 DRL 快速实践】近端策略优化 (PPO)

一种基于信赖域优化的强化学习算法,旨在克服传统策略梯度方法在更新时不稳定的问题,采用简单易实现的目标函数来保证学习过程的稳定性。

2025-04-25 23:05:55 1537

原创 【深度强化学习 DRL 快速实践】逆向强化学习算法 (IRL)

在传统的强化学习 (Reinforcement Learning, RL) 中,奖励函数是已知的,智能体的任务是学习一个策略来最大化奖励我们不知道奖励函数缺失的但是我们有专家的示范轨迹(比如专家怎么开车、怎么走路):τs0a0s1a1sTτs0​a0​s1​a1​sT​推断出奖励函数,使得专家行为在该奖励下是最优的简单来说,IRL 是"从专家行为中推断动机"TheactorDefine aactorTheactorOutput the。

2025-04-25 22:29:21 1633

原创 【深度强化学习 DRL 快速实践】异步优势演员评论员算法 (A3C)

A3C 快速实践:model-free, on-policy, actor-critic, stochastic 策略

2025-04-25 19:03:56 1096

原创 【深度强化学习 DRL 快速实践】Value-based 方法总结

方法是否无偏方差水平特点是高基于完整回合真实回报进行无偏估计,适合无模型环境否低只看一步,收敛速度快、稳定,但引入了偏差在实际应用中,TD 方法(如 SARSA、Q-learning)最为广泛使用,因为它无需完整轨迹,学习效率更高。

2025-04-25 17:59:51 1081

原创 【深度强化学习 DRL 快速实践】策略梯度算法 (PG)

PG 快速实践:model-free, on-policy, PG, stochastic 策略

2025-04-25 17:16:24 1326

原创 【深度强化学习 DRL 快速实践】深度确定性策略梯度算法 (DDPG)

DDPG 快速实践:model-free, off policy, actor-critic, deterministic 策略

2025-04-25 12:53:56 1180

原创 seq2seq

理解 transformer 中的 encoder + decoder。

2025-04-01 22:40:55 363

原创 【RLHF 理论与代码实战】GenAI HW6: LLM Values Alignment (DPO)

RLHF 理论与代码实战 (附完整代码,保姆级教程,包懂的好吧!)

2025-03-29 18:41:50 932 1

原创 【极速版 -- 大模型入门到进阶】LORA:大模型轻量级微调

🌊 有没有低成本的方法微调大模型?🌊 LoRA 的核心思想🌊 LoRA 的初始化和 r 的值设定🌊 LoRA 实战:LoraConfig参数详解

2025-03-28 22:20:49 880

原创 【极速版 -- 大模型入门到进阶】大模型如何学会使用对应的工具 (第二弹)

🌊 Toolformer 要达到的效果是什么🌊 【搜索操作和搜索结果】怎么结合到大模型的生成过程和结果中去的呢🌊 Toolformer 怎么学会使用外部工具:自监督学习使用工具

2025-03-26 21:41:44 735

原创 【极速版 -- 大模型入门到进阶】大模型如何学会使用对应的工具 (第一弹)

🌊 WebGPT 要达到的效果是什么🌊 【搜索操作和搜索结果】怎么结合到大模型的生成过程和结果中去的呢🌊 WebGPT 怎么学会使用 `网络搜索`工具

2025-03-26 18:35:08 338

原创 【极速版 -- 大模型入门到进阶】GPT + Gradio 聊天机器人从 0 到 1

🌊 环境准备🌊 配置 API 密钥🌊 定义与 GPT 的对话函数,支持多轮对话🌊 使用 Gradio 创建界面🌊 完整代码 & 结果展示

2025-03-23 15:58:13 633

原创 【极速版 -- 大模型入门到进阶】快速了解大型语言模型

🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力🌊 LLM 如何生成输出:简而言之就是文字接龙🌊 GPT 之前 ...:模型规模和数据规模概览🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习🌊 ChatGPT 使用:人类向 chatgpt 靠近🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)

2025-03-23 00:44:40 624

原创 【OpenDrift 快速上手 02】OpenDrift 安装

opendrift 快速上手指南来啦~一起试试吧

2025-03-19 11:17:27 742

原创 【OpenDrift 快速上手 01】OpenDrift 是什么,能干啥 ?

opendrift 快速上手指南来啦~一起试试吧

2025-03-19 10:50:08 531

原创 【快速入门】Unity 常用组件(功能块)

💜💜。

2025-02-15 23:33:13 616

原创 【3min 简单示例】Unity 通过 C# 脚本旋转游戏物体

以匀速旋转一个立方体对象为例,展示具体`旋转`编码操作超简单必懂!不懂可以留言喔 ~

2025-02-15 04:00:00 686

原创 【1min 快速上手 Unity 基本使用方法】外部模型使用

图文演示,如何在unity中使用外部模型~ 1min 快速上手

2025-02-14 23:38:48 494

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除