大模型微调RAG部署实战及类GPT工具的高效使用
文章平均质量分 92
对大模型微调、RAG、部署、调优和DeepSeek等GPT工具使用进行详尽的介绍。本专栏持续更新中,已购买专栏人数超过1400+。
余额抵扣
助学金抵扣
还需支付
¥69.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
herosunly
985院校硕士毕业,现担任算法工程师一职,获得优快云博客之星第一名,热衷于大模型算法的研究与应用。曾担任百度千帆AI应用挑战赛、英特尔AI创新应用大赛等比赛评委,科大讯飞AI大学堂荣誉讲师,编写微软OpenAI考试认证指导手册。曾获得多项AI顶级比赛的Top名次,其中包括阿里云天池比赛第一名,科大讯飞分类挑战赛第一名,CCF信息分类比赛比赛第二名,开放原子分类比赛二等奖,CCF家族分类第四名,科大讯飞阿尔茨海默症预测挑战赛第四名,科大讯飞事件抽取挑战赛第七名。在技术创新领域拥有多项授权发明。曾辅导多位非科班出身的同学成功进入算法行业就业。希望和大家一起成长进步。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大模型微调部署实战及类GPT工具的高效使用
本文主要介绍了专栏《大模型微调部署实战及类GPT工具的高效使用》的核心内容,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 专栏亮点3. 你的收获4. 详细目录原创 2024-07-24 07:00:00 · 223034 阅读 · 108 评论
-
详解大模型微调数据集构建方法(持续更新)
本文详细介绍了大模型微调数据集构建方法,希望能对学习大模型的同学们有所帮助。文章目录1. 前言2. 微调数据集构建方法 2.1 方法一 2.2 方法二 2.3 方法三 2.4 方法四 2.5 方法五原创 2024-06-05 07:30:00 · 281203 阅读 · 63 评论
-
大模型LoRA微调调参的实战技巧(持续更新)
本文主要介绍了大模型LoRA微调调参的实战技巧,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战技巧原创 2024-05-01 12:08:15 · 207439 阅读 · 69 评论
-
LLaMA Factory单机微调的实战教程
本文主要介绍了使用LLaMA Factory对大模型进行单机微调的实战教程,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 模型选型与下载3. 运行代码 3.1 构建训练数据 3.2 修改配置文件 3.3 微调原创 2024-04-24 22:28:51 · 216398 阅读 · 36 评论
-
huggingface高速下载模型的实战代码
本文主要介绍了huggingface高速下载模型的实战代码,尤其是无法通过国内源进行下载的huggingface模型,希望能对学习大模型的同学们有所帮助。需要特别说明的是,本文的代码是完全原创的,即能够最大限度利用宽度的速度,而且还能实现断点续传。文章目录1. 背景2. 实战代码原创 2024-01-27 11:15:05 · 287972 阅读 · 52 评论
-
RAG系统中Reranker模型选型实战
本文详细介绍了RAG系统中Reranker模型选型实战,希望能对学习RAG的同学们有所帮助。文章目录1. 前言2. 思路解析3. 测评数据集构建 3.1 步骤一 3.2 步骤二 3.3 数据示例 3.4 总结4. 实战代码 4.1 本地模型 4.2 使用第三方的Reranker模型API原创 2025-11-20 07:15:00 · 7268 阅读 · 6 评论 -
RAG测评实战代码(更新版)
本文主要介绍了RAG测评实战代码(更新版),希望对使用RAG的同学们有所帮助。文章目录1. 前言2. 方案介绍3. 实战代码 3.1 代码一 3.2 代码二原创 2025-09-18 10:37:42 · 27840 阅读 · 4 评论 -
构建RAG测评数据的实战代码
本文详细介绍了构建RAG测评数据的实战代码,希望能对学习大模型的同学们有所帮助。文章目录 1. 前言 2. 实战代码原创 2025-09-19 10:54:34 · 6498 阅读 · 4 评论 -
RAG系统中Embedding模型选型实战
本文详细介绍了RAG系统中Embedding模型选型实战,希望能对学习RAG的同学们有所帮助。文章目录1. 前言2. 思路解析3. 测评数据集构建 3.1 步骤一 3.2 步骤二 3.3 数据示例 3.4 总结4. 实战代码 4.1 本地模型 4.2 使用第三方的Embedding模型API原创 2025-11-18 16:56:03 · 9978 阅读 · 10 评论 -
硅基流动Qwen3-Reranker API调用效果不佳的深度解析与解决方案
本文详细介绍了硅基流动Qwen3-Reranker API调用效果不佳的深度解析与解决方案,希望能对学习RAG的同学们有所帮助。文章目录1. 前言2. 深度解析:从“失效”到“溯源” 2.1 诡异的现象:性能反常的Qwen3-Reranker 2.2 溯源:Reranker的不同“范式” 2.3 Qwen3-Reranker的正确“打开方式”3. 实战代码原创 2025-10-18 11:09:36 · 12472 阅读 · 10 评论 -
巧用Deep Research解决开源代码问题的实战方案
本文主要介绍了巧用Deep Research解决开源代码问题的实战方案,希望对使用大模型的同学们有所帮助。文章目录1. 前言2. 实战方法原创 2025-09-10 07:15:00 · 7926 阅读 · 4 评论 -
RAG优化实战:业务场景驱动的 Embedding 模型量化评估
本文详细介绍了RAG优化实战:业务场景驱动的 Embedding 模型量化评估,希望能对学习RAG的同学们有所帮助。文章目录1. 前言2. 构建测评数据集3. 让候选模型“同台竞技”4. 计算和比较相关性原创 2025-10-11 19:08:57 · 14886 阅读 · 9 评论 -
构建硅基流动embedding模型API兼容langchain接口的实战代码
本文详细介绍了构建硅基流动embedding模型API兼容langchain接口的实战代码,希望能对学习大模型的同学们有所帮助。文章目录1. 前言2. 实战代码原创 2025-09-24 11:19:01 · 20696 阅读 · 14 评论 -
使用cursor出现Model not available. This model provider doesn‘t serve your region解决方案
今天给大家带来的是使用cursor出现Model not available. This model provider doesn’t serve your region解决方案,希望能对使用cursor的同学有所帮助。文章目录1. 问题描述2. 解决方案原创 2025-07-19 18:46:20 · 38088 阅读 · 18 评论 -
轻松上手:借助谷歌Gemini打造你的第一个实用的智能体
今天给大家带来的是轻松上手:借助谷歌Gemini打造你的第一个实用的智能体,希望能对学习大模型的同学们有所帮助。文章目录1. 前言2. 实战教程原创 2025-07-04 07:30:00 · 62887 阅读 · 9 评论 -
huggingface高速下载数据集的解决方案
今天给大家带来的是huggingface高速下载数据集的解决方案,希望能对使用huggingface数据集的同学们有所帮助。1. 前言2. 解决方案原创 2025-07-03 07:15:00 · 23578 阅读 · 6 评论 -
巧用云平台API实现开源模型免费调用的实战教程
今天给大家带来的是巧用云平台API实现开源模型调用,希望能对同学们有所帮助。文章目录1. 前言2. 实战教程原创 2025-06-20 16:01:18 · 26621 阅读 · 14 评论 -
LlamaIndex BM25Retriever 支持中文搜索的实战方案
本文主要介绍了LlamaIndex BM25Retriever 支持中文搜索的实战方案,希望对使用RAG的同学们有所帮助。文章目录1. 前言2. 实战代码原创 2025-09-09 10:58:32 · 8214 阅读 · 4 评论 -
RAG测评实战代码
本文主要介绍了RAG测评实战代码,希望对使用RAG的同学们有所帮助。文章目录1. 前言2. 实战代码 2.1 实战代码一 2.2 实战代码二原创 2025-08-27 07:15:00 · 13207 阅读 · 12 评论 -
基于Cline和OpenRouter模型进行MCP实战
本文主要介绍了基于Cline和OpenRouter模型进行MCP实战,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. MCP实战 2.1 模型选型 2.2 安装环境 2.3 安装MCP服务 2.4 MCP实战3. Bug解决方案原创 2025-04-13 17:24:37 · 251080 阅读 · 12 评论 -
Text2SQL推理类大模型本地部署的解决方案
本文主要介绍了Text2SQL推理类大模型本地部署的解决方案,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型3. 实战代码原创 2025-03-27 07:30:00 · 128097 阅读 · 21 评论 -
DeepSeek-R1 满血版和蒸馏版鉴别方法
本文主要介绍了DeepSeek-R1 满血版和蒸馏版鉴别方法,希望对使用DeepSeek模型的同学们有所帮助。文章目录1. 前言2. 实战教程 2.1 满血版实验结果 2.2 DeepSeek-R1-Distill-Qwen-7B实验结果 2.3 DeepSeek-R1-Distill-Qwen-32B实验结果 2.4 DeepSeek-R1-Distill-Qwen-70B实验结果3. 总结原创 2025-02-25 14:11:10 · 145744 阅读 · 15 评论 -
DeepSeek R1最强平替模型的实战教程
本文主要介绍了DeepSeek R1最强平替模型的实战教程,希望对使用DeepSeek R1出现服务器繁忙,请稍后再试的同学们有所帮助。文章目录1. 前言2. 实战教程原创 2025-02-11 13:08:13 · 93223 阅读 · 6 评论 -
DeepSeek提示词实战教程(持续更新)
本文主要介绍了deepseek提示词实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 推理模型 vs 通用模型3. 提示词实战 3.1 优质提示词库 3.2 提示词优化原创 2025-02-10 17:29:07 · 94803 阅读 · 5 评论 -
DeepSeek R1蒸馏版模型部署的实战教程
本文主要介绍了DeepSeek R1蒸馏版模型部署的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库2.3 下载模型3. 运行代码 3.1 启动模型服务 3.2 模型调用原创 2025-02-09 17:55:46 · 96770 阅读 · 9 评论 -
AI时代的高效工作法:打造AI专属助理之路
今天给大家带来的是AI时代的高效工作法:打造AI专属助理之路,希望能对同学们有所帮助。文章目录1. 你离“丘吉尔式”的工作方式,只差一个思维转变2. AI使用内功心法 2.1 思维奠基——别把“它”当工具,当成你的“助理实习生” 2.2 思维进阶——反客为主,让AI更加了解实际情况 2.3 持续迭代——从“平庸回复”到“卓越方案”的蜕变**3. 持续积累亦为AI时代的不二法则原创 2025-06-18 10:57:40 · 26830 阅读 · 4 评论 -
语音转文本SOTA模型部署的实战教程
本文主要介绍了语音转文本SOTA模型部署的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型3. 实战代码原创 2025-03-14 16:47:05 · 132778 阅读 · 6 评论 -
本地部署Embedding模型API服务的实战教程
本文主要介绍了本地部署Embedding模型API服务的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型3. 运行代码 3.1 启动模型服务 3.2 调用代码原创 2025-02-28 17:54:32 · 142456 阅读 · 10 评论 -
Windows环境下Ollama的本地部署方案
本文主要介绍了Windows环境下Ollama的本地部署方案,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. Windows环境安装3. API调用示例代码原创 2024-12-09 13:04:01 · 111336 阅读 · 42 评论 -
LLaMA Factory 核心原理讲解
本文主要介绍了LLaMA Factory 核心原理讲解,希望能对学习大模型的同学们有所帮助。文章目录1. 前言2. 核心模块讲解3. SFT流程讲解原创 2024-10-30 18:09:06 · 141520 阅读 · 55 评论 -
基于RAG构建Text2SQL的实战教程
本文主要介绍了基于RAG构建Text2SQL的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境2.1 安装虚拟环境2.2 安装依赖库2.3 下载模型3. 运行代码 3.1 启动模型服务 3.2 实战代码原创 2025-01-22 14:44:14 · 100928 阅读 · 3 评论 -
使用langchain和大模型API提取QA的实战教程
本文主要介绍了使用langchain和大模型API提取QA的实战教程,希望能对学习大模型的同学们有所帮助。提取后的json部分内容如下所示。文章目录1. 前言2. 实战教程 2.1 搭建环境 2.2 实战代码 2.3 实战案例原创 2024-10-21 07:15:00 · 138914 阅读 · 41 评论 -
Qwen2.5 本地部署的实战教程
本文主要介绍了Qwen2.5 本地部署的实战教程,希望对学习大语言模型的同学们有所帮助。文章目录1. 介绍2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型文件3. 运行Qwen2.5 3.1 简单测试 3.2 启动API服务原创 2024-09-23 07:30:00 · 156656 阅读 · 37 评论 -
调用Claude 3.5 API的实战代码
本文主要介绍了调用Claude 3.5 API的实战代码,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战代码原创 2024-09-04 18:30:37 · 164738 阅读 · 24 评论 -
基于华为昇腾910B和LLaMA Factory多卡微调的实战教程
本文主要介绍了基于华为昇腾910B和LLaMA Factory多卡微调的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 模型选型与下载 2.4 配置多卡环境3. 运行代码 3.1 构建训练数据 3.2 修改配置文件 3.3 继续预训练(CPT) 3.4 SFT原创 2024-08-23 22:26:47 · 177058 阅读 · 39 评论 -
详解大模型多轮对话的输入和输出token序列
本文主要介绍了大模型多轮对话的输入和输出token序列,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 内容详解和代码验证原创 2024-12-23 07:30:00 · 105628 阅读 · 36 评论 -
预训练PDF数据格式转换
本文主要介绍了预训练PDF数据格式转换,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. PDF数据格式转换原创 2024-08-12 20:58:48 · 185521 阅读 · 48 评论 -
DeepSeek 2.5本地部署的实战教程
本文主要介绍了DeepSeek 2.5本地部署的实战教程,希望对学习大语言模型的同学们有所帮助。文章目录1. 介绍2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型文件3. 运行DeepSeek 2.5 3.1 简单测试 3.2 启动API服务原创 2024-09-22 13:19:19 · 190712 阅读 · 24 评论 -
大模型后处理之提取Json结构数据的实战代码
本文主要介绍了大模型后处理之提取Json结构数据的实战代码,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 实战代码原创 2024-12-20 21:15:21 · 107795 阅读 · 17 评论 -
详解大模型多轮对话的数据组织形式
本文主要介绍了详解大模型多轮对话的数据组织形式,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. LLaMA Factory适配的多轮对话数据形式3. SWIFT适配的多轮对话数据形式原创 2024-09-06 07:30:00 · 156791 阅读 · 43 评论
分享