赋范大模型技术社区-优快云博客

原创关于LLM微调&数据集，回答一个好问题

栏目涵盖了微调的主要目的、微调后能力变化的原因、数据量不足的解决方案、数据集清洗的可行性、多模态数据微调的适用性等多个技术问题，并提供了详细的解答和建议。此外，社区还提供了硬件配置自查表，帮助成员评估模型效果和处理时序数据。社区鼓励成员提出具体、明确的问题，并提供了多种途径来获取答案，包括社群提问、直播答疑和智能搜索等。赋范大模型技术社区致力于为成员提供最有价值的技术赋能，内容完全免费，涵盖工业级方案、企业实战项目和技术直播公开课等。

2025-05-22 21:34:44 724

原创 5分钟打造一个AI出行助手！最新版CherryStudio+高德MCP打造个人出行规划助理

本文通过CherryStudio和高德地图MCP，指导用户如何打造一个AI出行助手。首先，用户需下载并安装CherryStudio，然后获取大模型API-Key，如DeepSeek模型。接着，配置高德地图MCP服务器，包括注册高德开放平台、获取MCPkey，并在CherryStudio中设置MCP服务器。最后，通过调用高德MCP，用户可以规划行程，如旅游计划或城市步行路线。整个过程简单易行，即使是零基础用户也能轻松上手。此外，文章还提供了其他MCP工具的链接，供用户根据需求选择使用。

2025-05-21 19:52:32 542

原创实测最佳编程Agent！OpenAI最新Codex快速上手指南

一、Codex核心特性介绍Codex介绍主页：https://openai.com/index/introducing-codex/ OpenAI Codex（2025研究预览版）是一个基于云端的软件工程智能体，能够并行处理多项编程任务。它可以根据用户的自然语言指令自动编写代码、回答代码库相关的问题、修复代码中的错误，甚至为代码仓库生成Pull Request提案。每个任务都会在云端一个隔离的沙盒容器中独立执行，并预先加载用户的代码仓库环境。这意味着 Codex 能读取和编辑仓库中的文件，运

2025-05-20 14:32:30 774

原创三本生逆袭算法岗，这份求职+学习经验请收好

「Agentic时代同行计划」旨在集结群体智慧，分享个人经历与经验，共同迎接技术新时代。受访者Ren，三本自学背景，转行成为大模型开发工程师，分享了他的职业转型之路。Ren从通信工程专业自学转行，经历了考研失败、销售工作，最终通过自学和实习，成功进入大模型开发领域。他强调，解决问题的能力是核心竞争力，而非学历或专业背景。Ren通过实际工作经验，展示了如何通过数据分析和问题解决，提升业务指标，从而获得职业机会。他还分享了自学大模型开发的诀窍，强调边学边做的重要性，并建议求职者关注行业需求，学习最具性价比的技术

2025-05-16 17:15:34 728

原创【源码级开发】Qwen3接入MCP，企业级智能体开发实战！

2.1 MCP服务器（server）与客户端（client）概念介绍不同于Function calling技术，MCP技术是对于大模型和外部工具的另一种划分方式，也就是说在MCP技术体系中，此时MCP会将外部工具运行脚本称作服务器，而接入这些外部工具的大模型运行环境称作客户端。一个客户端可以接入多个不同类型的服务器的，但要求是都可以遵循MCP通信协议。简单理解就是MCP服务器的输出内容是一种标准格式的内容，只能被MCP客户端所识别。

2025-05-16 17:10:22 1138

原创可能是全网唯一的，公益大模型技术成长营

我们就是要让你在一次次亲自动手、一次次解决真实问题的过程中，把那些看似高深的技术点，彻底嚼烂了、吸收透了，真正内化成你自己的看家本领！所以，在「大模型实战成长营」里，我们摒弃了那种“填鸭式”的理论灌输和“碎片化”的知识点堆砌！「大模型实战成长营」致力于打造一个真正为初学者着想，真正能让你学到东西，真正带你从零开始做出看得见、摸得着的成果，实现实实在在的技术进步……而到了实战环节，遇到的可能是演示ChatGPT的聊天界面讲解，或是主流大模型的安装部署、API调用，实际落地时发现学到的只有玩具！

2025-05-15 16:00:00 1012

原创【含教程】MCP今年最大更新，企业级流式HTTP功能全面上线！

MCP工具长期以来主要依赖SSE传输进行异地通信，但其并发性和稳定性不足，难以满足企业级应用需求。为改进这一问题，开发者提出采用流式HTTP传输技术，该技术具备更高并发性、更稳定通信及更易集成部署的特点。MCP官方于2月初在GitHub上提出此方案，并在3月发布流式HTTP通信协议，5月9日的1.8.0版本更新中正式加入了HTTP流式MCP服务器的功能支持。此次更新标志着MCP技术迈向企业级应用的重要一步。公开课详细介绍了流式HTTP MCP服务器的开发、测试、部署流程，并提供了完整的功能测试客户端脚本，助

2025-05-15 11:37:03 1085

原创「大模型实战成长营」上线！从0到企业级复现，跟我们一起打通AI能力闭环

「大模型技术实战成长营」正式上线，这是一个面向全社区成员的免费、无门槛长期项目，旨在帮助开发者从零基础到独立复现项目，最终掌握企业级大模型应用能力。成长营提供五大阶段任务，包括任务卡、教程课件、视频讲解等资源，强调实践驱动的学习路径，帮助学员建立技术资产，如可展示的LLM实战项目，并有机会获得社区勋章、实物周边等激励。社区已有超过3万成员，提供活跃的讨论和互助环境，确保学习过程中的可见性和成就感。成长营由赋范大模型技术社区发起，完全免费，旨在降低技术学习门槛，推动行业进步。参与者需具备基础Python知识和

2025-05-14 15:11:52 521

原创手把手带你【开发】自己的专属MCP工具，再将其部署上线+进行本地维护

实时下载和运行工具包的便捷性，使得开发工作更加高效，能够快速迭代和创新，同时促进了开源社区的蓬勃发展。不过需要注意的是，MCP只提供了Streamable HTTP协议层的支持，也就是规范了MCP客户端在使用Streamable HTTP通信时的通信规则，而并没有提供相关的SDK客户端。也就是说，从表面上来看，我们是填写了MCP工具就能使一些客户端自动连接MCP服务器，实际上是首次运行的时候，MCP客户端会先下载这些MCP服务器，然后开启一个子进程运行这个服务器，从而使得客户端随时可以调用其服务。

2025-04-22 21:30:11 1973 1

原创关于LLM，回答一个好问题（4.14-4.20）

💡社区交流，一直是社区不可或缺的一部分，现在社群数量已接近100个，会出现已有问题被重复回答，或是问题较多自己的问题被遗漏的情况。但，能提出一个好问题，本身就是一件非常有价值的事情！虽然是公益性质的社区，但仍希望能尽可能的解决大家的问题，做起来会很困难，但是“为每个人提供有价值的技术赋能”是我们一直以来的企业愿景，也是「赋范大模型技术社区」建立的初衷。在这样的前提下，我们发起了“回答一个好问题”栏目！并由专人进行维护、整理和编辑，目的是帮助大家更好的学习！

2025-04-22 16:47:44 1042

原创从零到一，3万字详解MCP工具【开发、部署上线、维护】全流程！

MCP基础技术生态结构如下所示。MCP（Model Context Protocol）是一种为了统一大规模模型和工具间通信而设计的协议，它定义了消息格式和通信方式。MCP 协议支持多种传输机制，其中包括 stdio、Server-Sent Events（SSE）和 Streamable HTTP。每种通信方法在不同的应用场景中具有不同的优劣势，适用于不同的需求。1.1.1 Stdio 传输（Standard Input/Output）

2025-04-18 15:03:16 2599

原创不写一行代码，零基础接入MCP！Cursor、阿里云百炼、Open-WebUI、Cherry Studio接入10大最热门MCP工具实战流程！

阿里云百炼平台是一款一站式的大模型开发及应用构建平台，旨在帮助开发者和业务人员快速设计和构建大模型应用。用户可以通过简洁的界面操作，在短时间内开发出大模型应用或训练专属模型，从而将更多精力专注于应用创新。近期，阿里云百炼平台正式推出了全生命周期的MCP（Model-Connect-Protocol）服务，实现了从资源管理到部署运维的全流程自动化。用户仅需5分钟即可快速创建连接MCP服务的智能体（Agent），将大模型技术转化为生产力工具。

2025-04-17 20:00:00 4455

原创关于LLM，回答一个好问题（4.7-4.13）

作为中文互联网头部大模型技术学习聚集地，除了前沿、硬核的干货内容，还有专门负责社群的同事，维护良好的学习氛围，帮助每个阶段的小伙伴都能在社群内获得自己需要的干货内容。而社区交流，一直是「赋范大模型技术社区」不可或缺的一部分，社区内的成员技术、知识、观点的交流，有问题一起解决的学习氛围，是加速成长的秘籍。虽然负责社群运营的小伙伴一直用心管理，但现在社群数量已经接近80个，会出现已有问题被重复回答，或是问题较多，自己的问题被遗漏的情况。能提出一个好问题，本身就是一件非常有价值的事情！

2025-04-16 20:33:52 716

原创 GPT-4.1深度解读与性能评测｜1M长文档检索、前端编程、指令跟随、视觉推理能力介绍与详细测评！

有人嘲讽OpenAI不会取名，4.1模型居然在4.5模型之后发布，简直让人摸不着头脑，但我却认为，在经历了GPT-4.5模型的惨败之后，OpenAI有勇气给新模型取名为GPT-4.1，恰恰是敢于自我批判的一种表现。从模型整体来看，GPT-4.1模型同时融合了o3模型推理能力和GPT-4.5模型的对话能力，外界猜测模型可能同时由o3模型和GPT-4.5模型蒸馏而来，并且同时围绕超长文本检索、前端编程、指令跟随和视觉推理四个方面，进行特定领域的能力优化，使其实用性大幅增强。

2025-04-15 15:16:06 1277 1

原创揭秘Function calling：详解大模型调用工具底层原理，四大优化方案提升Agent性能！

而放眼全球，截至目前，原生Function calling能力能达到工业级水平的，也就只有GPT、Gemini、Claude和DeepSeek-V3-0324四款模型，这四款模型不仅拥有非常高的Function calling准确率，而且还训练得到了多工具并联和串联调用的能力，甚至当外部工具调用错误时还能自动debug，这些模型是当代Agent开发的不二之选。至此，我们就明白了，为什么有的模型有Function calling而有的模型没有，其实都源于训练方法的不同。

2025-04-14 22:32:46 1690

原创 Agent开发必学：Function calling原理与运行过程详解（以DeepSeek-v3-0324为例）

我们都知道，能调用外部工具，是大模型进化为智能体Agent的关键，如果不能使用外部工具，大模型就只能是个简单的聊天机器人，甚至连查询天气都做不到。由于底层技术限制啊，大模型本身是无法和外部工具直接通信的，因此Function calling的思路，就是创建一个外部函数（function）作为中介，一边传递大模型的请求，另一边调用外部工具，最终让大模型能够间接的调用外部工具。

2025-04-11 18:30:00 1607

原创 12000字+2个完整实战案例：写给普通人的MCP入门指南！

MCP，全称是Model Context Protocol，模型上下文协议，由Claude母公司Anthropic于去年11月正式提出。从本质上来说，MCP是一种技术协议，一种智能体Agent开发过程中共同约定的一种规范。这就好比秦始皇的“书同文、车同轨”，在统一的规范下，大家的协作效率就能大幅提高，最终提升智能体Agent的开发效率。截至目前，已上千种MCP工具诞生，在强悍的MCP生态加持下，刚入门的小白也能借助MCP生态开发一个「智谱AI沉思Agent」！

2025-04-11 16:15:00 1269

原创大模型微调（Fine-tuning）全解，需要了解的都在这里

• 分布式训练：支持分布式数据并行（DDP）、 DeepSpeed ZeRO2/ZeRO3、 FSDP 等技术，提升推理加速： ** 提供 BNBWQ、 GPTQ、AQLM、 HQQ、 EETQ 等量化方法，并支持使用 vLLM 和LMDeploy 对推理、评测和部署支持图像、视频和语音等多种模态型训练，涵盖 VQA、 Caption、 OCR、 Grounding 等任务。现在绝大多数开源模型，在开源的时候都会公布两个版本的模型，其一是Base模型，该模型只经过了预训练，没有经过指令微调；

2025-04-10 19:45:00 1272

原创 12项Agent智能体开发框架入门与选型丨工具对比分析与选型建议！

模型能力依赖：如你提到的DeepSeek-V3和GPT-4的强Agent能力可减少框架的复杂度，而弱模型需依赖框架的工程化补偿（如ReAct模式）。角色化设计：内置UserProxyAgent（用户代理）、AssistantAgent（执行AI）、GroupChat（多Agent会话）。可视化编排：支持拖拽式工作流设计（如Coze的节点式编辑器），内置预置模板（客服Bot、数据分析助手等），适合无编程基础的用户快速验证想法。特色功能：支持Tools优先级调度和资源竞争解决（如多个Agent争用GPU）。

2025-04-10 16:30:00 1782

原创全新大模型调用通用范式Responses API调用指南！内置100G文档检索FileSearch详解

Responses API 是 OpenAI 为智能代理（Agents）提供的全新 API 基础构件，它结合了 Chat Completions API 的简洁性与 Assistants API 的内置工具能力，使得代理能够更智能地执行任务。📌 核心特点✅ 简洁易用：继承了 Chat Completions API 的易用性。✅ 增强功能：支持内置工具（Tools），如函数调用（Function Calling）、Web 搜索、文件搜索、计算机控制等。

2025-04-09 19:39:24 1143

原创亲测有效！4个「越用越会」的AI协作心法，提效80%+| Agentic同行计划

本期非常幸运的采访到了流月同学，除了拥有丰富的大模型落地经验，还是资深的技术主管、后端架构师，并且不吝啬在学习和AI使用上的投入，个人累计投入近20W！在刚开始时他也一度认为AI只能帮倒忙，宁愿把钱扔掉也不再使用AI辅助工具，到现在AI提效80%以上！采访过程中，也感受到了流月同学不止有非常丰富的开发经验，对人文的思考、对哲学的思考也非常深刻，如：“康德曾说过：人是目的而不是手段”“不要结果而享受过程，AI是无法替代你的”“AI没有童年，它就没有独特的经历”“不能为了用AI而用AI”……

2025-04-08 22:00:00 553

原创「有问必答栏目」关于LLM，回答一个好问题（3.31-4.6）

Debug的话，首先需要看下报错的日志信息，如果是出现retry字样，大概率是没连上GPT模型，此时需要看下配置文件里面的模型名称、API-KEY和反响代理地址有没有填写正确，而如果是出现类似empty字样，则说明模型没有顺利识别实体，此时可以考虑换成更高性能的模型，比如GPT-4o来构建知识图谱，或者对数据集进行下清洗，使其表意通畅。虽然是公益性质的社区，但仍希望能尽可能的解决大家的问题，做起来会很困难，但是“为每个人提供有价值的技术赋能”是我们一直以来的企业愿景，也是「赋范大模型技术社区」建立的初衷。

2025-04-08 17:23:57 880

原创重写万行代码+重构项目结构，KTransformers最新V0.24版部署与调用实战！

KTransformers（发音为“Quick Transformers”）旨在通过先进的内核优化和计算分布/并行化策略来增强你使用Transformers的体验。KTransformers 是一个灵活、以 Python 为中心的框架，其核心设计理念是可扩展性。与 Transformers 兼容的接口符合 OpenAI 和 Ollama 规范的 RESTful API一个简化版的 ChatGPT 风格 Web UI（最新版已弃用）

2025-04-07 18:42:44 1206

原创「有问必答栏目」关于LLM，回答一个好问题（3.24-3.31）

公益性质的「赋范大模型技术社区」现已集结超3W大模型技术学习者、爱好者！干货技术帮助超400W次成长！作为中文互联网头部大模型技术学习聚集地，除了前沿、硬核的干货内容，还有专门负责社群的同事，维护良好的学习氛围，帮助每个阶段的小伙伴都能在社群内获得自己需要的干货内容。而社区交流，一直是「赋范大模型技术社区」不可或缺的一部分，社区内的成员技术、知识、观点的交流，有问题一起解决的学习氛围，是加速成长的秘籍。

2025-04-02 12:29:57 684

原创【源码级详解】MCP+DeepSeek-V3-0324搭建 mini Manus 开发实战！

本文内容出自九天老师公开课，介绍DeepSeek-V3-0324最新模型，深度结合MCP进行智能体开发实战，带你手搓一个minimanus！本期内容是实战完整部分，DS函数调用详解和MCP讲解可进入社区领取完整版。话不多说，我们直接开始！

2025-04-01 22:45:00 1525

原创 Open AI 官宣将开源推理模型！这是DeepSeek给逼的了（手动狗头

⏰今晚（周二）8:30！🚀九天老师将开启【Agents-SDK+MCP+DeepSeek】公开课直播，从零带你「手搓mini manus」！过去五年，Open AI 以 GPT 系列模型占领高地，而 DeepSeek 的“开源+低成本”组合拳彻底改变了游戏规则。这是继2019开源 GPT-2 后，首次打破“闭源垄断”战略，而这场变革的背后， DeepSeek 成最大推手～这几个月各家大模型你追我赶，多重压力下，Open AI终于想起来自己名字里的“Open”了🤭。OpenAI终于要Open了？

2025-04-01 16:29:23 387

原创 10+年编程经验：拥抱新技术才是立身之本 | Agentic同行计划

为每个人提供最有价值的技术赋能」，2025年我们和赋范空间的小伙伴们一起来！发起的“Agentic 时代同行计划”会和我们的学员一起，分享自己的经历、经验，集结群体的智慧一起拥抱Agentic新时代！受访者：Marmot同学，10+年工作经验，大模型项目落地负责人

2025-03-30 14:06:46 1020

原创 [特殊字符] 欢迎使用赋范大模型技术社区 | Getting started

我猜咱们未来可能会有一些更深的链接，或者会有一些机会合作点什么，为了能更高效愉悦地沟通，不妨先查看这篇「社区使用说明文档」💓～

2025-03-29 18:30:00 860

原创代码能力太弱，如何借助大模型落地企业项目？| Agentic同行计划

想清楚之后借助大模型帮助开发是很快的，比如我现在使用一个开源的RAGflow，我看中了它的知识库能力，想要自己做一个适配自己内部的知识库管理页面，就可以直接使用cursor帮我们开发好前后端实现快速上线。在我刚开始时，非常想要快速的接收所有的学习内容，所以就各种看课程和相关视频，但是自己动手实践比较少，很多内容没有自己从0到1的来一遍，这样导致自己在实际中，总是出现有印象但就是写不出来的尴尬。就像前面说的，现在更多的是要求自己知道怎么使用它就好，之后就是多实践，当我使用的更熟练的时候，还能再变通的去使用。

2025-03-28 16:56:17 1202

空空如也

空空如也