自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 收藏
  • 关注

原创 关于LLM微调&数据集,回答一个好问题

栏目涵盖了微调的主要目的、微调后能力变化的原因、数据量不足的解决方案、数据集清洗的可行性、多模态数据微调的适用性等多个技术问题,并提供了详细的解答和建议。此外,社区还提供了硬件配置自查表,帮助成员评估模型效果和处理时序数据。社区鼓励成员提出具体、明确的问题,并提供了多种途径来获取答案,包括社群提问、直播答疑和智能搜索等。赋范大模型技术社区致力于为成员提供最有价值的技术赋能,内容完全免费,涵盖工业级方案、企业实战项目和技术直播公开课等。

2025-05-22 21:34:44 724

原创 5分钟打造一个AI出行助手!最新版CherryStudio+高德MCP打造个人出行规划助理

本文通过CherryStudio和高德地图MCP,指导用户如何打造一个AI出行助手。首先,用户需下载并安装CherryStudio,然后获取大模型API-Key,如DeepSeek模型。接着,配置高德地图MCP服务器,包括注册高德开放平台、获取MCPkey,并在CherryStudio中设置MCP服务器。最后,通过调用高德MCP,用户可以规划行程,如旅游计划或城市步行路线。整个过程简单易行,即使是零基础用户也能轻松上手。此外,文章还提供了其他MCP工具的链接,供用户根据需求选择使用。

2025-05-21 19:52:32 542

原创 实测最佳编程Agent!OpenAI最新Codex快速上手指南

一、Codex核心特性介绍Codex介绍主页:https://openai.com/index/introducing-codex/ OpenAI Codex(2025研究预览版)是一个基于云端的软件工程智能体,能够并行处理多项编程任务。它可以根据用户的自然语言指令自动编写代码、回答代码库相关的问题、修复代码中的错误,甚至为代码仓库生成Pull Request提案 。每个任务都会在云端一个隔离的沙盒容器中独立执行,并预先加载用户的代码仓库环境。这意味着 Codex 能读取和编辑仓库中的文件,运

2025-05-20 14:32:30 774

原创 三本生逆袭算法岗,这份求职+学习经验请收好

「Agentic时代同行计划」旨在集结群体智慧,分享个人经历与经验,共同迎接技术新时代。受访者Ren,三本自学背景,转行成为大模型开发工程师,分享了他的职业转型之路。Ren从通信工程专业自学转行,经历了考研失败、销售工作,最终通过自学和实习,成功进入大模型开发领域。他强调,解决问题的能力是核心竞争力,而非学历或专业背景。Ren通过实际工作经验,展示了如何通过数据分析和问题解决,提升业务指标,从而获得职业机会。他还分享了自学大模型开发的诀窍,强调边学边做的重要性,并建议求职者关注行业需求,学习最具性价比的技术

2025-05-16 17:15:34 728

原创 【源码级开发】Qwen3接入MCP,企业级智能体开发实战!

2.1 MCP服务器(server)与客户端(client)概念介绍不同于Function calling技术,MCP技术是对于大模型和外部工具的另一种划分方式,也就是说在MCP技术体系中,此时MCP会将外部工具运行脚本称作服务器,而接入这些外部工具的大模型运行环境称作客户端。一个客户端可以接入多个不同类型的服务器的,但要求是都可以遵循MCP通信协议。简单理解就是MCP服务器的输出内容是一种标准格式的内容,只能被MCP客户端所识别。

2025-05-16 17:10:22 1138

原创 可能是全网唯一的,公益大模型技术成长营

我们就是要让你在一次次亲自动手、一次次解决真实问题的过程中,把那些看似高深的技术点,彻底嚼烂了、吸收透了,真正内化成你自己的看家本领!所以,在「大模型实战成长营」里,我们摒弃了那种“填鸭式”的理论灌输和“碎片化”的知识点堆砌!「大模型实战成长营」致力于打造一个真正为初学者着想,真正能让你学到东西,真正带你从零开始做出看得见、摸得着的成果,实现实实在在的技术进步……而到了实战环节,遇到的可能是演示ChatGPT的聊天界面讲解,或是主流大模型的安装部署、API调用,实际落地时发现学到的只有玩具!

2025-05-15 16:00:00 1012

原创 【含教程】MCP今年最大更新,企业级流式HTTP功能全面上线!

MCP工具长期以来主要依赖SSE传输进行异地通信,但其并发性和稳定性不足,难以满足企业级应用需求。为改进这一问题,开发者提出采用流式HTTP传输技术,该技术具备更高并发性、更稳定通信及更易集成部署的特点。MCP官方于2月初在GitHub上提出此方案,并在3月发布流式HTTP通信协议,5月9日的1.8.0版本更新中正式加入了HTTP流式MCP服务器的功能支持。此次更新标志着MCP技术迈向企业级应用的重要一步。公开课详细介绍了流式HTTP MCP服务器的开发、测试、部署流程,并提供了完整的功能测试客户端脚本,助

2025-05-15 11:37:03 1085

原创 「大模型实战成长营」上线!从0到企业级复现,跟我们一起打通AI能力闭环

「大模型技术实战成长营」正式上线,这是一个面向全社区成员的免费、无门槛长期项目,旨在帮助开发者从零基础到独立复现项目,最终掌握企业级大模型应用能力。成长营提供五大阶段任务,包括任务卡、教程课件、视频讲解等资源,强调实践驱动的学习路径,帮助学员建立技术资产,如可展示的LLM实战项目,并有机会获得社区勋章、实物周边等激励。社区已有超过3万成员,提供活跃的讨论和互助环境,确保学习过程中的可见性和成就感。成长营由赋范大模型技术社区发起,完全免费,旨在降低技术学习门槛,推动行业进步。参与者需具备基础Python知识和

2025-05-14 15:11:52 521

原创 手把手带你【开发】自己的专属MCP工具,再将其部署上线+进行本地维护

实时下载和运行工具包的便捷性,使得开发工作更加高效,能够快速迭代和创新,同时促进了开源社区的蓬勃发展。不过需要注意的是,MCP只提供了Streamable HTTP协议层的支持,也就是规范了MCP客户端在使用Streamable HTTP通信时的通信规则,而并没有提供相关的SDK客户端。也就是说,从表面上来看,我们是填写了MCP工具就能使一些客户端自动连接MCP服务器,实际上是首次运行的时候,MCP客户端会先下载这些MCP服务器,然后开启一个子进程运行这个服务器,从而使得客户端随时可以调用其服务。

2025-04-22 21:30:11 1973 1

原创 关于LLM,回答一个好问题(4.14-4.20)

💡社区交流,一直是社区不可或缺的一部分,现在社群数量已接近100个,会出现已有问题被重复回答,或是问题较多自己的问题被遗漏的情况。但,能提出一个好问题,本身就是一件非常有价值的事情!虽然是公益性质的社区,但仍希望能尽可能的解决大家的问题,做起来会很困难,但是“为每个人提供有价值的技术赋能”是我们一直以来的企业愿景,也是「赋范大模型技术社区」建立的初衷。在这样的前提下,我们发起了“回答一个好问题”栏目!并由专人进行维护、整理和编辑,目的是帮助大家更好的学习!

2025-04-22 16:47:44 1042

原创 从零到一,3万字详解MCP工具【开发、部署上线、维护】全流程!

MCP基础技术生态结构如下所示。MCP(Model Context Protocol)是一种为了统一大规模模型和工具间通信而设计的协议,它定义了消息格式和通信方式。MCP 协议支持多种传输机制,其中包括 stdio、Server-Sent Events(SSE) 和 Streamable HTTP。每种通信方法在不同的应用场景中具有不同的优劣势,适用于不同的需求。1.1.1 Stdio 传输(Standard Input/Output)

2025-04-18 15:03:16 2599

原创 不写一行代码,零基础接入MCP!Cursor、阿里云百炼、Open-WebUI、Cherry Studio接入10大最热门MCP工具实战流程!

阿里云百炼平台是一款一站式的大模型开发及应用构建平台,旨在帮助开发者和业务人员快速设计和构建大模型应用。用户可以通过简洁的界面操作,在短时间内开发出大模型应用或训练专属模型,从而将更多精力专注于应用创新。近期,阿里云百炼平台正式推出了全生命周期的MCP(Model-Connect-Protocol)服务,实现了从资源管理到部署运维的全流程自动化。用户仅需5分钟即可快速创建连接MCP服务的智能体(Agent),将大模型技术转化为生产力工具。

2025-04-17 20:00:00 4455

原创 关于LLM,回答一个好问题(4.7-4.13)

作为中文互联网头部大模型技术学习聚集地,除了前沿、硬核的干货内容,还有专门负责社群的同事,维护良好的学习氛围,帮助每个阶段的小伙伴都能在社群内获得自己需要的干货内容。而社区交流,一直是「赋范大模型技术社区」不可或缺的一部分,社区内的成员技术、知识、观点的交流,有问题一起解决的学习氛围,是加速成长的秘籍。虽然负责社群运营的小伙伴一直用心管理,但现在社群数量已经接近80个,会出现已有问题被重复回答,或是问题较多,自己的问题被遗漏的情况。能提出一个好问题,本身就是一件非常有价值的事情!

2025-04-16 20:33:52 716

原创 GPT-4.1深度解读与性能评测|1M长文档检索、前端编程、指令跟随、视觉推理能力介绍与详细测评!

有人嘲讽OpenAI不会取名,4.1模型居然在4.5模型之后发布,简直让人摸不着头脑,但我却认为,在经历了GPT-4.5模型的惨败之后,OpenAI有勇气给新模型取名为GPT-4.1,恰恰是敢于自我批判的一种表现。从模型整体来看,GPT-4.1模型同时融合了o3模型推理能力和GPT-4.5模型的对话能力,外界猜测模型可能同时由o3模型和GPT-4.5模型蒸馏而来,并且同时围绕超长文本检索、前端编程、指令跟随和视觉推理四个方面,进行特定领域的能力优化,使其实用性大幅增强。

2025-04-15 15:16:06 1277 1

原创 揭秘Function calling:详解大模型调用工具底层原理,四大优化方案提升Agent性能!

而放眼全球,截至目前,原生Function calling能力能达到工业级水平的,也就只有GPT、Gemini、Claude和DeepSeek-V3-0324四款模型,这四款模型不仅拥有非常高的Function calling准确率,而且还训练得到了多工具并联和串联调用的能力,甚至当外部工具调用错误时还能自动debug,这些模型是当代Agent开发的不二之选。至此,我们就明白了,为什么有的模型有Function calling而有的模型没有,其实都源于训练方法的不同。

2025-04-14 22:32:46 1690

原创 Agent开发必学:Function calling原理与运行过程详解(以DeepSeek-v3-0324为例)

我们都知道,能调用外部工具,是大模型进化为智能体Agent的关键,如果不能使用外部工具,大模型就只能是个简单的聊天机器人,甚至连查询天气都做不到。由于底层技术限制啊,大模型本身是无法和外部工具直接通信的,因此Function calling的思路,就是创建一个外部函数(function)作为中介,一边传递大模型的请求,另一边调用外部工具,最终让大模型能够间接的调用外部工具。

2025-04-11 18:30:00 1607

原创 12000字+2个完整实战案例:写给普通人的MCP入门指南!

MCP,全称是Model Context Protocol,模型上下文协议,由Claude母公司Anthropic于去年11月正式提出。从本质上来说,MCP是一种技术协议,一种智能体Agent开发过程中共同约定的一种规范。这就好比秦始皇的“书同文、车同轨”,在统一的规范下,大家的协作效率就能大幅提高,最终提升智能体Agent的开发效率。截至目前,已上千种MCP工具诞生,在强悍的MCP生态加持下, 刚入门的小白也能借助MCP生态开发一个「智谱AI沉思Agent」!

2025-04-11 16:15:00 1269

原创 大模型微调(Fine-tuning)全解,需要了解的都在这里

• 分布式训练: 支持分布式数据并行(DDP)、 DeepSpeed ZeRO2/ZeRO3、 FSDP 等技术,提升推 理加速: ** 提供 BNBWQ、 GPTQ、AQLM、 HQQ、 EETQ 等量化方法,并支持使用 vLLM 和LMDeploy 对推理、评测和部署 支持图像、视频和语音等多种模态型训练,涵盖 VQA、 Caption、 OCR、 Grounding 等任务。现在绝大多数开源模型,在开源的时候都会公布两个版本的模型,其一是Base模型,该模型只经过了预 训练,没有经过指令微调;

2025-04-10 19:45:00 1272

原创 12项Agent智能体开发框架入门与选型丨工具对比分析与选型建议!

模型能力依赖:如你提到的DeepSeek-V3和GPT-4的强Agent能力可减少框架的复杂度,而弱模型需依赖框架的工程化补偿(如ReAct模式)。角色化设计:内置UserProxyAgent(用户代理)、AssistantAgent(执行AI)、GroupChat(多Agent会话)。可视化编排:支持拖拽式工作流设计(如Coze的节点式编辑器),内置预置模板(客服Bot、数据分析助手等) ,适合无编程基础的用户快速验证想法。特色功能:支持Tools优先级调度和资源竞争解决(如多个Agent争用GPU)。

2025-04-10 16:30:00 1782

原创 全新大模型调用通用范式Responses API调用指南!内置100G文档检索FileSearch详解

Responses API 是 OpenAI 为智能代理(Agents)提供的全新 API 基础构件,它结合了 Chat Completions API 的简洁性 与 Assistants API 的内置工具能力,使得代理能够更智能地执行任务。📌 核心特点✅ 简洁易用:继承了 Chat Completions API 的易用性。✅ 增强功能:支持内置工具(Tools),如函数调用(Function Calling)、Web 搜索、文件搜索、计算机控制等。

2025-04-09 19:39:24 1143

原创 亲测有效!4个「越用越会」的AI协作心法,提效80%+| Agentic同行计划

本期非常幸运的采访到了流月同学,除了拥有丰富的大模型落地经验,还是资深的技术主管、后端架构师,并且不吝啬在学习和AI使用上的投入,个人累计投入近20W!在刚开始时他也一度认为AI只能帮倒忙,宁愿把钱扔掉也不再使用AI辅助工具,到现在AI提效80%以上!采访过程中,也感受到了流月同学不止有非常丰富的开发经验,对人文的思考、对哲学的思考也非常深刻,如:“康德曾说过:人是目的而不是手段”“不要结果而享受过程,AI是无法替代你的”“AI没有童年,它就没有独特的经历”“不能为了用AI而用AI”……

2025-04-08 22:00:00 553

原创 「有问必答栏目」关于LLM,回答一个好问题(3.31-4.6)

Debug的话,首先需要看下报错的日志信息,如果是出现retry字样,大概率是没连上GPT模型,此时需要看下配置文件里面的模型名称、API-KEY和反响代理地址有没有填写正确,而如果是出现类似empty字样,则说明模型没有顺利识别实体,此时可以考虑换成更高性能的模型,比如GPT-4o来构建知识图谱,或者对数据集进行下清洗,使其表意通畅。虽然是公益性质的社区,但仍希望能尽可能的解决大家的问题,做起来会很困难,但是“为每个人提供有价值的技术赋能”是我们一直以来的企业愿景,也是「赋范大模型技术社区」建立的初衷。

2025-04-08 17:23:57 880

原创 重写万行代码+重构项目结构,KTransformers最新V0.24版部署与调用实战!

KTransformers(发音为“Quick Transformers”)旨在通过先进的内核优化和计算分布/并行化策略 来增强你使用Transformers的体验。KTransformers 是一个灵活、以 Python 为中心的框架,其核心设计理念是可扩展性。与 Transformers 兼容的接口符合 OpenAI 和 Ollama 规范的 RESTful API一个简化版的 ChatGPT 风格 Web UI(最新版已弃用)

2025-04-07 18:42:44 1206

原创 「有问必答栏目」关于LLM,回答一个好问题(3.24-3.31)

公益性质的「赋范大模型技术社区」现已集结超3W大模型技术学习者、爱好者!干货技术帮助超400W次成长!作为中文互联网头部大模型技术学习聚集地,除了前沿、硬核的干货内容,还有专门负责社群的同事,维护良好的学习氛围,帮助每个阶段的小伙伴都能在社群内获得自己需要的干货内容。而社区交流,一直是「赋范大模型技术社区」不可或缺的一部分,社区内的成员技术、知识、观点的交流,有问题一起解决的学习氛围,是加速成长的秘籍。

2025-04-02 12:29:57 684

原创 【源码级详解】MCP+DeepSeek-V3-0324搭建 mini Manus 开发实战!

本文内容出自九天老师公开课,介绍DeepSeek-V3-0324最新模型,深度结合MCP进行智能体开发实战,带你手搓一个minimanus!本期内容是实战完整部分,DS函数调用详解和MCP讲解可进入社区领取完整版。话不多说,我们直接开始!

2025-04-01 22:45:00 1525

原创 Open AI 官宣将开源推理模型!这是DeepSeek给逼的了(手动狗头

⏰今晚(周二)8:30!🚀九天老师将开启【Agents-SDK+MCP+DeepSeek】公开课直播,从零带你「手搓mini manus」!过去五年,Open AI 以 GPT 系列模型占领高地,而 DeepSeek 的“开源+低成本”组合拳彻底改变了游戏规则。这是继2019开源 GPT-2 后,首次打破“闭源垄断”战略,而这场变革的背后, DeepSeek 成最大推手~这几个月各家大模型你追我赶,多重压力下,Open AI终于想起来自己名字里的“Open”了🤭。OpenAI终于要Open了?

2025-04-01 16:29:23 387

原创 10+年编程经验:拥抱新技术才是立身之本 | Agentic同行计划

为每个人提供最有价值的技术赋能」,2025年我们和赋范空间的小伙伴们一起来!发起的“Agentic 时代同行计划”会和我们的学员一起,分享自己的经历、经验,集结群体的智慧一起拥抱Agentic新时代!受访者:Marmot同学,10+年工作经验,大模型项目落地负责人

2025-03-30 14:06:46 1020

原创 [特殊字符] 欢迎使用赋范大模型技术社区 | Getting started

我猜咱们未来可能会有一些更深的链接,或者会有一些机会合作点什么,为了能更高效愉悦地沟通,不妨先查看这篇「社区使用说明文档」💓~

2025-03-29 18:30:00 860

原创 代码能力太弱,如何借助大模型落地企业项目?| Agentic同行计划

想清楚之后借助大模型帮助开发是很快的,比如我现在使用一个开源的RAGflow,我看中了它的知识库能力,想要自己做一个适配自己内部的知识库管理页面,就可以直接使用cursor帮我们开发好前后端实现快速上线。在我刚开始时,非常想要快速的接收所有的学习内容,所以就各种看课程和相关视频,但是自己动手实践比较少,很多内容没有自己从0到1的来一遍,这样导致自己在实际中,总是出现有印象但就是写不出来的尴尬。就像前面说的,现在更多的是要求自己知道怎么使用它就好,之后就是多实践,当我使用的更熟练的时候,还能再变通的去使用。

2025-03-28 16:56:17 1202

原创 花费上百万部署DeepSeek,为什么只能当“陪聊”?0基础搞懂Agent开发框架 | 科普向

AutoGen是微软提出的AI Agent开发框架,也是当下主流开发框架之一。AutoGen框架的第一大特色是支持创建对话式应用。也就是说它构建多代理的方式是使多个智能体能够相互交流,从而促进不同智能体之间的合作以完成最终的任务。简单的理解就是这个框架可以让不同的Agent建立起通信的连接,然后它提供给开发者的使用方式是,其一可以为每个Agent自定义大模型、角色、工具及行为。其二可以创建不同的对话模式,包括一问一答、联合聊天、分层聊天等等,从而实现高度个性化的应用场景设计。

2025-03-27 18:52:20 762

原创 最强Agent大模型!DeepSeek-V3-0324模型详细介绍与深度评测!

实际上,新款V3模型是国内首款、也是全球最强的具备强推理性能的对话模型,而在Agent技术大爆发的今天,这款模型才是DeepSeek盛名之下第一款具备工业级Agent开发能力的基础模型,甚至我相信未来,这款模型的影响力将不输于DeepSeek-R1模型。并且,得益于DeepSeek V3模型架构和R1模型架构完全一致,本地部署的R1模型可以无缝切换到V3模型,而若想进一步深入学习V3模型的Agent开发技术,也欢迎大家扫码加入大模型技术社区,我将持续为大家提供前沿技术视野和技术干货教学。

2025-03-27 16:50:15 1227

原创 一站式解决Deepseek部署硬件问题,各版本需求配置、预算、注意事项全覆盖!

一站式解决你的硬件配置问题~

2025-03-26 20:58:40 2913

原创 从0手撕代码搭建MCP Client与Server!详解DeepSeek、ollama、vLLM接入MCP实战!

本期内容详解学习MCP必备技术基础,讲解MCP客户端、服务器开发方法及二者接入流程等等。

2025-03-25 19:00:16 20355

原创 搞大模型开发Dify够用吗?详解企业级大模型项目落地的核心技术要求丨Agentic同行计划

从“陪聊”到“生产力”:企业级大模型项目落地的核心技术要求

2025-03-24 19:12:59 776

原创 微调 vs RAG:大模型落地应该怎么选?看完这篇你就懂了!

“垂直领域应该用微调还是RAG?”“我是要做金融领域的大模型开发,选微调还是RAG?

2025-03-20 16:57:03 580

原创 手把手教你,动手写一个MCP Server并在 Cline中使用!

「MCP技术实战」来啦‼️带你从0到1快速掌握这项爆火🔥Agent技术!

2025-03-20 14:58:03 10809 1

原创 终于有人把MCP讲透了!(附MCP实战完整代码)

一篇手把手带你快速入门MCP的技术实战教程!!

2025-03-19 19:35:22 18171 7

原创 双非硕士转行大模型,拒绝百度算法offer,入职鹅厂的核心能力是什么? | Agentic同行计划

九天老师的python课程至,今仍然是我看了市面上全部python课程讲的最清晰易懂的(尤其是对我这种从上大学开始已经七八年再没接触任何数学知识的人来说,真的是救命稻草!花钱上课的目的,我觉得不管是校招还是转行,最需要的首先是框架明确,思路梳理清晰,知道自己未来要投递的方向需要哪些技能,JD一般会怎么设置(虽然也是跟菜菜老师学的。我觉得是自己根据自己,不管是在校期间的项目场景还是在企业的业务场景,能认真思考哪些环节是可以用大模型或者Agent 实现的,首先明确能干活的场景。

2025-03-15 00:14:45 857

原创 消费级显卡微调工业级大模型!仅需20G显存,QwQ-32B高效微调实战!

QwQ微调实战教程来啦,最低20G显存,快速打造定制化QwQ-32B推理大模型!

2025-03-14 19:26:35 2728

原创 60G内存+14G显存运行满血DeepSeek R1!Ktransformers+Unsloth联合部署方案实践!

采用KTransformers部署Unsloth动态量化DeepSeek R1满血模型的全网最高性价比部署方案!

2025-03-13 21:01:12 2478

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除