- 博客(271)
- 收藏
- 关注
原创 【MCP协议生态全景】主流资源平台与选型指南
MCP协议作为AI大模型与外部系统交互的"万能适配器",通过标准化接口实现安全可控的数据和工具集成。目前主流MCP资源平台包括:Anthropic官方参考实现(技术基础)、阿里云百炼(企业级低代码方案)、Smithery(4800+服务的动态路由平台)、mcp.so(8000+服务器的社区聚合平台)等。选型建议:新手开发者优先选择阿里云百炼或官方仓库,企业用户推荐阿里云百炼或mcp.run,特定需求可考虑Smithery或mcp.so。MCP生态的快速发展正大幅降低AI应用开发门槛,推动
2026-01-06 18:57:26
1023
原创 【Cline vs Continue 智能体插件】全方位对比,功能+技术+场景全覆盖
摘要: Cline和Continue是两款定位不同的AI编码协作工具。Cline专注于VS Code内的交互式编码协作,强调人工审核与工具扩展,适合个体开发者进行安全可控的日常开发任务。Continue则主打全链路自动化工作流,支持多环境部署和事件触发,更适合团队协作中的批量任务处理。两者在运行环境、交互模式、功能侧重等方面存在显著差异:Cline提供精细化的文件操作和调试能力,Continue擅长自动化流程和团队协同。选型建议根据开发场景需求:交互式开发选Cline,自动化流程选Continue。(149
2026-01-06 00:25:46
1419
原创 【大模型评测三巨头】LiveBench.ai/Chatbot Arena/DataLearner 对比解析与选型指南
摘要: 大模型选型存在“看指标还是看体验”“选综合还是选垂直”的难题。三个评测平台分别从不同维度提供参考:LiveBench.ai(综合技术指标量化)、OpenLM.ai Chatbot Arena(用户体验盲测评分)和DataLearner代码排行榜(垂直代码场景能力)。三者互补,形成“三维参考系”:技术指标达标(LiveBench)、用户偏好验证(Chatbot Arena)、专业场景适配(DataLearner)。开发者可根据需求组合使用,如综合模型选型先看Global分,C端产品重Elo评分,代码场
2026-01-04 01:37:28
1767
原创 【Open-AutoGLM iOS苹果手机】全网最全,完整部署指南(踩坑全解+原理剖析)
本文详细介绍了如何在iOS设备上部署Open-AutoGLM自动化框架,实现基于大模型的手机自动化操作。主要内容包括: 技术架构解析:从大模型决策到WDA封装层再到iOS真机执行的完整调用链路 iOS与Android的核心技术差异对比,重点说明坐标系统、截图方式等关键适配点 详细的环境准备指南,包括macOS系统要求、必备工具安装和验证步骤 WebDriverAgent(WDA)的核心定位与部署方法,作为iOS自动化的基础组件 部署过程需要满足macOS系统、Xcode开发工具、Python环境等硬性要求,
2025-12-28 18:39:58
1163
原创 【 2025年必藏】8个开箱即用的优质开源智能体(Agent)项目
2025年精选8款优质开源智能体项目,覆盖通用自主代理、多智能体协作和垂直场景应用。核心推荐包括:AutoGPT Platform(可视化配置代理平台)、LangChain Agent(生态完善的开发框架)和AgentGPT(零代码操作)。多智能体协作系统推荐MetaGPT(模拟软件公司协作)和ChatDev(轻量角色扮演)。垂直场景推荐DevOpsGPT(运维自动化)和LlamaIndex Agent(私有数据检索)。轻量型智能体包括BabyAGI(极简任务链)和ChatGPT-Next-Web(增强交互
2025-11-26 21:37:58
1100
原创 【RAG评测方案汇总】GitHub开源工具全览
本文汇总了GitHub上主流的RAG评测开源工具,包括通用框架与专用评测方案。通用框架中,RAGChecker提供细粒度诊断,RAGAS最易用且流行,DeepEval适合工程化集成。专用评测涵盖金融、医疗等垂直领域。文章对比了各框架优劣势,推荐了基础、诊断和工程三种实用组合方案,并给出安装使用要点。RAG评测是确保系统质量的关键环节,开发者可根据需求选择RAGAS快速入门、RAGChecker深度诊断或领域专用工具。
2025-11-12 20:36:23
854
原创 【思维链条CoT与React模式深度解析】AI智能体的核心推理框架
摘要: 本文系统解析了思维链条(CoT)与React模式的技术原理与应用。CoT通过逐步推理提升大模型的逻辑性与可解释性,适用于数学计算、代码调试等任务;React模式通过“思考-行动-观察”循环实现智能体与外部工具的交互,扩展了AI的动态任务处理能力。两者在技术本质(封闭推理vs开放交互)、流程(分步推理vs循环决策)及适用场景上存在显著差异。实践案例展示了结合CoT与React构建智能股票助手的方案,通过分解问题与调用API实现实时数据分析。未来,优化推理链设计、工具适配及性能缓存是提升智能体效能的关键
2025-10-23 09:23:42
1024
原创 【MCP开发部署流程表格分析】MCP架构解析、开发流程、部署方案、安全性分析
有问题请私信或联系邮箱:funian.gm@gmail.com核心概念定义核心作用Resources(资源)服务端提供的文本、文件、数据库记录等数据为AI提供最新外部知识,丰富上下文Prompts(提示词)服务端定义的可复用提示词模板和工作流标准化AI交互模式,简化用户操作(如斜杠命令)Tools(工具)服务端提供的可调用函数扩展AI能力(计算、查询、外部系统交互),是核心特性Sampling(采样)服务端通过客户端向大模型发送生成请求(反向请求)
2025-10-20 10:16:01
1115
原创 【Spring AI 中的工具调用原理解析】工具开发:文件操作、联网搜索、网页抓取、资源下载、PDF生成、工具集中注册
Spring AI工具调用机制解析 Spring AI的工具调用功能使AI模型能够通过外部工具(如API、数据查询等)扩展能力,遵循“应用程序控制”的安全原则。核心流程包括:用户提问→模型判断工具需求→程序执行工具→返回结果给模型→生成最终响应。技术实现基于ToolCallback接口,支持方法注解(@Tool)和函数式编程两种定义方式,其中注解方式更易用。工具调用通过ToolCallingManager管理,提供框架控制和用户控制两种执行模式,确保安全性和灵活性。该机制适用于需要实时数据或复杂计算的场景,
2025-07-13 11:54:13
1364
原创 【AutoDL租赁服务器,通过LLaMA-Factory框架微调大模型】使用LoRA微调Qwen通义千问大模型,包含服务器租赁、镜像与模型部署、数据集以及模型微调等。
本文详细介绍了如何在AutoDL平台租赁4090服务器,通过LLaMA-Factory框架使用LoRA微调Qwen大模型的全流程。内容包括:AutoDL注册认证、服务器租赁配置、JupyterLab控制台操作、模型部署与数据集准备、可视化界面启动等关键步骤。教程重点讲解了LoRA微调方法,相比全量微调可大幅降低计算资源消耗。同时提供了SSH连接服务器的具体操作指引,适合初学者快速掌握大模型微调的核心技术要点。文中配有详细图文说明,帮助读者逐步完成从环境搭建到模型训练的全过程。
2025-02-25 16:41:25
5949
6
原创 【本地部署deepseekR1模型图文详解】Win11本地部署deepseek R1:7B大模型:Ollama+deepseekR1+OpenWebUI+Hyper-V部署教程。 模型参数70亿
本地部署AI大模型全流程指南 本文详细介绍了在Windows系统下部署Ollama平台、Deepseek R1大模型及OpenWebUI界面的完整流程。文章首先概述了各组件功能:Ollama作为本地LLM运行平台,Deepseek R1国产大模型提供深度搜索能力,OpenWebUI提供可视化操作界面,Hyper-V确保虚拟化环境稳定。随后分步指导了Ollama安装、模型路径配置、Deepseek R1 7B模型下载(需20分钟)及终端测试。最后讲解了通过Docker安装OpenWebUI的步骤,包括启用Hy
2025-02-05 10:44:42
14643
12
原创 【图文详解】VMwarePro17虚拟机安装MacOS13苹果系统和安装VMware TooLS详细教程
本章详细介绍:VMwarePro17虚拟机安装MacOS13苹果系统和安装VMware TooLS详细教程
2025-01-22 11:16:25
4152
原创 【大模型应用开发】核心问题深度拆解(原理+方案+落地实践)
本文系统分析了大模型应用开发的10个核心问题,聚焦架构设计、长文本处理、工具调用、RAG流程等关键环节。主要内容包括:1)大模型应用的三层架构(模型能力、业务逻辑、支撑系统);2)长文本处理的拆分-压缩-检索策略;3)工具调用的Schema设计、参数校验与错误回退;4)RAG全流程(查询改写、检索、重排、组包、生成);5)Chunking与索引策略的协同优化。通过原理拆解、方案对比与实践建议,帮助开发者构建高效稳定的大模型应用。
2026-01-09 01:15:18
508
原创 【Git核心操作实战】从初始化到冲突解决与回滚(附完整演示)
本文通过实操演示Git核心操作,帮助开发者快速掌握版本控制技能。首先创建空目录并初始化Git仓库,配置.gitignore文件。随后介绍分支管理策略,通过feature分支实现小步提交开发模式。重点讲解merge合并方式的选择理由及其优势,并演示如何制造和解决代码冲突。文章采用Linux/macOS终端命令,Windows用户可使用Git Bash。每个步骤都包含详细命令示例和技术解析,如.gitignore规则优先级、小步提交优势等,适合Git新手系统学习基础工作流。
2026-01-09 00:57:20
644
原创 【AI Agent Infra】 业务技术深度解析
AI Agent Infra是支撑智能体自主执行复杂任务的技术体系,提供沙箱环境、任务调度、工具集成等核心能力。其技术架构包括:1)Docker/E2B等沙箱环境实现安全隔离;2)LangChain/MetaGPT等框架进行任务分解与调度;3)One-API统一管理工具调用;4)MCP/ACP等协议实现跨Agent通信。典型应用场景包括自动化报告生成、多智能体协作等,通过技术栈组合将AI从交互助手升级为自主工作者。
2026-01-08 11:24:25
680
1
原创 【数据分析技术】SQL+NumPy+Pandas+PyTorch解析
在数据驱动的时代,数据分析技术是从海量数据中挖掘价值的核心工具。SQL作为数据提取的“基石语言”,NumPy/Pandas作为Python数据分析的“双引擎”,PyTorch则是从传统分析迈向深度学习分析的“桥梁”。本文将系统性拆解这四类核心技术的定位、核心能力、实战用法,帮你理清不同场景下的技术选型与落地思路。
2026-01-08 10:37:26
393
原创 【高效的大模型Prompt提示词模版】让AI成为你的协作专家,与AI问答的方式决定内容生成的质量
摘要 本文提出6种提升AI对话效果的Prompt技巧,帮助用户从简单提问升级为精准协作。核心方法包括:1)让AI自主推荐专家角色,获取专业视角;2)通过苏格拉底式追问补全关键信息;3)主动要求AI反驳观点以完善思考;4)预演失败案例提前规避风险;5)从成品范例倒推生成模板;6)采用"通俗+专业"双层解释法学习概念。这些方法覆盖方案策划、决策分析、知识学习等场景,通过角色设定、信息补全、视角碰撞等策略,使AI输出更具针对性和实用性。每个方法都配有可直接套用的模板,用户无需复杂格式记忆,只需
2026-01-07 12:10:26
791
原创 【数据库技术与数据治理]一致性保障与数据质量提升
文章摘要 本文系统探讨了数据库技术与数据处理的核心要素。首先分析了数据库分类及特性,对比关系型、非关系型和NewSQL数据库的适用场景。其次阐述了数据库架构演进历程,从单机到分布式再到云原生架构。然后深入解析了事务ACID原则、索引技术等核心原理。最后从商业和技术价值维度论述了数据的重要性,并介绍了包括数据采集、清洗、存储等在内的全流程处理技术栈。文章为企业在数据库选型和数据治理方面提供了全面的技术参考。
2026-01-07 10:23:02
608
原创 【2026热门编程IDE全对比】传统工具+AI原生新势力
编程IDE市场格局分析 当前编程工具市场呈现"传统IDE+AI工具"双轨并行格局。传统阵营以VS Code、IntelliJ IDEA等为代表,凭借成熟生态和全场景适配占据主流;新兴AI工具如Cursor、阿里Qoder等则基于大模型技术,主打智能代码生成、自然语言交互等创新功能。两类工具在适用场景、AI能力、云协同等方面各具优势:传统IDE适合大型项目开发,AI工具更侧重效率提升;前者生态完善但智能化依赖插件,后者AI原生但工程管理能力较弱。本土化产品在中文交互和云服务集成上表现突出,
2026-01-07 10:02:10
477
原创 【机器人技术】核心原理、产业应用与发展现状(2026最新版)
控制(如ABB的TrueMove™技术),实现高精度力控(±0.1N)。 实时操作系统(RTOS):工业机器人多采用VxWorks、QNX,服务机器人转向Linux+ROS架构。 开发框架:ROS(机器人操作系统)已成为行业标准,支持模块化开发与快速部署。 2.4.3 核心控制算法 机器人控制算法的核心是解决运动学与动力学问题,确保高精度、高稳定性与高实时性: 正向运动学:已知关节角度计算机器人末端位姿,用于轨迹规划。 逆向运动学:已知末端位姿反解关节角度,需处理多解问题(如7轴冗余机器人)。
2026-01-07 00:10:26
656
原创 【后端开发面试高频场景题&设计题】深度解析| 面试全覆盖
本文解析了3个高频后端面试题:分布式缓存一致性、数据库读写分离和接口降级策略。针对缓存一致性,对比了Cache Aside、Write Through等策略的优缺点;在读写分离部分,分析了一主多从架构及主从同步延迟解决方案;接口降级则从分级策略、实现方式和兜底方案展开。文章采用问题描述-分析思路-表格解析的结构,帮助构建完整的后端知识体系,适用于面试准备和技术提升。
2026-01-06 20:10:23
663
原创 【后端开发面试高频场景题&设计题】深度解析| 面试通关必备
本文深度解析3个高频面试场景题和3个系统设计题,覆盖接口幂等性、数据库分库分表、服务熔断降级等核心方向。主要内容包括: 接口幂等性:分析5种保障方案(唯一索引、Token机制、分布式锁等)的原理与适用场景,解决重复请求问题; 分库分表:详解垂直/水平分片策略(范围分片、哈希分片等),应对千万级数据存储挑战,并给出跨分片查询解决方案; 服务熔断与降级:对比两者差异,阐述熔断器状态机模型和降级策略,保障分布式系统稳定性。 采用"问题描述-分析思路-参考答案-考察点"的结构,帮助面试者系统掌握
2026-01-06 20:02:16
824
原创 【后端开发面试高频场景题&设计题】深度解析(万字干货)| 面试通关必备
后端面试高频场景题与设计题解析 摘要:本文针对后端开发面试中的核心题型——场景题与设计题,系统梳理了高频考察点及解决方案。重点分析了缓存三大问题(穿透/击穿/雪崩)、分布式事务方案(2PC/TCC/SAGA等)和接口限流策略(计数器/滑动窗口/漏桶/令牌桶算法),从问题定义、产生原因到技术解决方案进行深度对比。文章采用表格化呈现方式,清晰展示不同场景下的技术选型考量,帮助候选人掌握业务问题拆解、技术方案设计和风险预判等核心能力,提升面试表现。
2026-01-06 19:42:23
873
原创 【Hugging Face平台与技术】开源AI生态的核心引擎
Hugging Face开源AI生态平台技术解析 摘要:Hugging Face作为领先的开源AI平台,构建了覆盖模型、数据、工具链的完整生态。其核心价值在于提供10万+预训练模型和2万+数据集,通过统一API实现快速开发。平台包含三大核心组件:Model Hub(模型仓库)、Dataset Hub(数据集仓库)和开发工具链(Transformers等)。关键技术包括: 模型民主化:支持NLP/CV/语音等多领域模型 开发标准化:提供从数据处理到部署的全流程工具 部署灵活性:支持云端、本地和边缘设备 平台优
2026-01-06 15:28:10
604
原创 【Spring AI Alibaba技术详细解析】Java生态企业级AI应用开发全指南
Spring AI Alibaba是一款开源企业级AI开发框架,基于Spring AI构建并深度集成阿里云生态,为Java开发者提供一站式AI应用开发解决方案。该框架解决了AI开发工具碎片化、国内大模型适配复杂等问题,支持智能体编排、RAG检索、模型适配等全栈能力,具备企业级服务治理特性。其核心架构分为基础层、核心层和应用层,通过ChatClient统一模型调用接口,支持通义千问等多种模型。Graph框架实现可视化流程编排,开发者可快速构建智能问答、多智能体协作等应用。相比原生Spring AI,它增强了企
2026-01-06 14:49:30
672
原创 【国内/国外权威技术网站】覆盖实时资讯、学术预印本、企业博客、专业媒体
本文整理了国内外权威科技网站资源,涵盖AI、创业、硬件、学术等前沿领域。国内推荐量子位、36氪等中文站点,国外精选TechCrunch、arXiv等英文平台。针对不同需求提供组合方案,如AI开发者可关注量子位+arXiv等,并给出RSS订阅、社交追踪等高效获取信息的技巧。通过合理筛选3-5个核心网站,配合订阅工具,可构建专属科技前沿信息矩阵。
2026-01-06 12:09:31
901
原创 【GitHub开源协议】安全保障——从法律边界到工程实践
开源协议是开源项目的法律契约,明确代码使用边界和责任划分。主流协议如MIT、Apache 2.0、GPL、BSD各有侧重:MIT最宽松但无专利保障;Apache 2.0提供专利授权和商标保护;GPL具有传染性要求衍生作品开源;BSD注重声誉保护。企业应建立开源治理体系,通过自动化工具检测协议合规性,避免混用风险,并定期审计依赖项。选择合适协议、遵守条款规范、进行安全测试是保障开源项目安全使用的关键。
2026-01-06 10:10:28
537
原创 【Eino:Go语言LLM应用】开发框架全维度技术解析
Eino是由CloudWeGo社区推出的Go语言LLM应用开发框架,旨在提供简洁、可扩展、高效的开发体验。其核心价值包括组件化复用、强大编排能力、简洁API设计、最佳实践沉淀和全生命周期工具链支持。Eino采用模块化架构,主仓库提供核心基础能力,扩展仓库实现组件与工具集。框架严格遵循Go语言惯例,通过强类型约束和编排框架确保开发安全性与效率,覆盖从开发到运维的全生命周期需求。
2026-01-06 09:51:11
689
原创 【第三方集成大模型API平台对比】CursorAI(api.cursorai.art) vs 硅基流动(SiliconFlow)
摘要: CursorAI与硅基流动在AI模型服务平台定位上差异显著。CursorAI作为API聚合平台,提供OpenAI、Claude等16+商业模型的统一接入,适合轻量级测试场景,但存在1.2-1.5倍的原生API加价。硅基流动则以自研推理引擎为核心,覆盖100+商业/开源模型,实现10倍加速和50%-90%成本优化,支持百万级并发,尤其适配企业级高负载场景。关键差异在于:CursorAI侧重多厂商接入便利性,硅基流动则通过技术优化解决性能与成本痛点,并提供国产模型深度适配,更适合合规要求高、成本敏感的企
2026-01-05 19:20:02
1039
原创 【Golang】高频面试题超详细解析
本文系统梳理了Go语言面试核心知识点,涵盖基础语法、并发编程和底层原理三大模块。主要内容包括: 数组与切片的内存结构差异及切片扩容机制(翻倍/1.25倍增长) Map的哈希表实现原理、扩容机制及并发安全方案(sync.Mutex/sync.Map) 接口的隐式实现特性及iface/eface底层结构区别 并发原语sync.WaitGroup、channel的缓冲机制与select多路复用 垃圾回收的三色标记算法与内存逃逸分析 每个知识点均包含代码示例、底层实现和易错点提示,适合中高级Go开发者全面准备技术面
2026-01-05 17:45:18
920
原创 【向量数据库】大模型应用背景下向量数据库技术解析与主流产品对比
本文系统解析了向量数据库的核心技术原理、主流产品对比及大模型应用场景。向量数据库通过高效存储和检索高维语义向量,解决了大模型知识过时、幻觉问题和数据隐私等痛点。核心技术包括向量生成、相似度计算、索引优化和分布式架构,其中HNSW、IVF等索引技术显著提升检索效率。对比分析了Milvus、Weaviate等6款主流产品,指出企业级、多模态等不同场景的最佳选择。文章还详细阐述了向量生成、混合检索等关键技术,为大模型开发者提供了全面的选型和应用指南。
2026-01-05 17:08:57
850
原创 【 LangGraph技术详细解析】原理、组件、实战与高级技巧
摘要: LangGraph是LangChain生态下的图结构工作流框架,专为构建复杂、有状态、多智能体协作的AI应用设计。其核心优势包括支持循环、条件分支和并行执行的图原生架构,强状态管理(短期记忆+持久化),以及生产级特性(故障恢复、重试机制)。通过“状态-节点-边”三元组实现灵活编排,LangGraph适用于智能客服、自动化运维等场景。相比传统线性Chain或DAG框架,它更擅长处理非线性流程和状态持久化。实战示例展示了如何构建多轮工具调用的问答Agent,涵盖状态定义、节点逻辑、图编译与执行。辅助组件
2026-01-05 01:04:05
1289
原创 【JMeter压力测试】技术详细解析:原理、组件、实战与优化
JMeter是一款开源的负载测试工具,支持多协议并发测试,适用于接口、Web应用等性能评估。其核心原理是通过多线程模拟用户请求,结合线程组、采样器、监听器等组件完成压力测试。测试流程包括环境准备、脚本编写(支持手动、录制等方式)、场景设计和参数化配置。JMeter可进行并发压力测试、容量测试和疲劳测试,通过CSV参数化实现多用户模拟,并生成聚合报告等可视化结果分析系统性能。
2026-01-05 00:52:47
820
原创 【网络抓包技术详细解析】原理、工具、实战与安全合规
网络抓包是后端开发、运维与安全分析的核心技能,通过捕获和分析网络数据包来排查问题。本文从六个维度系统解析网络抓包技术: 核心原理:网卡切换为混杂模式捕获数据包,逐层解析协议栈并存储为PCAP格式。 工具选型:对比Wireshark、tcpdump等底层工具与Charles等代理工具的适用场景,说明命令行与图形化工具的差异。 实战流程:涵盖环境准备、权限获取、过滤规则设计及数据包捕获与分析步骤。 过滤规则:区分BPF抓包过滤与Wireshark显示过滤,提供精准定位流量的语法示例。 高级技巧:解决HTTPS解
2026-01-05 00:44:49
646
原创 【后端开发程序员素养】AI/智能体/vibe coding 时代,后端开发的核心素养与技术特点
《AI时代后端开发者的五大核心能力》摘要:在AI普及和智能体落地的技术背景下,后端开发已从单一功能实现转向智能协同、工程化落地的复合角色。文章从五个维度拆解必备技能:1)传统核心素养(编程、数据库、API设计等);2)AI/智能体技术能力(LLM集成、向量数据库等);3)vibe coding适配(AI协作开发);4)架构升级(云原生、LLMOps);5)综合软素养(批判思维、产品思维等)。强调后端开发者需以传统能力为根基,叠加AI技能和软素养,实现从"代码编写者"到"智能应用
2026-01-04 00:46:14
577
原创 【RAG技术全面详解】核心架构、工作流程、实战代码及技术对比
RAG技术(检索增强生成)通过结合检索系统与大语言模型,有效解决LLM知识过时和模型幻觉问题。其核心架构分为数据层(知识库预处理)、检索层(向量化与相似性匹配)和生成层(答案合成)。关键技术包括文本分割、向量化模型、向量存储和提示词工程,支持企业级知识问答、客服等场景。工作流程分为离线数据处理和在线检索生成两阶段,通过LangChain等框架可实现本地PDF文档问答系统。该技术无需微调模型即可更新知识,具有成本低、可信度高、可追溯等优势。
2026-01-04 00:33:33
618
原创 【FastAPI解析】异步支持、类型提示驱动、自动文档生成、主流框架对比
摘要:FastAPI是一款高性能Python Web框架,专为构建API接口设计,基于Starlette和Pydantic实现异步支持与类型提示驱动开发。核心特性包括自动生成API文档、强大数据校验、内置依赖注入系统等,性能接近Node.js/Go。相比Flask和Django,FastAPI在API开发效率和性能方面具有显著优势,适合微服务、高并发API等场景。本文从核心特性、框架对比和实战案例三个维度全面解析FastAPI,帮助开发者快速掌握这一现代Web框架。
2026-01-04 00:24:20
667
原创 【大模型核心专业术语】解析(2025最新版)
本文系统梳理了大模型领域的核心术语,涵盖基础架构、训练优化、推理应用、部署压缩和评估安全五大类别。基础架构部分介绍LLM、Transformer等关键技术;训练优化类解析预训练、微调等模型开发方法;推理应用类探讨提示工程、思维链等实用技术;部署压缩类聚焦模型量化、知识蒸馏等轻量化方案;评估安全类则关注模型性能与伦理问题。通过表格形式简明解析每个术语的核心概念,为开发者提供快速查阅的实用指南,助力大模型开发与应用。
2026-01-04 00:14:27
968
原创 【Langchain拆解】核心信息、架构分层、核心组件、实战代码
文章摘要 LangChain是一个开源框架,用于构建基于大语言模型(LLM)的应用程序,通过组件化设计解决LLM的局限性(如上下文窗口有限、缺乏外部数据连接)。其核心架构分为三层: 基础层:集成LLM和文本向量化模型,提供统一调用接口。 核心组件层:包含Prompt模板、Chains、向量存储、Agent等模块,支持复杂流程编排。 应用层:提供RAG、Agent等场景化模板,加速开发。 实战案例展示了: 个性化文案生成:通过Prompt模板和Chain动态生成商品描述。 本地文档问答(RAG):结合向量检索
2026-01-04 00:09:06
946
原创 【MCP服务仓库】awesome-mcp-servers 仓库详细介绍
还包含 Monitoring(监控)、Location Services(位置服务)、Marketing(营销)、Cloud Platforms(云平台)、Workflow Automation(工作流自动化)、Identity(身份)、Language & Translation(语言翻译)、IoT(物联网)、Art & Literature(艺术与文学)、Data Platforms(数据平台)、Robotics & Physical AI(机器人与物理 AI)等分类,预留扩展空间。
2026-01-04 00:01:47
784
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅