AI
文章平均质量分 97
gfengwong
IT博客主页:http://wanggf62.com
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
vLLM:高性能大语言模型推理框架源码解析与最佳实践
vLLM 框架的调用流程可以分为初始化阶段和推理阶段两个主要部分。整个流程涉及多个核心组件的协同工作,包括 LLM Engine、Worker、Scheduler、ModelRunner 等类。用户 API 调用↓LLMEngine 初始化↓模型加载与配置初始化↓Worker 池初始化↓请求处理与调度↓Tokenizer 处理输入↓ModelRunner 执行推理↓KV 缓存管理↓结果获取与后处理↓返回生成结果初始化路径。原创 2025-03-28 11:42:21 · 2063 阅读 · 0 评论 -
MCP 智能聊天助手示例项目
本项目是基于MCP (Model Context Protocol)框架的智能聊天助手示例,展示了如何使用大语言模型(LLM)与外部数据源和工具进行集成,实现跨模态、多能力的智能对话系统。MCP (Model Context Protocol)是由Anthropic开源的开放协议,为LLM应用和外部数据源及工具之间的无缝集成提供标准化方式。可以将MCP理解为AI应用的"USB-C接口",就像USB-C为设备提供了与各种外设和配件连接的标准方式一样,MCP为AI模型提供了与不同数据源和工具连接的标准方式。原创 2025-03-21 14:52:11 · 990 阅读 · 0 评论
分享