大模型
文章平均质量分 96
5ycode
公众号5ycode,
所有内容公众号最先发布,请大家尊重原创
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
MCP不像想象的那么简单,MCP+数据库,rag之外的另一种解决方案
摘要 MCP(Model Context Protocol)是由Anthropic提出的开放协议,旨在统一大模型与外部数据源的交互标准。该协议通过标准化消息、资源和工具等交互原语,解决数据孤岛问题,使应用只需集成MCP客户端即可调用各类服务。与Function Calling相比,MCP更具通用性和互操作性,支持多数据源和动态发现,形成可复用的工具生态。其核心架构基于客户端-服务器模型,支持多种传输机制,并定义四种消息类型。MCP通过资源机制将各类数据(文本/二进制)暴露给客户端,为AI应用提供灵活的数据接原创 2025-06-21 11:23:13 · 1711 阅读 · 0 评论 -
亲测有效!Win10环境下RAGFlow全栈配置教程(附避坑指南)
做环境管理,单一的python还好一些,我之前安装的是3.9(比较早了)。而有些项目需要3.10,有的需要3.11,有的需要3.12,要么升级,要么安装多套环境。不想用uv,使用conda,建议让kimi写个脚本,把uv.lock里的包都洗出来,洗成。如果你没有修改过docker部署的端口,可以直接使用,如果修改了,需要对应的修改。然而我折腾了一会,安装不上。前端环境需要npm,或者pnpm,我之前一直有对应的环境,我就不折腾了。如果大家自己折腾,建议用uv,直接导入官方提供的,缺有,但是不多。原创 2025-03-17 08:11:57 · 6185 阅读 · 10 评论 -
模型微调之基础篇:模型微调概念以及微调框架
之前我们一直强调,大语言模型(LLM)是概率生成系统。能力边界知识时效性:模型知识截止于训练数据时间点推理局限性:本质是概率预测而非逻辑运算,复杂数学推理易出错(deepseek的架构有所不同)专业领域盲区:缺乏垂直领域知识幻觉现象:可能生成看似合理但实际错误的内容之前一直讲解如何通过各种不同的知识库进行知识片段的检索,并通过提示词临时注入到大模型。从今天开始,我会写一写微调相关的文章。定义:在预训练大模型(如GPT、BERT)的基础上,使用特定领域或任务的数据进行额外训练,使模型适应新任务。原创 2025-03-14 08:29:16 · 1189 阅读 · 0 评论
分享