大数据和大模型结合必须了解的几个核心技术点

自己做的笔记,数据和大模型结合,必须要了解的几个知识点。

MCP

MCP 起源于 2024 年 11 月 25 日 Anthropic 发布的文章:Introducing the Model Context Protocol,它的目标是实现大型语言模型(LLM)与外部数据源和工具的无缝集成,用来在大模型和数据源之间建立安全双向的链接。

简单的说,MCP的目标是成为 AI 领域的"HTTP 协议",推动 LLM 应用的标准化。

  • MCP Hosts(MCP 应用):如Claude Desktop、IDE、AI应用等,希望通过MCP访问数据或工具。

  • MCP Clients(MCP 客户端):与一对一与服务端进行连接,相当于我们应用中实现数据库交互需要实现的一个客户端。

  • MCP Servers(MCP 服务端):基于MCP协议实现特定功能的程序。

  • Local Data Sources:本地数据源,公MCP服务器进行本地访问。

  • Remote Services:远端服务,供MCP服务器访问远端访问,例如api的方式。

有了MCP,我们的LLM应用与外部资源集成后的架构:

LLM通过MCP Client和MCP Server实现和外部资源的交互。

RAG

RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索与文本生成的技术,旨在提升大语言模型在回答专业问题时的准确性和可靠性。

所有的AI模型的底层原理都是基于数学概率,其模型输出实质上是一系列数值运算,大模型也不例外,所以它有时候会一本正经地胡说八道,尤其是在大模型自身不具备某一方面的知识或不擅长的场景。

而这种幻觉问题的区分是比较困难的,因为它要求使用者自身具备相应领域的知识。

而 RAG 就是一种能够有效幻觉模型知识截止和幻觉现象的方法。RAG 是检索增强生成(Retrieval-Augmented Generation)的缩写。检索增强生成,是指对大语言模型(LLM)输入进行优化,使其能够在生成响应之前引用训练数据来源之外的知识,作为回答的根据。这是一种经济高效地改进 LLM 输出的方法,让 LLM 保持相关性、准确性和实用性。

RAG 主要经历了 Naive RAG、Advanced RAG、Modular RAG、Graph RAG,以及最近热门的 Agentic RAG 几种类型的发展。

RAG的发展还在高速迭代中,大家可以自己关注。

向量数据库

向量数据库是专为处理高维向量数据设计的数据库系统,支持高效的向量存储、检索和分析,尤其擅长处理非结构化数据(如图像、文本、音频等)的特征向量。在大数据与 AI 领域,它是连接数据预处理、模型训练与实际应用的关键桥梁。

这其中大家可以重点关注:Milvus

Milvus 是专为处理高维向量数据设计的开源向量数据库,核心能力在于高效存储、索引和检索海量非结构化数据(如图像、文本、音频的特征向量)。其架构和功能深度适配 AI 场景,尤其在生成式 AI、推荐系统、多模态检索等领域成为关键基础设施。

Milvus 采用共享存储架构,存储计算完全分离,计算节点支持横向扩展。从架构上来看,Milvus 遵循数据流和控制流分离,整体分为了四个层次,分别为接入层(access layer)、协调服务(coordinator service)、执行节点(worker node)和存储层(storage)。各个层次相互独立,独立扩展和容灾。

引用来自Zilliz的徐冬老师的话:

在AI基础设施场景上,专用的向量数据库在索引性能和查询功能上具有决定性优势,是AI基础设施的必备组件。

在上文的RAG场景中,例如我们想搜索很多过往的论文,要对论文做增强,去问它一些问题,给出一些答案。这时要把论文 PDF 文件,通过一些清洗将其变成文字,再把这些文字切分成一些段落或者句子,每个段落和句子都有一个 vector 去存储,数据量可能非常大。

比如提问"新冠疫苗的主流方法是什么?"此时会先去访问一个大模型的服务,把这个问题通过一个大模型的嵌入 embedding 产生出一个问题向量,然后通过 Vector store,找到关联度比较高的那些论文片段,作为上下文返回给某个模型,让它再重新生成一个回答,这一过程就可以使用 RAG。

在这一过程中,一个核心的概念就是 Vector store,把向量和向量关心的结构化和非结构化数据存储起来。

这时候就轮到Milvus登场了。

300万字!全网最全大数据学习面试社区等你来!

如果这个文章对你有帮助,不要忘记 「在看」 「点赞」 「收藏」 三连啊喂!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

王知无(import_bigdata)

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值