目录
1. AI界的"万能钥匙":MCP如何让大模型连接万物?
自从去年11月Anthropic公司(Claude的创造者)推出MCP协议后,正以惊人的速度重塑AI与数字世界的交互方式,如果说ChatGPT打开了智能对话的大门,那么MCP则正在为AI装上"操作现实世界的双手"。或许在不久的将来,这一技术将会改变AI领域的游戏规则。
如上图所示,简单来说MCP就像是AI的"万能钥匙",旨在让大型语言模型(LLM)与外部工具和数据源实现无缝通信,让它能安全、可控地访问服务器上的文件、应用系统等。
上面的文字描述,看着是不是有些迷迷糊糊的,如何真正理解并应用MCP呢,接下来我将用一个简单的例子(数据库CRUD操作级别)来形象的描述一下。
2. 常见的MCP应用场景
先看一下mcp常用的几个场景:
- 访问私域数据库(CRUD)
- 访问三方工具(访问高德地图、天气工具)
- 调用现有系统API,实现大模型与已有系统的互联互通(例如调用公司的OA接口,自动实现OA发文的自动发布)
现在我们来介绍一下实践案例:如何基于大模型+MCP技术来实现ChatBI问数的功能。
3. 案例用到的表结构
CREATE TABLE `sales` (
`sale_id` BIGINT NOT NULL AUTO_INCREMENT COMMENT '销售单ID(主键)',
`order_no` VARCHAR(32) NOT NULL COMMENT '销售订单编号',
`customer_id` BIGINT NOT NULL COMMENT '客户ID',
`customer_name` VARCHAR(100) COMMENT '客户名称',
`salesperson_id` BIGINT NOT NULL COMMENT '销售人员ID',
`salesperson_name` VARCHAR(50) COMMENT '销售人员姓名',
`sale_date` DATETIME NOT NULL COMMENT '销售日期时间',
`total_amount` DECIMAL(12,2) NOT NULL DEFAULT 0 COMMENT '订单总金额',
`discount_amount` DECIMAL(12,2) DEFAULT 0 COMMENT '折扣金额',
`actual_amount` DECIMAL(12,2) NOT NULL COMMENT '实收金额',
`payment_method` TINYINT COMMENT '支付方式:1现金 2信用卡 3支付宝 4微信 5银行转账',
`payment_status` TINYINT NOT NULL DEFAULT 0 COMMENT '支付状态:0未支付 1部分支付 2已支付 3已退款',
`delivery_status` TINYINT DEFAULT 0 COMMENT '发货状态:0未发货 1部分发货 2已发货 3已签收',
`invoice_type` TINYINT COMMENT '发票类型:1普通发票 2增值税发票',
`invoice_title` VARCHAR(100) COMMENT '发票抬头',
`invoice_no` VARCHAR(50) COMMENT '发票号码',
`remark` VARCHAR(500) COMMENT '备注',
`source_channel` TINYINT COMMENT '订单来源:1线下 2官网 3APP 4小程序 5第三方平台',
`warehouse_id` INT COMMENT '发货仓库ID',
`logistics_company` VARCHAR(50) COMMENT '物流公司',
`tracking_no` VARCHAR(50) COMMENT '物流单号',
`created_by` BIGINT COMMENT '创建人ID',
`created_time` DATETIME NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',
`updated_by` BIGINT COMMENT '更新人ID',
`updated_time` DATETIME NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '更新时间',
`is_deleted` TINYINT NOT NULL DEFAULT 0 COMMENT '是否删除:0否 1是',
PRIMARY KEY (`sale_id`),
UNIQUE KEY `uk_order_no` (`order_no`),
KEY `idx_customer_id` (`customer_id`),
KEY `idx_salesperson_id` (`salesperson_id`),
KEY `idx_sale_date` (`sale_date`),
KEY `idx_payment_status` (`payment_status`),
KEY `idx_delivery_status` (`delivery_status`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci COMMENT='销售订单主表';
4. 开始测试案例
我们使用开发好的ChatBI-MCP-Server,利用DeepSeek大模型来测试一下查数效果,事先准备好2个问题:
(1)7月份订单总金额
(2)哪个销售员的订单金额最大
开始询问:查询7月份订单总金额
观察查询效果,可以清晰地看到大模型自己在将任务拆解成几个步骤:
(1)首先查询数据库中所有的表
(2)找到可能包含订单数据的表
(3)查看相关表的结构和数据样例
(4)最终执行查询7月份订单总金额的SQL
执行效果如下图所示:
在首次对话过程中,我们看到运行时遇到了问题,先来看一下运行的日志:
{
"params": {
"dbName": "order_db"
},
"response": {
"content": [
{
"type": "text",
"text": "StatementCallback; bad SQL grammar [SELECT TABLE_NAME , TABLE_COMMENT, TABLE_SCHEMA FROM information_schema.tables where table_schema = order_db]"
}
],
"isError": true
}
}
我们通过观察日志,看到大模型在进行用户意图识别过程中,执行查询数据库所有的表时,是从order_db中来查询的(这个库名是大模型幻觉杜撰出来的),而我们的数据库中只有sales库,下面我们给大模型纠正一下,继续问答:从sales库中查询7月份订单总金额
从下图的执行结果我们可以看到,本论问答结果符合预期:
我们不妨仔细观察一下各个步骤的执行细节,来帮助我们理解大模型是如何通过MCP来与数据库进行交互的。
(1)判断sales中有哪些表
从下图中可以看到大模型的推理执行过程,在这一步中,可以看到大模型调用了mcp服务,来查看表中有哪些表
(2)查询表结构
根据查询结果,sales库中有一个表叫sales,表注释为"销售订单主表"。接下来我需要查看这个表的结构,了解它包含哪些字段。
(3)查询表数据-获取最终结果
从表结构中可以看到,sales表包含sale_date(销售日期时间)和total_amount(订单总金额)字段。现在我需要编写SQL查询7月份的订单总金额。
怎么样,我们可以看到大模型的执行思路很清晰,他在识别出用户意图后,进行自主决策,并规划出一系列执行步骤,最终获得用户关心的数据。我们事先并没有告诉大模型数据库中有哪些表,表中有哪些字段,是不是感到有点惊艳。
我们再试着问他第二个问题:哪个销售员的订单金额最大。同样大模型给出了正确的执行结果。
提示:在问答的过程中,遇到问题也很正常,我们在下一轮对话中,引导大模型即可,大模型根据历史会话记录和提示词,会进行自主决策的
我们在以往开发AI Agent,实现ChatBI问数功能时,以往的做法是提前把用到的表结构来创建知识库、或者把表结构作为提示词喂给大模型,来帮助大模型理解表结构。而在本文介绍的案例中,我们采用了一种新的玩法,即利用大模型+MCP技术来实现。
以上是关于大模型+MCP在ChatBI问数场景下的一个探索实践,在案例中,我们使用MCP技术,打通了大模型访问私域数据的安全通路,一些初浅的思考,希望可以给大家带来不同的实现思路。
欢迎WX搜索关注公众号 南and北 ,获得更多内容,留言交流!