指标中台+大模型：解密衡石Agentic BI的NL2DSL架构实现

zandy1011

于 2025-06-26 16:12:17 发布

阅读量817

点赞数 13

CC 4.0 BY-SA版权

分类专栏：衡石BI技术文档文章标签：架构 NL2DSL Agentic BI 指标中台大模型

本文链接：https://blog.youkuaiyun.com/zandy1011/article/details/148927432

75 篇文章

订阅专栏

——Text2Metrics引擎如何攻克语义鸿沟，碾压传统NL2SQL方案

一、传统NL2SQL的“架构原罪”：业务语义的失控黑洞

当某银行尝试用NL2SQL分析“高净值客户流失率”时，系统生成如下危险SQL：

这正是NL2SQL的三大架构缺陷：

业务逻辑硬编码缺失：
“高净值客户”在业务系统中需同时满足：总资产>500万 + 近半年交易≥5次 + 风险评级≤B
NL2SQL模型无法感知业务规则库，仅依赖统计概率生成查询
维度关联断层：

衡石科技CTO点评：
“NL2SQL本质是‘绕过业务层的数据直达’——它把BI系统退化为SQL翻译器，牺牲了企业用数的核心防线。”

衡石的NL2DSL方案通过指标中台（Metrics Layer）重构处理流水线：

关键模块解析：

指标仓库（Metric Store）
预置原子化业务指标公式（YAML配置示例）：

动态DSL生成器
用户提问“分析高净值用户GMV地域分布”：

执行引擎优化
- 利用Apache Doris向量化引擎，将DSL转为低延迟查询
- 对比测试：
  
  查询类型 NL2SQL延迟 NL2DSL延迟
  单指标查询 320ms 110ms
  跨5表关联下钻失败率62% 210ms

查询类型	NL2SQL延迟	NL2DSL延迟
单指标查询	320ms	110ms
跨5表关联下钻	失败率62%	210ms