详情

首页手游攻略 NL2SQL 的四条主路线:一定是谁优谁劣么?

NL2SQL 的四条主路线:一定是谁优谁劣么?

佚名 2026-07-02 09:57:12

回归正题,这两天我在准备本周四晚上的公开免费直播,资料翻得越多,越感觉到一件事:过去两年大家聊 NL2SQL,经常有点偷懒(之前由于工作原因,也难免如此哈哈哈)。

回到上面,最常见的偷懒方式,就是一句话给某条路线判死刑。

有人说,直接让大模型生成 SQL,天生就是玩具;有人说,DSL 太老;有人说,MQL 只是 BI 的补丁;还有人觉得 Logic Plan 这套太重,只有巨头才养得起。

如果真把这些路线拉到企业里看,其实真实的结论没这么简单。

NL2SQL 没有完全的谁好谁坏。真正要看的,是你准备解决什么场景,愿意付出什么建模成本,以及你想把系统的天花板抬到哪里。

如果只是做一个自然语言问数 Demo,四条路线里很多都能跑起来。

如果你想做的是企业级数据智能,事情就会变成另一套评判标准:口径稳不稳、关系路径能不能管住、权限能不能解释、模型升级后结果会不会漂、系统能不能持续回归。

那我个人的判断是:

我这里为了方便讨论,先把四条路线临时叫成:

NL2LLM2SQL:自然语言直接交给大模型,大模型直接生成 SQL。• NL2DSL2SQL:自然语言先落到预制模板、规则槽位或 DSL,再编译成 SQL。• NL2MQL2SQL:自然语言先落到指标语义层、度量模型或语义查询层,再编译成 SQL。• NL2LP2SQL:自然语言先落到 Logic Plan / Logic Form 这一类语义计划,再编译成 SQL。

这里的 MQLLP 不是全行业统一叫法,你也可以叫 Semantic Query、Metric Query、Logic Form、YLP。名字不重要,关键是中间层的抽象程度不一样。

这条路之所以火得最快,原因很现实。

它离用户最近,也离 PoC 最近。

用户问一句“上个月华东区净销售额是多少”,系统直接吐一段 SQL,数据库执行,结果出来,观感非常顺。对创业团队、内部工具团队、分析师 Copilot 场景来说,这条路几乎一定是最先尝试的。

它的优点也很直接:

• 冷启动快;• 不要求你先做完整建模;• 适合分析师提效、SQL 修正、SQL Review、简单自助问数;• 对小团队很友好。

但这条路最早暴露的问题,也恰恰是企业最怕的问题。

一旦业务问题稍微复杂一点,大模型要一次性承担的责任就会变得很多:理解意图、识别业务词、找表、找字段、判时间、选口径、走 join、守权限、适配 SQL 方言。

这里面任何一层走偏,最后出来的 SQL 仍然可能执行成功。

但可执行成功,是不代表业务含义成立的

这也是为什么很多团队做了一轮 NL2LLM2SQL 以后,会突然觉得模型“不稳定”。

模型当然有问题,但更多时候,真正缺的是上下文工程。

我不想给这条路直接判死刑,因为本身是有解题思路的。

裸奔的 NL2LLM2SQL 天花板不高,带着知识工程、示例 SQL、语义元数据和评测体系的 NL2LLM2SQL,依然能打。

比如 Databricks 现在对这件事情的理解,就很值得看。

Databricks 官方现在对 AI/BI Genie 的做法,已经不是“给模型一堆表结构,然后让它自由发挥”。它在官方文档里明确强调几件事:

• 给 Genie Space 配置 example SQL;• 配置 plain-text instructions;• 配置 knowledge store snippets;• 用 Unity Catalog 和 business semantics 管理数据对象;• 给 metric views 添加 display names、synonyms、formatting 这类 agent metadata;• 跑 benchmark、review 生成 SQL、监控空间质量。

如果把 LLM-Wiki 理解成一套企业化上下文工程和知识组织思想,那 Databricks 实际上已经在往这个方向走了。

它在做的事,是给这条直生成路线不断加护栏:

• 让模型少猜一点;• 让上下文更干净一点;• 让示例和规则更可复用一点;• 让 bad case 更容易被积累和回归一点。

所以,NL2LLM2SQL 行不行?

我的看法很明确:能做,而且很多团队一开始就该从这里起步。问题会出在另一头。

你如果把它当成企业终局,后面大概率会被口径、权限、关系路径和稳定性拖住。

但是如果你突破了 LLM-Wiki 企业级的知识库构建壁垒,那说不定是可以成为一种 LLM2SQL 的终局的。

二、NL2DSL2SQL:最稳的模板工人,最怕长尾问题

这条路线很多人现在不太爱讲,因为它说起来其实感觉很 Low~

但不代表它就在我们实际落地过程重消失了。

尤其是在固定报表问答、有限指标集、流程型运营查询、金融风控规则问答、客服辅助查询这类场景里,DSL 或模板槽位式方案一直都很能打。

它的优势很简单:

• 稳定;• 可控;• 可测;• 很容易给出确定边界。

如果用户的问题类型本来就很固定,比如:

• 某个指标按某几个维度切片;• 某类 TopN 排行;• 某个固定分析报表的补充问答;• 某几个预设口径的下钻;

那 DSL 很可能比纯 LLM 更省心。

它的问题也很直接。

一旦问题空间开始扩张,DSL 的维护成本会飞快上升。每新增一种表达、一个业务口径、一条关系路径、一个时间语义,你都要补模板、补规则、补测试。

模板系统很像一个非常勤快的老员工。

让它干固定活,它非常稳;让它临场应对长尾问题,它就开始吃力。

所以这条路线非常适合做“可控场景内的高稳定问数”,不太适合承担企业开放式分析入口。

DSL 的上限不在准确率,而在覆盖面。场景越窄,它越稳;场景一旦往开放分析走,维护压力会迅速反噬。

三、NL2MQL2SQL:语义指标层路线,最适合做可信问数

如果说 NL2LLM2SQL 更像从模型出发,那 NL2MQL2SQL 更像从数据平台和语义治理出发。

这条路线的核心思路,是先定义好业务指标、维度、事实、关系和业务友好的命名,再让自然语言先落到这层语义模型,最后再编译成 SQL。

这条路最大的好处,是它特别适合企业里最常见的一类问题:

• 指标查询;• 多维切片;• 同比环比;• TopN;• Drill-down;• 经营报表补充问答;• 跨团队统一口径的自助分析。

一旦一个企业对“销售额”、“净收入”、“活跃用户”、“履约率”这类指标已经有稳定定义,那 MQL 路线会非常顺手。因为它把系统最容易漂的地方,提前收束到了语义层里。

Snowflake 现在的做法,基本就落在这条路线的主轴上。

Snowflake 官方对 Cortex Analyst 的定义非常明确:它通过 Semantic Views 来理解数据,并生成 SQL。Semantic View 里会定义 logical tables、business concepts、metrics、facts、dimensions、relationships,还支持 YAML 规范、custom instructions、verified query repository、evaluation。

Snowflake 抬这条路线天花板的办法,也很明确:把语义模型做得更像一个可治理的中间层,再用 verified queries 去持续修正和扩展它。

这条路线很适合大公司、成熟数仓团队、已有 BI 和指标体系的团队。

因为它跟现有组织的衔接最自然:

• 指标团队能参与;• BI 团队能参与;• 数据建模团队能参与;• SQL 仍然是执行层;• 上层却已经不是裸 SQL 世界了。

它的短板也很明显。

只要问题主要围绕指标、维度和报表分析,这条路会很舒服。等问题开始进入复杂业务对象关系、事件序列、状态迁移、审批链路、动作边界时,MQL 的表达空间就会开始发紧。

MQL 路线的强项是“可信问数”,它离“业务世界建模”和“语义执行”还有一段距离。

这也是为什么很多云厂商会先走到这一步,因为这一步最容易和现有数据平台、BI、指标体系打通,也最容易先释放商业价值。

四、NL2LP2SQL:企业级天花板最高,代价也最重

到了 NL2LP2SQL 这条路,问题就不再只是“怎么把自然语言变成一条更准的 SQL”了。

这条路线真正关心的是:

• 问题里有哪些业务对象;• 对象之间是什么关系;• 时间和状态应该怎么理解;• 哪些规则是业务规则,哪些只是物理 join;• 当前用户可以看到什么、可以做什么;• 结果要不要进入后续动作、写回、审批和审计流程。

也就是说,它开始把自然语言问题先落成一层逻辑计划,再由这层计划去编译查询、解释、权限判断和后续动作。

这条路的建设成本当然更高。

你需要的不只是模型和 SQL Tool,你还需要:

• 语义资产;• 对象建模;• 关系建模;• 规则建模;• Workbench;• 发布和回归;• Trace;• Guard;• 运行治理。

但它的上限也明显更高。

Palantir 这条线,就是一个非常典型的参照物。

Palantir 官方对 Ontology 的描述,已经不再停在“语义层”这个词上了。它把 Ontology 讲成 organization 的 operational layer,里面有 objects、properties、links,也有 actions、functions、dynamic security。它的价值不只是在问数时给模型更好语义,还在于把业务对象、关系、动作和治理一起组织起来。

这件事带来的结果是什么?

系统回答一个问题以后,不一定只停在“给你一条 SQL 和一个图表”。

它可以继续往下走:

• 解释这个结果从哪些对象和关系来;• 判断当前用户有没有权限看到下一层;• 调用 function 做额外分析;• 触发 ontology action 去写回或发起后续动作;• 留下审批、回滚和审计痕迹。

到了这一步,SQL 已经只是执行层的一部分。

LP 路线的真正价值,在于它把企业的业务世界先组织成可治理的语义计划,再去做查询、解释和动作。

所以如果只用“它能不能生成更准的 SQL”来评价这条路线,其实把它真的看的太扁了~

五、如果目标是真正企业级,哪条路线的天花板更高

如果非要把四条路线压成一句话,我会这么总结:

• 冷启动最快的是 NL2LLM2SQL;• 窄场景最稳的是 NL2DSL2SQL;• 可信问数最顺的是 NL2MQL2SQL;• 企业级上限最高的是 NL2LP2SQL

但企业真实落地,很少会单押一条。

更常见的情况,是分层并存。

• 外围入口,你会想要 NL2LLM2SQL 的覆盖面和自然交互能力;• 固定高频场景,你会想要 DSL 的稳定和确定性;• 指标问数、经营分析、报表体系,你会想要 MQL 的口径治理;• 高价值核心场景,比如复杂归因、业务对象关系分析、动作闭环、审批写回、跨系统执行,你迟早会走向 LP

所以这四条路线更像四级台阶,不是四个互斥阵营。

真正的问题从来都不是“谁彻底淘汰谁”。

真正的问题是:你的企业现在站在哪一级台阶上,下一步要补的是上下文工程、模板治理、指标语义层,还是更高阶的本体化语义层。

这也是我现在越来越确定的一点:

企业级 NL2SQL 的天花板,最后一定不会只靠模型能力拉开,真正拉开差距的,是语义基座、上下文治理和运行治理。

六、这也是我为什么要做这场公开直播

这周四,也就是 2026 年 7 月 2 日 晚上 20:00-21:00,我会开一场公开直播,专门把这四条路线拉出来讲透。

这场直播我最想解决的,不是给某条路线站台。

我更想帮大家把判断顺序排对。

很多团队现在一上来就问:

• 我们该不该直接做 NL2SQL?• 要不要先上语义层?• Logic Plan 会不会太重?• 大模型更强了以后,前面的语义建模是不是都不重要了?

这些问题单独看都成立,放在一起问就容易乱。

直播里我会重点讲三件事:

1. 四条路线各自解决的到底是哪类问题。2. Databricks、Snowflake、Palantir 这些代表性公司,分别在往哪条路上加码。3. 如果你现在是数据团队、产品团队、创业团队,应该怎么判断自己的起步方案。

说白了,我想帮大家把“技术路线判断”这件事从玄学拉回地面。

七、为什么我把这部分内容放进元一知识星球

如果你只是想建立一个判断框架,这篇文章和周四晚上一小时直播,基本已经够了。

如果你真想把这四条路线一条条做出来,那远远不够。

因为从文章到落地,中间还差很多东西:

• prompt 怎么写;• SQL review 怎么接;• trace 怎么留;• eval 和 bad case 怎么做;• example SQL 和 LLM-Wiki 怎么沉淀;• DSL 怎么设计边界;• MQL 怎么定义指标和关系;• LP 怎么组织对象、规则、路径和权限;• 每条路线的 demo 应该先做成什么样;• 什么阶段该往上一层升级。• ……

这也是我把它放进元一知识星球,尤其是大陆主城这条长期项目线里的原因。

我不想把这件事做成“看一篇文章,点个赞,觉得有道理就结束”的内容。

我更想把它做成一套连续项目:

• 从最简单的 NL2LLM2SQL baseline 开始;• 往里补 LLM-Wiki、example SQL、context engineering;• 再做 DSL 的稳定窄场景;• 再做 MQL 的指标语义层版本;• 最后再把 LP 和本体化语义层的方向逐步展开。

这套东西,后面我都会在知识星球里一条条做实现方案。

如果你只是看公众号,你拿到的是判断。

如果你进星球,你将会拿到项目阶段推进的判断力和实际落地能力。

这两者的差别,其实挺大。

你如果最近正好在想这些问题:

• 我们团队该从哪条路开始;• 语义层到底该不该先做;• LLM-Wiki、example SQL、verified queries 这类东西,究竟是在补什么洞;

那这场直播你可以来听。

如果你听完以后,确定想系统把这四条路线一条条做出来,当晚我也会放最后一波大额优惠券,优惠券就限直播当晚。

星球已冲刺到实力榜前十,这半个月也有小百号信任我的同学已进入学习,欢迎进来一起快速成长~

NL2SQL 没有银弹。真正拉开差距的团队,最后拼的也不会只是模型,而是谁先把语义、上下文和治理一层层补齐。

本文参与腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2026-07-01,如有侵权请联系[email protected] 删除
相关资讯
点击查看更多
游戏推荐
推荐专题
热门阅读
推荐下载