AI

贝壳商机平台利用NL2SQL技术优化指标查询

发布时间:2025年8月28日    来源:szf
贝壳商机平台利用NL2SQL技术优化指标查询

快速阅读: 门店商机管理助手推出,采用Chat交互与GUI可视化结合模式,提供实时业务指标咨询、数据解读及策略建议,助力店东优化管理流程,提升商机转化率,推动业绩增长。

门店商机管理助手是专为店东设计的智能化管理工具。该工具整合门店经纪人在作业过程中的关键指标数据,并结合客户沟通场景的深度数据挖掘,实现多维度对比分析,精准定位业务薄弱环节。基于数据分析结果,系统输出针对性建议和举措,帮助店东有效管理经纪人,优化作业流程,提升专业服务能力,提高商机转化率,推动门店业绩增长。

门店商机管理助手采用“Chat 交互 + GUI 可视化”混合模式,支持智能对话引擎提供实时业务指标咨询、数据解读及策略建议,如经纪人作业优化方案、客户沟通话术指导等。同时,图形用户界面打造可视化数据看板,直观展示经纪人作业过程指标,如商机、转化、客户解读等。这种“对话式交互 + 可视化分析”的双引擎模式,帮助店东兼顾动态决策的灵活性与数据管理的精准性,实现从“数据洞察”到“业务优化”的全流程效率提升。

在门店商机管理助手中,作业指标查询是核心能力模块,依托商机指标平台构建的标准化数据底座,实现指标建模、加工到数据存储的标准流程。作为工具的数据根基,指标平台不仅提供指标数据,还提供指标字典和元数据定义。作业指标查询功能结合 Chat 智能交互引擎,系统自动响应自然语言查询指令,如“查询门店转带看率周环比”,并输出优化建议,形成“数据查询 – 智能分析 – 策略生成”的闭环能力,确保店东基于精准数据驱动业务决策,夯实商机转化的过程管理。

### 作业指标查询 – NL2SQL 通用方案对比

NL2DSL 通过语义解析将自然语言查询转换为中间层领域特定语言(DSL),再由 DSL 映射生成目标 SQL 语句。例如,自然语言“查询 Q2 XX 门店带看量 Top10 的经纪人”转换为自定义 DSL 后,生成对应 SQL 语句。

NL2SQL 则直接将自然语言查询映射为数据库操作语言(DML),即原生 SQL 语句。例如,自然语言“查询 2025 年 6 月商机量超过 100 的经纪人”直接生成 SQL 语句。

### NL2SQL 实践

#### 3.1 方案选择

在构建自然语言查询能力的过程中,我们选择了基于 NL2SQL 技术方案,主要基于以下考虑:

1. **应用场景灵活**:自然语言查询具备良好的通用性和可扩展性,用户可以通过一句话完成复杂查询,如“查询昨天北京 ccc 门店的带看量”、“近 7 日转化率趋势”等,无需深入了解字段、表结构和查询语法。

2. **良好基础设施支撑**:商机指标平台基于 Apache Doris 数据仓库构建,具备统一的数据存储引擎、清晰的指标字段映射、标准化的数据维度和简化的 JOIN 逻辑,极大提升了 NL2SQL 方案的实施可行性和准确率。

#### 3.2 难点及解决方案探索

##### 3.2.1 难点

– **自然语言复杂性**:NL2SQL 准确率问题,如何准确定位多张表的多个字段?

##### 3.2.2 解决方案探索

1. **增强语义理解**

– **指代消歧**:系统结合当前查询上下文、字段使用频率、实体别名等方式进行判别,例如“查询昨天谁的商机量最多”解析为“查询昨天哪个经纪人的商机量最多”。

– **多轮对话承接与补全**:对于多轮查询,系统需承接历史语义补全主体和指标上下文,如用户首次提问“查询张三商机量”,后续接着问“那他最近 7 天趋势呢?”。

– **错误纠正与引导推荐**:当用户提问超出系统支持指标集合或维度组合时,系统反馈建议,如“暂不支持‘业绩波动指数’指标,可查询‘门店业绩总额’、‘门店环比增长率’等”。

2. **提升 SQL 生成准确率**

– **构建指标知识库**:为每个业务指标维护其名称、口径定义、所依赖字段、所属表、维度限制等信息,系统通过召回相关指标生成 SQL 模板。

– **处理衍生指标**:维护计算公式,解析依赖字段及所属表信息,生成 SQL 语句。

– **时间格式规范化**:将用户自然语言中的模糊时间统一转换为 Doris 兼容时间格式。

– **Few-shot 示例增强**:构建覆盖常见场景的问题-SQL 对,以 few-shot 方式加入 Prompt,提升大模型泛化能力与结构一致性。

3. **SQL 风险控制**

– **类型限制**:仅支持 SELECT 语句执行,禁止更新、插入、删除操作,防止 SQL 注入与数据污染。

– **语法与语义校验**:执行前进行 SQL 语法解析与语义验证,确保所有字段在表结构中存在、语义逻辑合理。

– **默认限制与提示**:时间范围控制,若用户未明确限定时间段,系统默认设置最近 7 天或当月范围;结果数量控制,若查询未设置 LIMIT,系统自动添加 LIMIT 100 以限制数据返回量。

– **查询计划分析与反馈**:系统调用 Doris EXPLAIN 语句分析执行计划,若出现全表扫描、索引缺失等问题,给予提示并建议优化查询方式。

4. **MCP Server 支持 – 降低维护成本**

– 基于上述方案实现 workflow 执行流程,简化人工拆解和编排工作。

LLM与MCP Server通过工具链协同和任务流程优化,显著提升了NL2SQL的性能和可靠性。LLM将人为任务拆解流程自动化,通过COT方式拆解和执行任务。

MCP Server提供多种工具,提升SQL生成质量和取数逻辑:

– `get_schema`:提供Doris表结构信息,帮助NL2SQL准确映射用户意图到字段。

– `sql_query`:执行SQL,返回查询结果。

– `sql_valid`:通过语法和语义校验,确保生成的SQL合法且安全,防止无效查询或SQL注入。

– `sql_explain`:分析SQL执行计划,识别潜在性能瓶颈,并建议优化策略。

MCP Server结合LLM的Function Calling+ReAct和Chain-of-Thought能力,优化SQL生成策略:

– Function Calling:LLM通过调用MCP Server的工具接口,动态获取元数据和校验结果,提升生成准确性。例如,LLM调用Schema接口确认字段类型,确保时间格式正确。

– COT:通过分步推理,LLM自动调整SQL生成策略。例如,面对复杂查询,COT将其分解为子任务,提高查询质量。

– 性能优化:结合执行计划分析,自动添加性能优化条件,避免低效查询。

LLM与MCP Server的结合,将人为任务拆解流程自动化,通过COT方式实现自动化分步推理,有效解决了NL2SQL中的语义理解、表关联和查询优化难题,实现了从自然语言到高效SQL的智能转换。

为了全面测评NL2SQL的可靠性,我们参考了业内通用评价体系:精确匹配率和执行正确率。

– 精确匹配率(EM):衡量生成的SQL是否与标准答案完全一致。这是一个严格的度量标准,但并不总是反映实际效果。

– 执行正确率(EX):只要两个查询在相同输入下产生相同的输出结果,就被视为成功。这种方法更能体现功能上的等效性。

以上评价体系都不能更精准地测评NL2SQL的准确率。为了提高EM,我们将SQL拆解成多个模块进行对比分析,达到SQL逻辑一致的效果,最终得到测评结果。

我们设计了多样化的评测集,全面覆盖商机指标查询场景,包含问题构建和Golden SQL构建。

– 问题构建:评测集分为三类查询,覆盖简单到复杂的场景:

– 简单查询:明确的时间、指标和维度,代表基础查询需求。

– 中难度查询:涉及指标环比、指标趋势、Top排行等,需处理复杂逻辑。

– 语义问题查询:包含指代消歧和模糊问题,测试语义理解能力。

– Golden SQL构建:为每个查询提供标准SQL,需验证其准确性和性能。Golden SQL存储在评测集中,作为评测基准。

NL2SQL评估通过SQL模式对比算法进行对比,判断SQL执行的逻辑是否相同,并通过SQL执行引擎判断SQL的执行结果是否符合预期。只有两个完全一致才符合要求,否则将进行人工评估。最终,系统和人工评估结果显示,在商机指标查询场景中,准确率可达93%。

LLM与MCP Server通过工具链协同(Schema感知、SQL验证、执行计划分析)和任务流程优化(Function Calling、COT),显著增强了NL2SQL在商机指标平台中的性能和可靠性。COT方式将人为任务拆解流程自动化,解决了语义理解、表关联和查询优化难题。语义对齐(指代消歧、纠错提示、领域知识补充)、准确率提升(指标知识库、衍生指标、时间规范化、Few-Shot)和SQL风险控制(注入防控、性能优化)确保了查询的准确性、安全性和高效性。NL2SQL评测通过多样化的评测集(简单查询、中难度查询、语义问题查询)和模块化拆解(SELECT、FROM、WHERE等),结合EM(精确匹配率)、EX(执行正确率)和模块准确率,精准验证了系统的性能,综合准确率达93%。相较于NL2DSL,NL2SQL开发成本低、生态成熟,完美适配单一Doris集群、指标直接映射的场景。

为进一步提升NL2SQL的适用性,我们计划在以下方向持续探索:

1. 指标RAG(Retrieval-Augmented Generation):

– 目标:构建更智能的指标检索和生成机制,通过RAG技术增强LLM的上下文理解能力。

– 实现:将指标知识库与向量数据库结合,基于用户查询检索最相关指标、表结构和计算公式,动态注入LLM的提示词。

– 价值:RAG可减少对预定义规则的依赖,增强对复杂指标和动态口径的处理能力,适配多变业务场景。

2. NL2SQL模型微调:

– 目标:通过领域特定数据微调LLM,提升商机指标查询场景的适配性。

– 实现:收集更多用户查询-SQL对数据集,结合评测集中的复杂查询(如环比、Top排行、语义问题),优化指代消歧、术语解析和SQL生成质量。

– 价值:微调后的模型将更精准理解业务术语和复杂逻辑,提升EM和EX指标。

3. COT对复杂查询任务的拆解和执行:

– 目标:进一步优化COT推理,处理更复杂的查询场景(如多表关联、嵌套子查询、动态口径)。

– 实现:通过设计更细粒度的COT模板,将复杂查询拆解为更小的子任务,并结合MCP Server的工具链动态调整执行策略。

– 价值:COT的细化拆解将提升复杂查询的准确性和可解释性,增强用户信任和系统鲁棒性。

通过指标RAG、模型微调和COT优化,NL2SQL将进一步提升对复杂业务场景的适配能力,结合MCP Server的工具链支持,实现更智能、高效、安全的数据查询服务。若业务扩展至多数据源或复杂口径对齐,可探索混合方案(NL2SQL为主,DSL为辅),为商机指标注入更强大的数据分析能力。

(以上内容均由Ai生成)

你可能还想读

英国Lodestar获资推进AI卫星感知系统

英国Lodestar获资推进AI卫星感知系统

快速阅读: 据英国航天局消息,该局通过SECP计划向洛德斯塔空间公司提供3万英镑资助,用于提升其“米斯里尔”在轨感知系统的激光雷达精度,支持2026年飞行演示,强化英国在自主空间操作领域的竞争力。 英国航天局近日通过其“空间生态系统商业化计 […]

发布时间:2025年12月8日
软银收购DigitalBridge加码AI算力布局

软银收购DigitalBridge加码AI算力布局

快速阅读: 据彭博社报道,美国数字桥公司加速布局亚太数字基建,整合通信塔与数据中心资源,以满足AI算力激增带来的低延迟、高带宽需求,强化其全球基础设施地位。 近日,美国数字桥公司(DigitalBridge)在拓展亚洲数字基础设施布局方面动 […]

发布时间:2025年12月8日
贝莱德:AI投资将驱动美国经济韧性增长

贝莱德:AI投资将驱动美国经济韧性增长

快速阅读: 据贝莱德发布消息称,美国经济正迈入由大规模人工智能投资驱动的资本密集型阶段,预计2030年全球AI相关资本支出将达5至8万亿美元,重塑产业格局并影响供应链与劳动力市场。 日前,全球知名资产管理公司贝莱德在其最新发布的全球经济展望 […]

发布时间:2025年12月8日
硅谷预言:AI将重塑工作与收入

硅谷预言:AI将重塑工作与收入

快速阅读: 据最新消息,人工智能加速冲击全球就业结构,部分职业或将消失,肯尼亚试点全民基本收入项目引发隐私争议,国际社会呼吁构建适应AI时代的社会保障政策框架。 近日,人工智能技术加速渗透全球多个行业,引发对就业结构和收入模式的广泛关注。多 […]

发布时间:2025年12月8日
AI重塑广告业:从执行到智能协同

AI重塑广告业:从执行到智能协同

快速阅读: 据最新消息,广告传播机构加速转型为智能协同伙伴,依托AI优化创意系统,融合算法效率与人文共情,构建“智能+共情”双轮驱动战略,提升传播精准度与内容温度。 人工智能正加速从实验室走向实际应用,其价值日益体现在广告、媒体等行业的日常 […]

发布时间:2025年12月8日
AI推动数据分析普及,渠道伙伴机遇扩大

AI推动数据分析普及,渠道伙伴机遇扩大

快速阅读: 据最新消息,Tableau首席产品官指出AI正推动数据分析进入新阶段,聚焦对话式分析、实时洞察与语义层技术三大方向,2025年成AI应用部署关键年。 日前,数据分析企业Tableau首席产品官索南德·琼斯表示,随着人工智能技术加 […]

发布时间:2025年12月8日
欧盟报告:AI训练应借鉴Napster版权教训

欧盟报告:AI训练应借鉴Napster版权教训

快速阅读: 欧洲议会法律事务委员会发布报告,主张通过强制性法定许可制度解决AI训练数据版权争议,允许使用公开作品并支付统一版税,以平衡创新激励与权利人补偿,避免“选择退出”机制导致模型偏见。 日前,欧洲议会法律事务委员会发布题为《版权与人工 […]

发布时间:2025年12月8日
特朗普推AI新政,各州监管加速推进

特朗普推AI新政,各州监管加速推进

快速阅读: 据最新消息,美国科罗拉多、加州和纽约等州加速推进AI监管立法,分别聚焦算法歧视、高风险系统披露及自动化决策监管,但行业担忧各州标准不一或阻碍全国AI产业发展。 近日,美国多个州加快人工智能监管立法步伐,以应对算法偏见、数据隐私及 […]

发布时间:2025年12月8日