Jason Cui · 2026-03-10

数据代理需要上下文层才能工作

摘要

文章指出数据和分析AI代理在企业部署中大规模失败,根本原因不是模型SQL生成能力不足,而是缺乏正确的业务上下文。现代数据堆栈实现了数据集中,但企业数据仍然分散混乱,业务定义模糊不清。传统语义层只能解决指标定义问题,无法满足代理自主性需求。文章提出上下文层概念,它整合企业所有数据、业务逻辑和部落知识,为代理提供完整上下文,使其能够理解业务定义、定位正确数据源并回答问题。

内容框架与概述

文章首先回顾了现代数据堆栈的演进历程,从十年前开始的数据集中化转型,到数据仓库和BI工具的普及。接着描述了2024年至2025年的AI代理热潮,企业纷纷尝试在现有数据堆栈上构建聊天机器人等应用,但很快遭遇失败。MIT报告显示,大多数AI部署因工作流脆弱、缺乏上下文学习和与日常操作不匹配而失败。

文章深入分析了失败原因,指出问题不仅仅是模型从文本生成SQL的能力不足。通过收入增长查询案例,说明了代理面临的双重挑战:一是如何理解收入、季度等业务定义,二是如何确定正确的数据源和真相来源。现有语义层往往过时、不完整,无法提供代理所需的上下文。

最后文章提出上下文层解决方案,它是对传统语义层的扩展。上下文层不仅包含指标定义,还包括规范实体、身份解析、部落知识解析和治理指导等。它将企业所有分散数据整合起来,添加业务逻辑上下文层,打包供给代理使用,使代理能够真正实现自主工作。

核心概念及解读

上下文层(Context Layer):整合企业所有分散数据和业务逻辑的中间层,为AI代理提供业务定义、数据源位置和部落知识等完整上下文。

语义层(Semantic Layer):传统BI中定义指标如收入、流失率等的层,通常由数据团队手工构建,语法特定且直接连接BI工具,无法满足代理自主性需求。

现代数据堆栈(Modern Data Stack):过去十年数据架构的演进,通过数据摄取、转换、仓库和存储的集中化,使数据快速可访问,团队可以通过SQL进行数据分析。

代理自主性(Agent Autonomy):AI代理在没有人工干预情况下独立理解和执行任务的能力,需要完整的业务上下文而不仅仅是指标定义。

部落知识(Tribal Knowledge):存在于组织内部、非文档化的隐含知识,如业务逻辑、决策流程和工作惯例,对于代理理解企业运作至关重要。


原文信息

字段内容
原文Your Data Agents Need Context
作者Jason Cui
发表日期2026-03-10

此摘要卡片由 AI 自动生成