Jason Cui · 2026-03-10

数据代理需要上下文层才能工作

摘要

文章指出数据和分析AI代理在企业部署中大规模失败，根本原因不是模型SQL生成能力不足，而是缺乏正确的业务上下文。现代数据堆栈实现了数据集中，但企业数据仍然分散混乱，业务定义模糊不清。传统语义层只能解决指标定义问题，无法满足代理自主性需求。文章提出上下文层概念，它整合企业所有数据、业务逻辑和部落知识，为代理提供完整上下文，使其能够理解业务定义、定位正确数据源并回答问题。

内容框架与概述

文章首先回顾了现代数据堆栈的演进历程，从十年前开始的数据集中化转型，到数据仓库和BI工具的普及。接着描述了2024年至2025年的AI代理热潮，企业纷纷尝试在现有数据堆栈上构建聊天机器人等应用，但很快遭遇失败。MIT报告显示，大多数AI部署因工作流脆弱、缺乏上下文学习和与日常操作不匹配而失败。

文章深入分析了失败原因，指出问题不仅仅是模型从文本生成SQL的能力不足。通过收入增长查询案例，说明了代理面临的双重挑战：一是如何理解收入、季度等业务定义，二是如何确定正确的数据源和真相来源。现有语义层往往过时、不完整，无法提供代理所需的上下文。

最后文章提出上下文层解决方案，它是对传统语义层的扩展。上下文层不仅包含指标定义，还包括规范实体、身份解析、部落知识解析和治理指导等。它将企业所有分散数据整合起来，添加业务逻辑上下文层，打包供给代理使用，使代理能够真正实现自主工作。

核心概念及解读

上下文层（Context Layer）：整合企业所有分散数据和业务逻辑的中间层，为AI代理提供业务定义、数据源位置和部落知识等完整上下文。

语义层（Semantic Layer）：传统BI中定义指标如收入、流失率等的层，通常由数据团队手工构建，语法特定且直接连接BI工具，无法满足代理自主性需求。

现代数据堆栈（Modern Data Stack）：过去十年数据架构的演进，通过数据摄取、转换、仓库和存储的集中化，使数据快速可访问，团队可以通过SQL进行数据分析。

代理自主性（Agent Autonomy）：AI代理在没有人工干预情况下独立理解和执行任务的能力，需要完整的业务上下文而不仅仅是指标定义。

部落知识（Tribal Knowledge）：存在于组织内部、非文档化的隐含知识，如业务逻辑、决策流程和工作惯例，对于代理理解企业运作至关重要。

原文信息

字段	内容
原文	Your Data Agents Need Context
作者	Jason Cui
发表日期	2026-03-10

此摘要卡片由 AI 自动生成

‹

Anthropic：颠覆世界的公司如何被颠覆

Harry Booth · 2026-03-11

AI正如何彻底改变数学研究

2026-03-10

›

数据代理需要上下文层才能工作

摘要

内容框架与概述

核心概念及解读

原文信息

目录