2025-07-04

上下文的转向：工程化下一代人机协作范式

摘要

文章系统阐述了"上下文工程"作为超越提示工程的新一代人机交互范式。这一新兴学科将上下文窗口视为LLM的工作内存，通过动态编排信息流、RAG检索增强、工具调用等技术，构建可靠可扩展的AI应用架构。文章深入比较了Google（长上下文规模）、OpenAI（工具生态）和Anthropic（精确控制）三大实验室的技术路线，并将上下文工程与HCI领域的长期理论建立联系，指出这是对活动理论、分布式认知等核心原则的工程化复兴。

内容框架与概述

文章开篇通过Karpathy的观点引出核心论题：上下文工程不是提示工程的简单演进，而是一次根本性的范式转移。作者通过对比表格清晰揭示了二者的本质区别——提示工程关注"说什么"，上下文工程关注"模型知道什么"，其本质从技巧升维为软件架构。

文章主体从三个层面展开论述。第一部分解构了上下文的构成要素，包括系统提示、用户输入、记忆、检索知识和可用工具，并将上下文窗口比作LLM的RAM，分析了"迷失在中间"、上下文稀释等失效模式。第二部分深入技术实践，系统介绍了RAG如何将模型锚定于事实、函数调用如何扩展模型的能动性，以及上下文管理的四大策略（写入、选择、压缩、隔离），揭示了效率与保真度之间的核心权衡。

第三部分转向产业格局，通过对比Google的百万级令牌规模战略、OpenAI的函数调用生态、以及Anthropic的XML标签化精确控制，描绘出上下文工程多元发展的技术图景。文章最后将视野提升到理论高度，论证现代上下文工程实践与HCI领域的活动理论、分布式认知等经典框架高度契合，标志着这些理论原则在AI时代的规模化实现，同时预示着AI交互设计这一新兴设计学科的崛起。

核心概念及解读

上下文工程：一门设计和构建动态系统的新兴学科，核心任务是在正确时间为LLM提供正确格式的正确信息，其本质是将上下文窗口作为LLM的工作内存进行精细化管理，而非仅仅雕琢静态提示文本。

检索增强生成（RAG）：通过从外部知识源检索相关信息并注入上下文，将模型输出"锚定"在事实和最新数据上的技术，它直接解决了LLM的知识截止和幻觉问题，在长上下文时代从精确检索转向上下文内综合。

函数调用：一种"三步舞"机制——提供工具清单、模型决策调用、应用执行返回结果，使LLM从被动文本生成器转变为能够与外部世界交互的主动代理，极大扩展了AI的行动能力。

效率与保真度权衡：上下文管理的核心张力。压缩和选择策略优先考虑效率（更少令牌、更低成本），但存在丢失关键细节的风险；而使用原始长上下文则优先保真度，代价是高昂成本和潜在性能下降，优秀的架构需要在这两者间精心平衡。

分布式认知：HCI领域的经典理论，认为智能和行动情境化并分布在环境和工具中，这与上下文工程将AI知识外化到检索文档、可用工具和对话历史的做法形成直接类比，表明上下文工程是HCI核心原则在AI时代的工程化复兴。

原文信息

字段	内容
原文	上下文的转向：工程化下一代人机协作范式
作者
发表日期	2025-07-04T02:48:00+00:00

此摘要卡片由 AI 自动生成

上下文的转向：工程化下一代人机协作范式

摘要

内容框架与概述

核心概念及解读

原文信息

目录