2025-07-04

上下文的转向:工程化下一代人机协作范式

摘要

文章系统阐述了"上下文工程"作为超越提示工程的新一代人机交互范式。这一新兴学科将上下文窗口视为LLM的工作内存,通过动态编排信息流、RAG检索增强、工具调用等技术,构建可靠可扩展的AI应用架构。文章深入比较了Google(长上下文规模)、OpenAI(工具生态)和Anthropic(精确控制)三大实验室的技术路线,并将上下文工程与HCI领域的长期理论建立联系,指出这是对活动理论、分布式认知等核心原则的工程化复兴。

内容框架与概述

文章开篇通过Karpathy的观点引出核心论题:上下文工程不是提示工程的简单演进,而是一次根本性的范式转移。作者通过对比表格清晰揭示了二者的本质区别——提示工程关注"说什么",上下文工程关注"模型知道什么",其本质从技巧升维为软件架构。

文章主体从三个层面展开论述。第一部分解构了上下文的构成要素,包括系统提示、用户输入、记忆、检索知识和可用工具,并将上下文窗口比作LLM的RAM,分析了"迷失在中间"、上下文稀释等失效模式。第二部分深入技术实践,系统介绍了RAG如何将模型锚定于事实、函数调用如何扩展模型的能动性,以及上下文管理的四大策略(写入、选择、压缩、隔离),揭示了效率与保真度之间的核心权衡。

第三部分转向产业格局,通过对比Google的百万级令牌规模战略、OpenAI的函数调用生态、以及Anthropic的XML标签化精确控制,描绘出上下文工程多元发展的技术图景。文章最后将视野提升到理论高度,论证现代上下文工程实践与HCI领域的活动理论、分布式认知等经典框架高度契合,标志着这些理论原则在AI时代的规模化实现,同时预示着AI交互设计这一新兴设计学科的崛起。

核心概念及解读

上下文工程:一门设计和构建动态系统的新兴学科,核心任务是在正确时间为LLM提供正确格式的正确信息,其本质是将上下文窗口作为LLM的工作内存进行精细化管理,而非仅仅雕琢静态提示文本。

检索增强生成(RAG):通过从外部知识源检索相关信息并注入上下文,将模型输出"锚定"在事实和最新数据上的技术,它直接解决了LLM的知识截止和幻觉问题,在长上下文时代从精确检索转向上下文内综合。

函数调用:一种"三步舞"机制——提供工具清单、模型决策调用、应用执行返回结果,使LLM从被动文本生成器转变为能够与外部世界交互的主动代理,极大扩展了AI的行动能力。

效率与保真度权衡:上下文管理的核心张力。压缩和选择策略优先考虑效率(更少令牌、更低成本),但存在丢失关键细节的风险;而使用原始长上下文则优先保真度,代价是高昂成本和潜在性能下降,优秀的架构需要在这两者间精心平衡。

分布式认知:HCI领域的经典理论,认为智能和行动情境化并分布在环境和工具中,这与上下文工程将AI知识外化到检索文档、可用工具和对话历史的做法形成直接类比,表明上下文工程是HCI核心原则在AI时代的工程化复兴。


原文信息

字段内容
原文上下文的转向:工程化下一代人机协作范式
作者
发表日期2025-07-04T02:48:00+00:00

此摘要卡片由 AI 自动生成