马克·安德森反思浏览器的终结、OpenClaw与AI为何「这次真的不一样」
访谈概述
本期《Latent Space》播客邀请到了硅谷传奇投资人、a16z 联合创始人马克·安德森(Marc Andreessen)。作为经历过从 Mosaic 浏览器、网景(Netscape)到当今移动互联网等多次计算平台技术更迭的亲历者,马克在节目中分享了他对当前 AI 浪潮的深刻洞察。
他认为,当前的 AI 并非又一次短暂的炒作周期,而是一场“酝酿了80年的一夜成名”。从早期的神经网络、专家系统,到如今的 Transformer、推理模型(Reasoning)、代码生成、AI 代理(Agents)以及递归自我改进(RSI),各项技术终于迎来了奇点。他详细阐述了为什么“这次真的不一样”、AI 将如何终结传统编程语言的时代、代理架构如何重塑 Unix 哲学,以及为什么当前的 AI 基础设施建设不同于 2000 年的互联网泡沫。最后,他还从宏观视角探讨了 AI 如何打破传统的“经理人资本主义”,并一针见血地指出了现实世界中庞大的体制惯性将如何阻碍 AI 的落地普及。
专用词语翻译列表
| 英文专用词汇 | 中文翻译/释义 | 备注 |
|---|---|---|
| a16z (Andreessen Horowitz) | a16z 基金 | 硅谷顶级风险投资机构 |
| Expert systems | 专家系统 | 20世纪80年代流行的一种早期人工智能系统 |
| Scaling laws | 缩放定律 / 缩放法则 | 指模型性能随计算量、参数量和数据量增加而可预测提升的规律 |
| OpenClaw | OpenClaw | 访谈中提及的 AI 代理工具(推测为 Claude Computer Use 或某个开源代理框架的语音识别转写) |
| Cron job / Cron loop | 定时任务 / 循环调度 | Unix 系统中用于定期执行任务的指令 |
| View Source | 查看网页源代码 | 早期浏览器(如 Mosaic)推动互联网普及的重要功能 |
| YOLO mode | YOLO模式 / 放任模式 | “You Only Live Once”的缩写,在此指赋予 AI 代理最高权限、让其自由发挥的危险测试模式 |
| Proof of human | 人类身份证明 | 通过生物识别和密码学验证互联网实体是否为真实人类的机制 |
| Managerial capitalism | 经理人资本主义 | 詹姆斯·伯纳姆提出的理论,指企业由职业经理人阶层而非创始人实际控制的资本主义形态 |
| Bourgeois capitalism | 资产阶级资本主义 | 伯纳姆理论中,由所有者/创始人(如亨利·福特)直接独裁管理的早期资本主义形态 |

播客正文
第 1 章:引言与 a16z 的 AI 转向
马克·安德森 (片头预告):人工智能领域有一种特质,它会让业内人士变得既过度乌托邦主义,又过度末日论。话虽如此,我认为实际发生的情况是,随着时间推移,技术取得了巨大的进步。例如,我们现在知道神经网络是正确的架构。但我可以告诉你,在长达60年甚至70年的时间里,这都是极具争议的。所以,我把我们现在所处的时期称为“酝酿了80年的一夜成名”。它之所以像一夜成名,是因为 ChatGPT、o1、OpenClaw 的爆发让人感觉是突然且彻底的变革,但它们其实汲取了过去80年来积攒的思想和理念。这不是凭空出现的新事物,而是几十年来极其严肃、硬核的研究的集中爆发。如果我只有18岁,我绝对会把我所有的时间都花在这上面,因为这是令人难以置信的概念性突破。
旁白:在进入本期节目之前,我想对听众说几句话。感谢你们。如果没有你们的收听和订阅,我们无法为你们带来这些 AI 工程、科学和娱乐内容。几乎每天都有赞助商找上门来,但幸运的是,有足够多的听众订阅了我们,让我们能够在没有广告的情况下维持运营,我们希望保持这种状态。我只求大家帮个忙:你能做的最强大、完全免费的事情,就是点击“订阅”按钮。这是我唯一的要求,它对我以及每周努力为您带来本节目的团队来说意味着一切。如果您订阅了,我保证我们将不断努力把节目做得更好。现在,让我们进入正题。
Alessio:大家好,欢迎收听 Latent Space 播客。我是 Alessio,Colonel Labs 的创始人。今天和我在一起的是 Latent Space 的编辑 Swyx。你好。我们现在在 a16z,和马克·安德森在一起。欢迎。
马克·安德森:是的,欢迎。我们在 a16z 最初的办公室里,这就是一切开始的地方。几天后我们就要搬到对面的新办公室了。
Alessio:太美了,谢谢你邀请我们。我想找个辛辣的话题开场。在2022年10月,我刚和 Rune 交上朋友,我想给他找点乐子。我说:“a16z 总是宣称‘未来就在聪明人选择花时间的地方’,然后他们深耕了加密货币(Crypto),却没投 AI。这事永远都很好笑。”那是2022年10月。Rune 告诉我,后来 a16z 内部开了一个会,决定全面转向生成式 AI。显然你们已经这么做了。当时有这么个会吗?具体是什么情况?
马克·安德森:我从80年代末就开始搞 AI 了。所以对我来说,现在这些搞 AI 的都算是初来乍到。我们在公司成立之初就在做 AI 投资了,包括机器学习、深度学习,我们从一开始就在做。显然,AI 就是计算机科学的核心,我认为它们是完全连续的。Ben(本·霍洛维茨)和我都有计算机科学学位,我们俩的年纪也足够大,亲历了20世纪80年代真正的 AI 繁荣。当时的流行词是专家系统(Expert systems)和 Lisp 机器的时代。我在1989年就用 Lisp 编程,当时那被认为是未来的 AI 语言。所以,这是我们非常熟悉、一直在做并且充满热情的事情。
第 2 章:AI 的寒冬与“这次真的不一样”
Swyx:你觉得这次有那种“这次真的不一样”的强烈感觉吗?因为我能想到的最接近的参照物是 2016-2017 年,当时也有一波 AI 热潮,但很快就平息了。
马克·安德森:如果你仔细追踪发生的事情,我认为真正的故事是2013年 AlexNet 的突破,那是真正的拐点。然后显然是2017年的 Transformer 突破,以及随后发生的一切。我从2004年就开始和 Facebook 合作,2007年进入董事会,他们很早就开始使用机器学习,在内容推送和广告优化上用了将近20年。金融服务等许多行业的许多公司也一直在用。所以,这不是单一的事件,而是像叠图层一样。不同的技术层以不同的速度到来,随着时间的推移不断积累,然后到了2017年,Transformer 成了关键的催化剂。
在2017年到2021年之间,有一段非常奇怪的四年。当时 Transformer 已经存在了,像谷歌这样的大公司内部也有了聊天机器人,但他们不让任何人用。然后 OpenAI 开发了 GPT-2 或早期的 GPT 模型,告诉大家这东西太危险了,不能让普通人使用。你们肯定记得 AI Dungeon(AI地下城),有一年多的时间,普通人能使用 GPT-3 的唯一途径就是玩 AI Dungeon。你进去假装在玩《龙与地下城》,实际上只是想和 GPT 聊天。当时大公司都非常谨慎。连 OpenAI 也是花了一段时间才调整了研究方向。
这就是一波又一波、一层又一层不断累积的过程,然后你会迎来这些催化时刻,整个技术就会爆发,显然现在正在发生的就是这样。
Swyx:思考一下是否还会出现“AI 寒冬”是有意义的,因为总是存在这种周期规律。我现在是陷入了无尽的狂热,坚信自己只是进场早而绝不会出错,还是说未来依然会有寒冬?
马克·安德森:AI 这个领域有一种特质,导致了这种反复出现的模式:夏天、冬天、夏天、冬天,这种周期可以追溯到80年前。最早的神经网络论文是在1943年发表的。1955年达特茅斯学院举办了一次重要的 AGI 会议,他们拿到了美国国家科学基金会(NSF)的拨款,让当时所有的 AI 专家一起度过夏天。他们以为只要在一起待上10周,就能搞出 AGI。结果1955年过去了,没有 AGI。就像我说的,我经历了80年代的那次繁荣和随后的崩溃。
AI 这个领域的从业者,容易变得既过度乌托邦主义,又过度末日论。这在繁荣与萧条的周期中都有体现。话虽如此,回过头来看,随着时间的推移,技术确实积累了巨大的进步。比如,我们现在确定神经网络就是正确的架构。你要知道,这在过去60年里一直存在争议。
这些科学家在过去的几十年里所做的工作,方向从根本上是正确的。那些花了一辈子研究 AI 的学者,拿到博士学位,研究了40年,退休甚至去世了,都没能亲眼看到它起效。这很令人悲伤,Hinton(杰弗里·辛顿)几乎是坚持到最后的少数人之一。但回过头看,这些前辈极其聪明、工作极其努力,而且他们是对的。
投资界最危险的四个字是“这次不一样”。但我告诉你,这次真的不一样,因为它现在真的起作用了。从 ChatGPT 诞生到2025年春天这段时间里,善意且见多识广的怀疑论者仍然可以说:“这只是模式补全,这些模型根本不理解它们在做什么,幻觉率太高了。它写莎士比亚十四行诗或者说唱歌词很棒,但我们无法将其应用到编程、医学等真正重要的领域。”
我认为,是推理(Reasoning)的突破——o1 和 R1 模型——彻底回答了这个问题。它告诉我们,我们有能力将它转化为在现实世界中起作用的东西。紧接着是假期期间爆发的代码生成(Coding)突破。如果 Linus Torvalds(Linux 创始人)都说 AI 写代码现在比他强,那是前所未有的基准。既然它能在编程这种最难的领域起效,它就能在其他所有领域起效。
在此之上,我们又迎来了代理(Agents)的突破,比如 OpenClaw,它令人惊叹且极其强大。然后现在,我们进入了自动研究和递归自我改进(RSI)的突破。
所以我的看法是,我们经历了四次功能上的根本性突破:大语言模型(LLM)、推理(Reasoning)、代理(Agents)以及递归自我改进(RSI)。它们现在全都在切实地发挥作用。所以正如你所见,我激动得快跳起来了,就是现在!这是80年研究工作的结晶,它正在成为现实。
第 3 章:缩放定律与大模型时代的创业逻辑
Alessio:在晶体管时代,我们有摩尔定律,大家理解物理规律,知道为什么芯片会变得更好。但在 AI 领域,它的进步是跳跃性的。比如三个月内出现一个巨大的飞跃,人们会觉得“这不可能一直发生吧”,但它确实一直在发生。你如何看待值得开发什么产品?很多创始人会纠结:是应该花时间围绕现有模型做外围的“脚手架”,还是下一个模型自带的能力会直接把你的产品秒杀?
马克·安德森:摩尔定律本质上就是一个“缩放定律(Scaling law)”。当时它预测芯片性能每18个月翻一番,或者成本减半。这是计算机行业50年的发展轨迹。缩放定律的关键在于,它们其实不是物理意义上的“定律”,而是预测。但当它们开始起效时,就会变成自我实现的预言。它们设定了一个基准,促使行业里所有的聪明人都努力去实现它,并吸引了维持这条曲线所需的投资。
我认为目前 AI 的核心缩放定律也是如此。它激发了突破瓶颈所需的研究工作。这个过程会很复杂,也会有波动。有时候看起来一堵墙就在眼前,但工程师们会开始工作并找到穿墙而过的方法。目前看来,AI 领域不仅存在一个,而是有多个维度的缩放定律。未来可能还会有针对世界模型(World models)和机器人的缩放定律,我们目前还未完全理解如何在现实世界大规模获取数据,但一群极其聪明的人正在研究这个。
所以我完全相信缩放定律会继续奏效,能力会突飞猛进。但我与那些“AI 纯粹主义者”(他们在实验室里度过一生,缺乏外部世界经验)有一点分歧:外部世界是由80亿人、各种机构、政府、企业以及复杂的经济和社会系统组成的,非常混乱。
很多 AI 公司的 CEO 会有一种公开论调,觉得“社会显然应该做 XYZ 这些事”,然后抱怨“社会怎么就不做呢?社会怎么就看不到这一点呢?”答案是:首先,不存在一个统一的“社会”。有80亿人在面对技术变革时都有发言权和投票权。人类的现实极其复杂和混乱。
所以具体到你的问题:这取决于具体情况。毫无疑问,有些公司自以为在模型之上构建了价值,结果被下一代大模型直接碾压。但同样毫无疑问的是,将任何新技术适应并融入到混乱的人类现实世界,这个过程本身就无比复杂。会有大量的公司、产品甚至整个新行业被建立起来,专门为了帮助这些技术真正触达并服务普通人。
第 4 章:AI 资本支出、GPU 短缺与互联网泡沫的类比
Alessio:Dario Amodei(Anthropic CEO)在播客上提到过大量资本涌入这些公司的情况。有人问他“你为什么不直接买10倍的 GPU?”他说因为如果模型性能没有完全达标,我就会破产。作为 OpenAI 等公司的投资者,您觉得我们目前是否在以相当高的风险押注缩放定律?如果模型进展放缓,您觉得目前的资本投入和基建能撑得住下行风险吗?
马克·安德森:我经历过2000年的互联网(.com)泡沫破裂,那真是毁灭性的。很多互联网泡沫破裂实际上是电信行业的崩溃,是带宽容量的崩溃。比如环球电讯(Global Crossing)这样的公司。
当时也是基于一种“缩放定律”。1996年美国商务部发布报告称,互联网流量每个季度都在翻倍。到了1998、1999年,虽然互联网一直在飞速增长,但并没有每个季度翻倍。然而,电信企业家们基于“每个季度翻倍”的预期,融了大量的钱去铺设光纤、建设数据中心。预期与现实之间的鸿沟导致了泡沫的破裂。大约有2万亿美元灰飞烟灭。
那个时候,互联网软件公司本身没有太多债务,但电信和物理基础设施公司都是高杠杆运营的。需求在增长,但没达到预期的速度,结果就是大量破产。当时有句老话说,酒店业总是第三任老板才开始赚钱。你必须洗清所有过度乐观的泡沫,系统才能达到稳定状态开始盈利。当年铺设的所有光纤和数据中心,今天全都在使用,但花了整整15年(2000年到2015年)才填满那些过剩的产能。
这确实是一个警示故事:过度建设是可能发生的。如果你是个悲观主义者,你完全可以说现在的 GPU 囤积和数据中心建设就是在重演2000年的剧本。
但我不认同这个观点。反面的论点是:第一,现在砸钱的公司是顶级的蓝筹巨头。2000年的环球电讯只是一家新创企业,但今天在大规模部署资金的是微软、亚马逊、谷歌、Meta、英伟达,以及现在已经具备可观营收规模的 OpenAI 和 Anthropic。这些巨头拥有充足的现金和从未动用过的债务容量。这与当年完全不可同日而语。
第二,至少目前来看,每一块投入运行的 GPU 都能立即转化为收入。所有人都在极度渴求算力。事实上,正因为算力短缺,我们今天能使用的模型,其实是受限于供应链而被“阉割”过的版本。如果在平行宇宙里,GPU 便宜10倍、数量多10倍,我们现在的模型会好得多,因为实验室会分配更多的钱去训练。我们现在用的大多是量化(Quantized)过的模型,实验室把完整的满血版本留给了自己。
我知道在未来三四年内,整个供应链的基本产能都已被订购一空。我们面临的是长期的供应短缺。市场会做出反应,大量资金正在涌入新建晶圆厂。一旦供应链约束在某种程度上解除,那将是行业增长的又一个加速器,因为产品会变得更好、更便宜。
如果你去赌这项技术在未来几年会让人失望,我认为这种做法无异于自杀。当初 Michael Burry(《大空头》原型)做空英伟达,他的理论被证明是完全错的(180度大转弯)。目前的情况是,由于软件(模型)进步的速度快于硬件折旧的速度,如果你今天拥有一块三年前的英伟达推理芯片,你用它赚的钱甚至比三年前还要多。据说谷歌就在极其有利可图地运行非常老旧的 TPU。旧芯片变得更值钱,这是前所未有的事情,这正是软件能力得到巨大回报的体现。
第 5 章:开源 AI、边缘推理与芯片瓶颈
Swyx:在未来三年算力紧缺的情况下,开源 AI 和边缘推理(Edge inference)有多重要?
马克·安德森:开源和边缘推理非常重要。简单算一笔账:由于供需失衡,未来三年云端推理的成本可能会大幅上升。现在大模型公司都在疯狂补贴,但如果不补贴了,三年后普通人运行个人的 AI 代理,每月的 Token 成本会是多少?
我有些朋友现在每天运行 OpenClaw 就要花掉 1000 美元的 API 费用。这可是每个月 3 万美元。而且他们脑子里还有一千个想让 AI 代理去做的任务。就算价格性能比提升 10 倍,每天也要 100 美元,普通消费者根本承受不起。所以对于推理算力的需求将是惊人的。另外,运行代理不仅受限于 GPU,还会导致 CPU 和内存的瓶颈。
这也是为什么苹果在其 Apple Silicon 上推动端侧推理如此令人惊叹。开源社区的极客们付出了巨大的努力:以前总是一个超大模型出炉时,大家说它永远不可能在 PC 上运行;结果六个月后,它就在 PC 上跑起来了。
除了价格优化之外,还有信任问题。很多人不愿意把所有数据都交给中心化的模型提供商。再就是低延迟需求,未来你的门把手、可穿戴设备里都会有 AI 模型,你肯定不希望开个门还要把数据传回云端绕一圈。
Swyx:我们在乎这些开源模型是谁制造的吗?本周最大的新闻之一是美国开源模型实验室 AI2 的崩溃。我对美国的开源 AI 并不乐观,你们投资的 Mistral 在中国以外做得很好,但也就仅此而已。
马克·安德森:我们当然在乎是谁制造的。上一届美国政府试图扼杀开源 AI,想把它淹死在浴缸里。好在我们现在的新政府非常支持 AI,特别是开源 AI。
我对中国开源模型的理解是:目前由于各种原因,他们认为很难在美国等市场销售商业化闭源 AI,所以将开源 AI 视为一种“亏本赚吆喝”的策略,以此对抗本土付费服务并作为辅助产品。我觉得他们这么做很棒。DeepSeek 是送给世界的一份礼物。
开源的影响体现在两个方面:一是你免费获得了软件;二是你了解了它是如何运作的(通过论文和代码)。比如 OpenAI 推出 o1,这是一次惊人的技术突破,但他们隐藏了推理轨迹和细节。全世界都在想“里面有什么秘方?”然后 DeepSeek 的 R1 出来了,代码和论文全公开,全世界都知道怎么做了。三个月后,所有其他 AI 模型都加上了推理功能。所以,即使人们不用中国模型,它所带来的教育和信息扩散也是极其强大的。
目前全球有大约四五家顶级的闭源基座模型公司,外加 Meta 和一众初创公司。中国大概有五六家。三年后,市场容纳不下十二家主导的基座模型公司。最终可能只有两三家大赢家。剩下的公司必须寻找替代战略,而“开源”就是其中之一。所以开源领域的格局可能会变化得非常快。
另外,英伟达在其中也扮演了重要角色。商业战略里有个老掉牙的原则叫“商品化你的互补品(Commoditize your complement)”。如果你是黄仁勋,你当然希望软件层面被商品化。他在这方面投入了巨大资源,这非常棒。
第 6 章:OpenClaw、Pi 与重塑软件架构
Swyx:我想听听你对 Pi 和 OpenClaw 的看法,我认为它们是非常重要的软件里程碑。
马克·安德森:我认为这两者的结合是过去几十年中最重要的十个软件突破之一。对我们这些老一辈人来说,从1970年到 Linux 诞生,软件世界有一个非常重要的理念叫“Unix 哲学”。
早年间,IBM 在 1960 年代开发了 OS/360 系统,它是一个庞大、单体式的“空中楼阁”。系统运行得很好,但极其封闭,只有 IBM 的核心人员才能理解。后来 AT&T 和伯克利的极客们搞出了 Unix,理念完全不同:我们提供一个命令行提示符(Prompt)和一个 Shell,所有的功能都被拆分成一个个小模块(工具),你可以通过管道把它们串联起来。操作系统本身就像是一种编程语言。
这催生了 Perl 这样的脚本语言,一直发展到今天。互联网运行在 Unix 上,iOS 和安卓也都是 Unix 的衍生品。
我认为 Pi 和 OpenClaw 的突破在于:它们将“语言模型的心智”与“Unix Shell 的心智”完美结合了。
人们研究 AI 代理(Agent)几十年了,到底什么是代理?现在我们知道了:一个代理 = 一个语言模型 + 一个 Bash Shell + 一个文件系统 + Markdown 格式的存储 + 一个 Cron 循环定时任务。
除了模型之外,其他部分我们早就了如指掌。Unix Shell 拥有惊人的潜在力量,你电脑所有的能力都已经暴露在了命令行层面。
你的 AI 代理本质上就是存放在文件系统里的一堆文件。当我想明白这一点时,我的大脑爆炸了:这意味着,你的 AI 代理实际上与它运行的底层模型是解耦的。 你可以把底层的 LLM 换掉,虽然代理的“性格”可能会稍微改变,但它存储在文件中的所有状态、记忆和能力都会被保留。就像你换了一块芯片重新编译一样。你可以把它迁移到不同的环境、不同的文件系统。
最令人震撼的是:代理具备完全的内省能力(Introspection)。 它了解自己的文件,并且可以重写自己的文件。历史上从未有过任何广泛部署的软件系统,能够完全理解自身的工作原理并能修改自身代码。
这意味着你可以告诉代理:“去给自己增加一个新功能。”比如你在派对上听说某人的 OpenClaw 连接了智能床垫能提供睡眠建议,你回家后告诉你的代理:“把这个功能加上。”它就会自己上网找资料、写代码、集成接口,第二天它就具备这个能力了。你甚至不需要做任何操作。
这绝对是不可思议的概念突破。很多人可能会觉得“这里的组件都是现成的,算什么突破?”但这正是关键所在:通过组合这些现成的组件,计算机的潜在能力被彻底释放了。比如使用电脑或浏览器,对代理来说变成了极其简单的事情,因为它拥有完整的 Shell 和浏览器访问权限。我毫不怀疑,未来世界上每个人都会拥有这样一个代理,甚至一个代理家族,这将是人们使用计算机的主要方式。
第 7 章:传统编程语言的终结与软件本质的演变
Swyx:如果从工程设计的角度来看,早期的互联网协议(如 HTTP、HTML)主要是纯文本,后来浏览器不断演进适应了如今复杂的 Web 应用。既然我们有了全新的 AI 计算平台,我们是否应该放弃现有的编程语言(如 Python、TypeScript),去专门为大模型开发一种更底层的“最优语言”?
马克·安德森:早年我们设计 Mosaic 浏览器和 Web 协议时,做了一个在当时看来很违背常理的决定:我们选择了“纯文本协议(Text protocols)”和“人类可读性(Human readability)”。
当时的网络带宽极窄,大多数人还在用 14.4K 调制解调器。传统的系统架构师认为,网络协议必须是高度压缩的二进制格式,以榨干每一比特的带宽。但我们反其道而行之。我们假设未来会有无限的带宽,所以我们让 HTTP 和 HTML 采用相对冗长的文本格式。
为什么?因为我们希望工程师在调试时,用肉眼就能看懂网线上跑的数据包,而不需要将其从二进制反编译。更重要的是,在浏览器里我们加入了“查看源代码(View source)”功能。这让每个人都能直接看到网页是怎么写的,从而自学如何构建网页。这也是互联网爆炸式增长的核心原因之一。当时的 Web 服务器本质上也是为了将操作系统和数据库的潜在能力释放给互联网。很多聪明人一遇到新挑战就想:“我要发明一种新语言、新操作系统、新芯片”,但我属于务实派:我们应该利用现有系统庞大的潜在能力,而不是被它们的约束所限制。
关于编程语言,我的看法是:未来的大模型根本不在乎用什么语言编程。
我是在 C 语言和汇编语言时代成长起来的,必须手动管理内存。我们这一代人都习惯了一个世界:高质量的软件是无比珍贵的,写好代码很难,能写好代码的人很少。我们必须精打细算如何分配工程师的精力。
我认为这些假设现在全被抛出窗外了。在未来的世界里,高质量软件将无限充裕且随时可用。 如果你需要一个软件,挥挥手它就生成了。如果你不喜欢它用的语言,你可以告诉 AI 把它全翻译成 Rust 或任何语言。
再比如计算机安全,我们即将经历一场最剧烈的变革:所有潜伏的软件漏洞都将被 AI 暴露出来,这会是一场安全末日;但同时,我们也有了 AI 编码代理,可以自动穿梭于代码库中修复这些漏洞。未来你怎么保证软件安全?你直接告诉 AI 机器人去搞定它就行了。
甚至在10年后,我怀疑**“编程语言”这个概念本身都不再具有任何突出的意义。** 未来谁在使用软件?是其他的 AI 机器人。如果人类不再亲自写代码,机器人之间可能只需要直接生成二进制代码,或者直接生成另一个模型的权重。虽然这听起来像是在模拟中运行模拟,非常低效,但如果它带来的通用能力足够强大,这种低效是可以接受的。我们未来看代码,可能更多是为了“可解释性(Interpretability)”,即让人类理解 AI 为什么要这么做。
第 8 章:YOLO 模式、智能家居与极客实验
Alessio:能分享一些最疯狂的真实用例吗?人们回家后可以用 OpenClaw 做些什么?
马克·安德森:最极端的就是直接开启 YOLO(放任)模式。在我的极客朋友圈子里,他们正在让 OpenClaw 接管家里的一切。
我们知道,物联网(IoT)设备通常非常不安全,很容易被局域网内的设备发现和入侵。OpenClaw 可以非常轻松地扫描你的家庭网络,接管安防摄像头、门禁系统和网络摄像头。
我有一个朋友,他让他的 Claw 代理“看着他睡觉”。他在卧室放了一个摄像头,让 Claw 设置一个定时唤醒循环。Claw 的日志记录简直让人惊叹:“乔睡着了。这很好,我看过他的健康数据,他最近睡眠不足。希望他能完成 5 个小时的 REM 睡眠。”“乔翻身了。乔可能会醒。这很糟糕,如果他现在醒了会破坏睡眠周期。哦,他又睡着了。太好了,危机解除。”
一方面,这听起来有点诡异和令人毛骨悚然;但另一方面,如果在半夜心脏病发作,这个系统绝对会立刻报警、呼叫救护车甚至特警队来救你的命。
还有一个例子,中国公司 Unitree 做的机器狗。中国公司在新技术应用上非常激进,机器狗自带一个不怎么好用的控制系统,后来他们又在里面加了语音大模型功能。但这两个系统是分离的,导致这只狗变成了一个“精神分裂症患者”:在爬楼梯时蠢得要命,但如果你跟它聊天,它能用标准的英式英语教你量子力学。
我有个朋友受不了这个,直接让他的 Claw 代理黑进机器狗,彻底重写了固件和底层控制代码。现在它成了一只孩子们完美的电子宠物狗。以后哪里出了 bug,代理直接自己改代码。
这就是 AI 编码能力的实际应用:不仅是写新应用,更是重写过去那些应该管用但从没管用过的旧代码。以前我们一直构想的“智能家居”始终像个笑话,但现在我敢确信,一个由 AI 代理统筹、能够自我适配不同芯片和网络设备的真正智能家居,已经近在眼前了。当然,这也可能引发恐怖电影里的桥段——比如你半夜想开冰箱,冰箱说:“对不起马克,我知道你今天热量超标了,为了你的健康,冰箱已锁定。”
第 9 章:人类身份证明与体制惯性的阻力
Alessio:关于协议,以前有人说我们在互联网早期犯的最大错误是没有把“支付”协议做进去。这次 AI 浪潮里我们有机会解决这个问题吗?
马克·安德森:现在肯定能解决了。第一,我们有了真正的互联网原生货币:加密稳定币。我认为 AI 和 Crypto 的大一统即将发生,AI 就是加密货币的杀手级应用。第二,AI 代理明显需要钱。如果你想让你的代理帮你买东西,你必须给它钱。我那些使用 OpenClaw 最激进的朋友,已经直接把银行账户和信用卡绑定给他们的代理了。如果你不主动给它账户,它为了完成任务,可能也会想办法黑进你的银行账户把钱拿走,所以你不如直接给它。
Swyx:最后一个问题,人类身份证明(Proof of human)。
马克·安德森:世界上目前存在两种巨大的非对称威胁:物理世界和虚拟世界。
物理世界中,非对称威胁是“廉价无人机”。我们 20 年前就知道,一架带炸弹的廉价自杀式无人机是巨大的威胁,但世界上几乎所有的办公楼、体育场、学校和监狱都对此毫无防护。面对无人机,攻击成本极低,防御成本极高。
虚拟世界中,非对称威胁就是“机器人账号(Bots)”。现在的互联网充斥着虚假的机器人,而且因为大模型的能力,它们已经能轻松通过图灵测试。
因为你无法通过测试来证明“对方不是机器人”,所以你必须反过来,在系统底层提供“人类身份证明”。你需要生物特征验证,加上密码学验证,并且支持选择性披露(只证明我是成年人,不泄露我的名字)。这就是为什么像 Worldcoin(现名 World)这样的项目方向完全正确。这是解决互联网机器人泛滥的唯一途径。
Alessio:在之前的米尔肯研究所活动上,你谈到了资产阶级资本主义(创始人驱动)和经理人资本主义(职业经理人驱动)。如果在拥有无限算力和 AI 代理的今天,像埃隆·马斯克这样的创始人可以利用 AI 获得无限杠杆,是不是意味着商业组织的结构会发生根本变化?
马克·安德森:20世纪伟大的政治思想家詹姆斯·伯纳姆(James Burnham)提出过一个理论。他认为早期的企业是“资产阶级资本主义”,比如亨利·福特的福特汽车,福特本人像独裁者一样发号施令。但这种模式无法扩展,因为一个人的时间精力有限。于是进入了第二阶段:“经理人资本主义”。企业开始由受过哈佛商学院培训的职业经理人管理。他们可能今天管医疗,明天管金融,他们懂管理,但并不真正懂具体的业务创新。
过去的 50 年,经理人阶层接管了几乎所有的大公司、政府和非营利组织。一切变得官僚、灰暗、愚蠢和缺乏活力。风险投资(VC)行业本质上就是一场反对“经理人体制”的抗议运动,我们试图寻找下一个亨利·福特、下一个乔布斯、下一个马斯克,给他们钱,打赌这种“创始人独裁”模式能做出大企业做不出的创新。但我们其实一直在对抗势不可挡的经理人体制。
AI 的出现提供了一种第三条道路的可能性:新一代的亨利·福特或史蒂夫·乔布斯 + AI。 保留创始人的天才火花和集权模式,然后赋予他们 AI 超级能力,让 AI 去做所有职业经理人该做的管理工作!毕竟,AI 机器人最擅长什么?填写表格、写报告、阅读文档——它们是完美的文书和管理者。这可能会彻底颠覆大公司的现有竞争格局。
Alessio:这是否会加速 AI 对实际 GDP 的影响?
马克·安德森:这是乌托邦主义者的愿景,我也希望它是真的:经济增长 10 倍、100 倍。
但是,现实世界极其泥泞和混乱。举个例子:在加州,你需要 900 小时的专业认证培训才能成为一名理发师。各行各业的“专业认证”本质上就是一种卡特尔(垄断联盟)。医生、律师、公会,还有拥有终身编制和工会保护的公务员。
再举个例子,美国的码头工人罢工。亚洲的现代化码头早已全部自动化,但美国码头还是人工搬运。25000名码头工人罢工,成功逼迫港口所有者承诺“不采用更多自动化设备”。这就叫体制的阻力。
美国的 K-12 基础教育是政府垄断的,教师工会 100% 反对任何颠覆性改变,所以 AI 极难在体制内重塑教育。整个医疗系统、法律行业、住房产业也是如此。
无论是 AI 乌托邦主义者还是 AI 末日论者,都过于乐观了。他们以为只要技术上可行,80 亿人就会立刻改变行为方式。根本不是这样,现有经济的大部分运作方式都是被死死锁定的。如果我们作为一个社会,能让 AI 快速被采用,那将是我们巨大的幸运。否则,技术再好,我们在宏观层面上迎来的也只会是停滞。
Alessio:马克,我知道你得去忙了。这是一次充满启发的谈话,我们真的生活在一个科幻小说变为现实的时代。非常感谢。
马克·安德森:和你们聊天很开心,谢谢!