科技
温和的奇点 2026-01-27 ▼
Sam Altman认为人类正在迈向数字超级智能的门槛,AI将通过加速科学进步和提升生产力深刻改变世界。智能与能源的极大丰裕将重塑社会,但奇点的到来并非剧变,而是一条平滑的指数曲线——向前看总显陡峭,回头看则趋于平坦。关键在于解决对齐问题并确保超级智能的广泛可及。
阅读全文 →智能体(Agent)——Google白皮书解读 2026-01-27 ▼
本文为Google发布的智能体白皮书,系统阐述了生成式AI智能体的核心概念与架构。智能体由模型、工具和编排层三大组件构成,能够自主观察环境、调用外部工具并采取行动以实现目标。文章详细介绍了ReAct、思维链、思维树等推理框架,并对比了智能体与传统模型的本质差异,为构建生产级智能体应用提供了完整的技术参考。
阅读全文 →完整的月收入1万美元 SaaS Vibe 编程指南 2026-01-27 ▼
本文介绍了如何利用 Vibe 编程工具构建月收入1万美元的 SaaS 产品。作者对比了 Bolt、Lovable、Replit 等工具后推荐 Emergent 平台,并分享了 Token 成本优化技巧、四类核心文档的提示词模板以及 AI Twitter 推文串生成器的完整构建思路,涵盖前端 React + Tailwind CSS 与后端 FastAPI 的技术选型。
阅读全文 →PyTorch官方纪录片 - 驱动AI革命的力量 2026-01-27 ▼
本片回顾了PyTorch从诞生到成为AI领域核心框架的完整历程。从早期碎片化的研究工具生态,到Facebook AI Research内部孵化,再到击败TensorFlow成为研究者首选,PyTorch凭借对研究者的友好设计、活跃的社区支持以及与硬件和云平台的深度集成,最终驱动了ChatGPT和Stable Diffusion等里程碑式产品的诞生。PyTorch基金会的成立标志着其向开放治理模式的转型。
阅读全文 →Anthropic 团队如何使用 Claude Code 2026-01-27 ▼
本文介绍了 Anthropic 内部多个团队使用 Claude Code 的实际案例,涵盖数据基础设施、产品开发、安全工程等部门。各团队通过 Claude Code 实现了 Kubernetes 调试、快速原型设计、测试驱动开发、代码库探索等工作流的显著提效,同时总结了详细编写 Claude.md 文件、建立自给自足循环、培养任务分类直觉等最佳实践。
阅读全文 →宣布推出 Agent2Agent (A2A) 协议 2026-01-26 ▼
谷歌联合超过50家技术合作伙伴推出 Agent2Agent(A2A)开放协议,旨在让不同供应商和框架构建的 AI 智能体实现跨平台通信与协作。该协议基于 HTTP、SSE、JSON-RPC 等现有标准,支持能力发现、任务管理、多模态交互和长时间运行任务,为企业级多智能体生态系统提供标准化的互操作方案。
阅读全文 →使用 AI 编程的十大基本原则 2026-01-26 ▼
本文基于 Anthropic 团队使用 Claude Code 的实践经验,总结了十大 AI 编程基本原则,涵盖上下文管理、迭代协作、检查点设置、任务分类、子代理拆分、自动化重复工作、技能拓展、安全合规、团队文化和生态系统构建等方面,为开发者提供了系统化的 AI 辅助编程方法论。
阅读全文 →为什么我不打算使用AI工具 2026-01-26 ▼
本文仿写温德尔·贝里1987年经典文章《我为什么不打算买电脑》,将其对电脑技术的质疑迁移至当下AI工具语境。作者从能源消耗与数据伦理、企业宣传的虚妄、思考主体性的丧失以及拒绝自我麻痹四个层面阐述了不使用AI工具的理由,并提出九条引入新技术的评判标准,强调技术不应取代深度思考、人际真实互动与个人判断力。
阅读全文 →专家们游刃有余 2026-01-26 ▼
本文通过迷宫比喻深入探讨了专家与新手之间的效率鸿沟。新手往往在自己制造的问题中越陷越深,而专家凭借经验和直觉能够避开陷阱、直击核心。文章指出新手最大的困境不在于能力不足,而在于无法识别关键决策点,也无法区分好建议与坏建议。作者强调找到有同理心的专家进行非正式交流对新手成长至关重要,同时鼓励新手主动探索小众领域以快速建立专长。
阅读全文 →专家们总是游刃有余 2026-01-26 ▼
本文通过迷宫逃脱的生动比喻,深入剖析专家与新手之间的效率鸿沟。专家凭借经验和直觉能高效解决问题,而新手往往在自己制造的困境中越陷越深。文章探讨了新手看不到决策点、专家难以解释直觉、非正式交流对培训的重要性等核心议题,并为新手提供了切实的成长建议。
阅读全文 →下半场——人工智能从解决问题转向定义问题 2026-01-26 ▼
本文提出人工智能正处于中场休息阶段。上半场的核心是开发新的训练方法和模型,而下半场的焦点将从解决问题转向定义问题,评估将变得比训练更重要。作者通过强化学习的视角,阐述了语言预训练、规模化和推理行动三大要素如何构成一套通用配方,使得RL终于具备了泛化能力,从而彻底改变了AI研究的游戏规则。
阅读全文 →What is Amp 2026-01-26 ▼
Amp 是由 Sourcegraph 开发的智能体编程工具,支持在 VS Code 及其兼容分支中运行,也提供命令行版本。它不限制 Token 用量,始终使用最佳模型,支持多人协作与线程共享。用户可通过 AGENT.md 文件配置项目信息,并借助图片上传、文件提及等功能高效完成编码任务。
阅读全文 →OpenAI构建Agent的实用指南 2026-01-26 ▼
本文是OpenAI发布的Agent构建实用指南,面向产品和工程团队,系统介绍了Agent的定义、适用场景、设计基础与编排模式。内容涵盖模型选择、工具定义、指令配置等核心组件,并提供了单Agent与多Agent系统的编排策略,帮助开发者从零开始构建安全、可预测且高效运行的智能Agent系统。
阅读全文 →Ilya Sutskever演讲 - 从压缩视角理解无监督学习的理论框架 2026-01-26 ▼
Ilya Sutskever在本次演讲中探讨了无监督学习的理论基础,提出压缩是理解无监督学习的关键。他从监督学习的数学保证出发,引入Kolmogorov复杂性作为终极压缩器的概念,论证了通过联合压缩未标记数据与目标数据可以揭示共享结构,从而实现有效的无监督学习。演讲还结合iGPT实验验证了该理论,并讨论了线性表征涌现等开放问题。
阅读全文 →Claude Code:重塑开发范式的 AI 编码代理 2026-01-26 ▼
本文全面解析 Anthropic 推出的 Claude Code 终端 AI 编码代理,涵盖其代理性核心定位、深度工具链集成、智能记忆指令系统、多模型选择策略以及成本优化方案,展示了从代码补全到自主规划执行的范式跃迁,为开发者提供了高效人机协作的实践指南。
阅读全文 →AI时代的奇特交易:Windsurf、谷歌与Cognition的三方谜局 2026-01-26 ▼
围绕AI初创公司Windsurf展开的一桩三方交易引发业界关注。OpenAI因反垄断压力退出30亿美元收购后,谷歌以26亿美元抽取核心人才与IP,而Cognition则闪电般收购被掏空的剩余业务,凭借自身工程团队激活空壳价值。这场交易折射出AI时代人才争夺、监管博弈与资本运作的复杂生态。
阅读全文 →动物与幽灵 2025-10-04 ▼
「翻译」Anthropic:为人工智能代理进行有效的上下文工程 2025-10-01 ▼
「翻译」Cognition: 为 Claude Sonnet 4.5 重构 Devin:经验与挑战 2025-09-30 ▼
AI研究人员如何意外发现他们对学习的固有认知是错误的 2025-08-18 ▼
传统机器学习理论认为过大的模型必然导致过拟合,但研究人员发现大规模神经网络反而表现更优,出现了双重下降现象。彩票假说为此提供了解释——大型网络的成功并非源于学习复杂解决方案,而是因为拥有更多随机初始化的子网络,从而大幅提升找到简单优雅解决方案的概率。这一发现调和了经典理论与实践之间的矛盾,也重新定义了我们对智能本身的理解。
阅读全文 →AI原生软件工程师 2025-07-02 ▼
本文定义了AI原生软件工程师的概念,即将AI深度融入日常开发工作流程、视其为协作伙伴而非威胁的工程师。文章阐述了核心思维转变——从恐惧AI取代转向主动利用AI放大自身能力,提出信任但验证的协作原则,并给出了从工具准备到逐步建立AI熟练度的实践路径,强调工程师仍需对代码质量承担全部责任。
阅读全文 →Anthropic 如何构建多智能体研究系统 2025-06-13 ▼
Anthropic 分享了其多智能体研究系统从原型到产品的构建经验。该系统采用编排者-工作者模式,由主智能体协调多个并行子智能体完成复杂研究任务。文章详述了系统架构设计、工具选择、提示工程原则以及评估方法,并指出多智能体系统在广度优先的并行研究任务中性能比单智能体高出90.2%,但令牌消耗也达到普通聊天的15倍。
阅读全文 →我用Python八年后学到的东西 2025-05-10 ▼
作者基于八年Python开发经验,结合Python之禅的核心原则,系统阐述了一套实用的编程最佳实践。文章涵盖代码命名规范、简洁设计、避免过度工程、提升可读性、正确处理异常以及善用命名空间等关键要点,帮助开发者写出更优雅、更健壮的Pythonic代码。
阅读全文 →模型为何思考 2025-05-01 ▼
本文系统回顾了大语言模型在推理时如何通过额外计算提升性能的最新进展。从心理学双系统理论类比出发,探讨了思维链prompting、并行采样、序列修订等关键技术,分析了将计算视为资源和潜在变量建模两种理论视角,并梳理了从早期CoT到o1、R1等推理模型的发展脉络。
阅读全文 →编码作为手艺——回归旧式健身房 2025-04-22 ▼
本文以洛奇·巴尔博亚的旧式健身房为隐喻,探讨在AI日益渗透编程工作的时代,开发者应如何保持对编码手艺的掌控。作者主张AI适合处理样板代码和文档总结等机械性工作,但编程的核心思考、架构设计和认知挣扎不应被外包,因为正是这些挣扎塑造了工程师的成长与能力。文章倡导有意识地与AI协作,而非不假思索地依赖AI。
阅读全文 →Claude Code 智能编程最佳实践指南 2025-04-18 ▼
本文介绍了 Anthropic 推出的命令行智能编程工具 Claude Code 的使用技巧与最佳实践。内容涵盖如何通过 CLAUDE.md 文件自定义开发环境、优化上下文配置、提升编码效率等方面,适用于不同代码库、编程语言和开发环境,帮助开发者更好地将 AI 融入日常编程工作流。
阅读全文 →作为普通技术的人工智能 2025-04-15 ▼
本文提出将人工智能视为一种普通技术而非超级智能实体的分析框架。作者从技术扩散速度、人机协作分工、风险分类与政策韧性四个维度展开论述,指出AI的经济社会变革将以数十年为尺度渐进发生,主张拒绝技术决定论,通过韧性导向的政策应对不确定性,而非诉诸激进干预或末日叙事。
阅读全文 →Google 官方提示工程白皮书 2025-04-10 ▼
这份由Google发布的提示工程白皮书系统介绍了大语言模型的提示设计方法。内容涵盖LLM输出配置、零样本与少样本提示、思维链推理、ReAct等多种提示技巧,并深入探讨代码提示和多模态提示的应用场景,最后给出了一系列实用的最佳实践建议,帮助读者从入门到精通掌握提示工程。
阅读全文 →Google Cloud Next 2025 AI发布会全景解读 2025-04-09 ▼
谷歌云在2025年度大会上发布了全栈AI创新成果,涵盖第七代TPU Ironwood芯片、Gemini 2.5系列模型、AI Hypercomputer超算架构、Agent Development Kit智能体开发框架以及Agentspace企业智能体平台,并宣布年度资本支出约750亿美元,全面推进基础设施、模型能力与行业应用落地。
阅读全文 →主动自觉地使用AI现已成为Shopify的基本要求 2025-04-07 ▼
Shopify CEO Tobi Lutke发布内部备忘录,宣布主动使用AI已成为公司对所有员工的基本要求。备忘录指出AI是倍增器,能让优秀员工产出百倍成果,并将AI使用纳入绩效评估体系。团队在申请增加人员前须先证明无法通过AI完成目标,公司致力于在AI普及时代重新定义创业形态。
阅读全文 →软件工程师的疯狂挑战 2025-04-06 ▼
本文以略带讽刺的口吻揭示了现代软件工程师面临的荒诞处境。从掌握多种编程语言、框架到被迫成为全栈工程师,再到学习Docker、AWS和Terraform等运维技能,工程师的职责不断膨胀。作者感叹软件行业缺乏专业分工,一个人被期望承担从前端到后端、从开发到运维甚至管理的所有角色,并以建筑行业的分工模式作为对比进行反思。
阅读全文 →为什么我停止使用 AI 代码编辑器 2025-04-01 ▼
作者分享了自己从代码编辑器中移除所有AI集成工具的原因。通过与特斯拉自动驾驶的类比,他发现长期依赖AI工具导致基础编程能力退化和技术直觉丧失。他主张将AI作为独立于编辑器的辅助工具,手动管理上下文,保持较高的使用门槛,以避免过度依赖。文章建议开发者坚持练习基础技能,不要让AI替代自身思考。
阅读全文 →山姆·奥特曼被OpenAI解雇的真实内幕 2025-03-28 ▼
2023年11月,OpenAI董事会秘密投票解雇了CEO山姆·奥特曼。本文基于数十位亲历者的采访,揭示了奥特曼被罢免的深层原因——包括反复误导董事会、隐瞒创业基金所有权、绕过安全审查流程,以及挑拨高管内斗等信任破裂行为,还原了这场科技史上最戏剧性权力更迭的完整经过。
阅读全文 →超越70%:最大化AI辅助编码中人类贡献的30% 2025-03-14 ▼
本文探讨了AI编码助手能够完成约70%的常规编码工作,但剩余30%的关键部分仍依赖人类技能。文章深入分析了AI在处理边缘情况、系统架构和代码正确性方面的局限,并为高级和初级开发者提供了在AI时代应重点培养的持久工程技能的实用指南。
阅读全文 →为你的软件工程职业生涯做好未来规划 2024-12-24 ▼
本文以务实视角分析了大型语言模型对软件工程职业的实际影响。作者指出AI工具正在增强而非取代工程师,并针对初级、中级工程师分别提出适应策略。文章给出六项未来保障建议,包括深化计算机基础、发展系统设计能力、建立领域专长、精通开发运维、提升沟通技巧以及积极使用AI工具,同时强调设计思维和产品意识的重要性。
阅读全文 →关于《对泛化的一个观察》的笔记 2023-10-01 ▼
本文是对 Ilya Sutskever 在2023年西蒙斯研究所研讨会演讲的详细笔记。演讲从压缩理论的视角解释无监督学习为何有效,核心论点是预测与压缩之间存在一一对应关系。通过引入柯尔莫戈洛夫复杂度、条件复杂度和联合压缩等概念,论证了好的无监督学习算法本质上是好的压缩器,并最终将联合压缩与最大似然估计联系起来。
阅读全文 →苦涩的教训 2019-03-13 ▼
缔造谷歌庞大帝国的友谊 2018-12-03 ▼
本文讲述了谷歌两位顶尖工程师Jeff Dean和Sanjay Ghemawat长达数十年的合作友谊。他们通过在同一台电脑前共同编程的独特方式,解决了谷歌早期面临的索引崩溃、硬件故障和系统扩展等关键难题,重写了公司核心基础设施,推动谷歌从一家初创公司成长为互联网巨头。两人是谷歌仅有的十一级高级院士,被誉为公司一个大脑的两半。
阅读全文 →扎克伯格能在Facebook破坏民主之前修复它吗 2018-09-10 ▼
本文是《纽约客》对Facebook创始人马克·扎克伯格的深度特写。在经历了两年持续不断的争议之后,记者走进扎克伯格位于帕洛阿尔托的家中,试图探究这位全球最知名的科技企业家如何面对Facebook对民主制度造成的威胁,以及他能否真正修复这个拥有数十亿用户的社交平台所带来的深层问题。
阅读全文 →自动化的讽刺 1983-01-01 ▼
本文探讨了工业过程自动化中一系列讽刺性悖论——自动化程度越高,对操作人员的依赖反而越关键。自动化削弱了操作人员的手动技能和认知能力,却在异常情况下要求他们具备更高水平的判断与干预能力。文章分析了监控失效、技能退化、工作记忆不足等问题,并讨论了人机协作的可能解决途径。
阅读全文 →多则不同 1972-08-04 ▼
温和的奇点 2026-01-27 ▼
Sam Altman认为人类正在迈向数字超级智能的门槛,AI将通过加速科学进步和提升生产力深刻改变世界。智能与能源的极大丰裕将重塑社会,但奇点的到来并非剧变,而是一条平滑的指数曲线——向前看总显陡峭,回头看则趋于平坦。关键在于解决对齐问题并确保超级智能的广泛可及。
阅读全文 →完整的月收入1万美元 SaaS Vibe 编程指南 2026-01-27 ▼
本文介绍了如何利用 Vibe 编程工具构建月收入1万美元的 SaaS 产品。作者对比了 Bolt、Lovable、Replit 等工具后推荐 Emergent 平台,并分享了 Token 成本优化技巧、四类核心文档的提示词模板以及 AI Twitter 推文串生成器的完整构建思路,涵盖前端 React + Tailwind CSS 与后端 FastAPI 的技术选型。
阅读全文 →Anthropic 团队如何使用 Claude Code 2026-01-27 ▼
本文介绍了 Anthropic 内部多个团队使用 Claude Code 的实际案例,涵盖数据基础设施、产品开发、安全工程等部门。各团队通过 Claude Code 实现了 Kubernetes 调试、快速原型设计、测试驱动开发、代码库探索等工作流的显著提效,同时总结了详细编写 Claude.md 文件、建立自给自足循环、培养任务分类直觉等最佳实践。
阅读全文 →使用 AI 编程的十大基本原则 2026-01-26 ▼
本文基于 Anthropic 团队使用 Claude Code 的实践经验,总结了十大 AI 编程基本原则,涵盖上下文管理、迭代协作、检查点设置、任务分类、子代理拆分、自动化重复工作、技能拓展、安全合规、团队文化和生态系统构建等方面,为开发者提供了系统化的 AI 辅助编程方法论。
阅读全文 →专家们游刃有余 2026-01-26 ▼
本文通过迷宫比喻深入探讨了专家与新手之间的效率鸿沟。新手往往在自己制造的问题中越陷越深,而专家凭借经验和直觉能够避开陷阱、直击核心。文章指出新手最大的困境不在于能力不足,而在于无法识别关键决策点,也无法区分好建议与坏建议。作者强调找到有同理心的专家进行非正式交流对新手成长至关重要,同时鼓励新手主动探索小众领域以快速建立专长。
阅读全文 →下半场——人工智能从解决问题转向定义问题 2026-01-26 ▼
本文提出人工智能正处于中场休息阶段。上半场的核心是开发新的训练方法和模型,而下半场的焦点将从解决问题转向定义问题,评估将变得比训练更重要。作者通过强化学习的视角,阐述了语言预训练、规模化和推理行动三大要素如何构成一套通用配方,使得RL终于具备了泛化能力,从而彻底改变了AI研究的游戏规则。
阅读全文 →OpenAI构建Agent的实用指南 2026-01-26 ▼
本文是OpenAI发布的Agent构建实用指南,面向产品和工程团队,系统介绍了Agent的定义、适用场景、设计基础与编排模式。内容涵盖模型选择、工具定义、指令配置等核心组件,并提供了单Agent与多Agent系统的编排策略,帮助开发者从零开始构建安全、可预测且高效运行的智能Agent系统。
阅读全文 →Claude Code:重塑开发范式的 AI 编码代理 2026-01-26 ▼
本文全面解析 Anthropic 推出的 Claude Code 终端 AI 编码代理,涵盖其代理性核心定位、深度工具链集成、智能记忆指令系统、多模型选择策略以及成本优化方案,展示了从代码补全到自主规划执行的范式跃迁,为开发者提供了高效人机协作的实践指南。
阅读全文 →动物与幽灵 2025-10-04 ▼
「翻译」Cognition: 为 Claude Sonnet 4.5 重构 Devin:经验与挑战 2025-09-30 ▼
AI原生软件工程师 2025-07-02 ▼
本文定义了AI原生软件工程师的概念,即将AI深度融入日常开发工作流程、视其为协作伙伴而非威胁的工程师。文章阐述了核心思维转变——从恐惧AI取代转向主动利用AI放大自身能力,提出信任但验证的协作原则,并给出了从工具准备到逐步建立AI熟练度的实践路径,强调工程师仍需对代码质量承担全部责任。
阅读全文 →我用Python八年后学到的东西 2025-05-10 ▼
作者基于八年Python开发经验,结合Python之禅的核心原则,系统阐述了一套实用的编程最佳实践。文章涵盖代码命名规范、简洁设计、避免过度工程、提升可读性、正确处理异常以及善用命名空间等关键要点,帮助开发者写出更优雅、更健壮的Pythonic代码。
阅读全文 →编码作为手艺——回归旧式健身房 2025-04-22 ▼
本文以洛奇·巴尔博亚的旧式健身房为隐喻,探讨在AI日益渗透编程工作的时代,开发者应如何保持对编码手艺的掌控。作者主张AI适合处理样板代码和文档总结等机械性工作,但编程的核心思考、架构设计和认知挣扎不应被外包,因为正是这些挣扎塑造了工程师的成长与能力。文章倡导有意识地与AI协作,而非不假思索地依赖AI。
阅读全文 →作为普通技术的人工智能 2025-04-15 ▼
本文提出将人工智能视为一种普通技术而非超级智能实体的分析框架。作者从技术扩散速度、人机协作分工、风险分类与政策韧性四个维度展开论述,指出AI的经济社会变革将以数十年为尺度渐进发生,主张拒绝技术决定论,通过韧性导向的政策应对不确定性,而非诉诸激进干预或末日叙事。
阅读全文 →Google Cloud Next 2025 AI发布会全景解读 2025-04-09 ▼
谷歌云在2025年度大会上发布了全栈AI创新成果,涵盖第七代TPU Ironwood芯片、Gemini 2.5系列模型、AI Hypercomputer超算架构、Agent Development Kit智能体开发框架以及Agentspace企业智能体平台,并宣布年度资本支出约750亿美元,全面推进基础设施、模型能力与行业应用落地。
阅读全文 →软件工程师的疯狂挑战 2025-04-06 ▼
本文以略带讽刺的口吻揭示了现代软件工程师面临的荒诞处境。从掌握多种编程语言、框架到被迫成为全栈工程师,再到学习Docker、AWS和Terraform等运维技能,工程师的职责不断膨胀。作者感叹软件行业缺乏专业分工,一个人被期望承担从前端到后端、从开发到运维甚至管理的所有角色,并以建筑行业的分工模式作为对比进行反思。
阅读全文 →山姆·奥特曼被OpenAI解雇的真实内幕 2025-03-28 ▼
2023年11月,OpenAI董事会秘密投票解雇了CEO山姆·奥特曼。本文基于数十位亲历者的采访,揭示了奥特曼被罢免的深层原因——包括反复误导董事会、隐瞒创业基金所有权、绕过安全审查流程,以及挑拨高管内斗等信任破裂行为,还原了这场科技史上最戏剧性权力更迭的完整经过。
阅读全文 →为你的软件工程职业生涯做好未来规划 2024-12-24 ▼
本文以务实视角分析了大型语言模型对软件工程职业的实际影响。作者指出AI工具正在增强而非取代工程师,并针对初级、中级工程师分别提出适应策略。文章给出六项未来保障建议,包括深化计算机基础、发展系统设计能力、建立领域专长、精通开发运维、提升沟通技巧以及积极使用AI工具,同时强调设计思维和产品意识的重要性。
阅读全文 →苦涩的教训 2019-03-13 ▼
扎克伯格能在Facebook破坏民主之前修复它吗 2018-09-10 ▼
本文是《纽约客》对Facebook创始人马克·扎克伯格的深度特写。在经历了两年持续不断的争议之后,记者走进扎克伯格位于帕洛阿尔托的家中,试图探究这位全球最知名的科技企业家如何面对Facebook对民主制度造成的威胁,以及他能否真正修复这个拥有数十亿用户的社交平台所带来的深层问题。
阅读全文 →多则不同 1972-08-04 ▼
智能体(Agent)——Google白皮书解读 2026-01-27 ▼
本文为Google发布的智能体白皮书,系统阐述了生成式AI智能体的核心概念与架构。智能体由模型、工具和编排层三大组件构成,能够自主观察环境、调用外部工具并采取行动以实现目标。文章详细介绍了ReAct、思维链、思维树等推理框架,并对比了智能体与传统模型的本质差异,为构建生产级智能体应用提供了完整的技术参考。
阅读全文 →PyTorch官方纪录片 - 驱动AI革命的力量 2026-01-27 ▼
本片回顾了PyTorch从诞生到成为AI领域核心框架的完整历程。从早期碎片化的研究工具生态,到Facebook AI Research内部孵化,再到击败TensorFlow成为研究者首选,PyTorch凭借对研究者的友好设计、活跃的社区支持以及与硬件和云平台的深度集成,最终驱动了ChatGPT和Stable Diffusion等里程碑式产品的诞生。PyTorch基金会的成立标志着其向开放治理模式的转型。
阅读全文 →宣布推出 Agent2Agent (A2A) 协议 2026-01-26 ▼
谷歌联合超过50家技术合作伙伴推出 Agent2Agent(A2A)开放协议,旨在让不同供应商和框架构建的 AI 智能体实现跨平台通信与协作。该协议基于 HTTP、SSE、JSON-RPC 等现有标准,支持能力发现、任务管理、多模态交互和长时间运行任务,为企业级多智能体生态系统提供标准化的互操作方案。
阅读全文 →为什么我不打算使用AI工具 2026-01-26 ▼
本文仿写温德尔·贝里1987年经典文章《我为什么不打算买电脑》,将其对电脑技术的质疑迁移至当下AI工具语境。作者从能源消耗与数据伦理、企业宣传的虚妄、思考主体性的丧失以及拒绝自我麻痹四个层面阐述了不使用AI工具的理由,并提出九条引入新技术的评判标准,强调技术不应取代深度思考、人际真实互动与个人判断力。
阅读全文 →专家们总是游刃有余 2026-01-26 ▼
本文通过迷宫逃脱的生动比喻,深入剖析专家与新手之间的效率鸿沟。专家凭借经验和直觉能高效解决问题,而新手往往在自己制造的困境中越陷越深。文章探讨了新手看不到决策点、专家难以解释直觉、非正式交流对培训的重要性等核心议题,并为新手提供了切实的成长建议。
阅读全文 →What is Amp 2026-01-26 ▼
Amp 是由 Sourcegraph 开发的智能体编程工具,支持在 VS Code 及其兼容分支中运行,也提供命令行版本。它不限制 Token 用量,始终使用最佳模型,支持多人协作与线程共享。用户可通过 AGENT.md 文件配置项目信息,并借助图片上传、文件提及等功能高效完成编码任务。
阅读全文 →Ilya Sutskever演讲 - 从压缩视角理解无监督学习的理论框架 2026-01-26 ▼
Ilya Sutskever在本次演讲中探讨了无监督学习的理论基础,提出压缩是理解无监督学习的关键。他从监督学习的数学保证出发,引入Kolmogorov复杂性作为终极压缩器的概念,论证了通过联合压缩未标记数据与目标数据可以揭示共享结构,从而实现有效的无监督学习。演讲还结合iGPT实验验证了该理论,并讨论了线性表征涌现等开放问题。
阅读全文 →AI时代的奇特交易:Windsurf、谷歌与Cognition的三方谜局 2026-01-26 ▼
围绕AI初创公司Windsurf展开的一桩三方交易引发业界关注。OpenAI因反垄断压力退出30亿美元收购后,谷歌以26亿美元抽取核心人才与IP,而Cognition则闪电般收购被掏空的剩余业务,凭借自身工程团队激活空壳价值。这场交易折射出AI时代人才争夺、监管博弈与资本运作的复杂生态。
阅读全文 →「翻译」Anthropic:为人工智能代理进行有效的上下文工程 2025-10-01 ▼
AI研究人员如何意外发现他们对学习的固有认知是错误的 2025-08-18 ▼
传统机器学习理论认为过大的模型必然导致过拟合,但研究人员发现大规模神经网络反而表现更优,出现了双重下降现象。彩票假说为此提供了解释——大型网络的成功并非源于学习复杂解决方案,而是因为拥有更多随机初始化的子网络,从而大幅提升找到简单优雅解决方案的概率。这一发现调和了经典理论与实践之间的矛盾,也重新定义了我们对智能本身的理解。
阅读全文 →Anthropic 如何构建多智能体研究系统 2025-06-13 ▼
Anthropic 分享了其多智能体研究系统从原型到产品的构建经验。该系统采用编排者-工作者模式,由主智能体协调多个并行子智能体完成复杂研究任务。文章详述了系统架构设计、工具选择、提示工程原则以及评估方法,并指出多智能体系统在广度优先的并行研究任务中性能比单智能体高出90.2%,但令牌消耗也达到普通聊天的15倍。
阅读全文 →模型为何思考 2025-05-01 ▼
本文系统回顾了大语言模型在推理时如何通过额外计算提升性能的最新进展。从心理学双系统理论类比出发,探讨了思维链prompting、并行采样、序列修订等关键技术,分析了将计算视为资源和潜在变量建模两种理论视角,并梳理了从早期CoT到o1、R1等推理模型的发展脉络。
阅读全文 →Claude Code 智能编程最佳实践指南 2025-04-18 ▼
本文介绍了 Anthropic 推出的命令行智能编程工具 Claude Code 的使用技巧与最佳实践。内容涵盖如何通过 CLAUDE.md 文件自定义开发环境、优化上下文配置、提升编码效率等方面,适用于不同代码库、编程语言和开发环境,帮助开发者更好地将 AI 融入日常编程工作流。
阅读全文 →Google 官方提示工程白皮书 2025-04-10 ▼
这份由Google发布的提示工程白皮书系统介绍了大语言模型的提示设计方法。内容涵盖LLM输出配置、零样本与少样本提示、思维链推理、ReAct等多种提示技巧,并深入探讨代码提示和多模态提示的应用场景,最后给出了一系列实用的最佳实践建议,帮助读者从入门到精通掌握提示工程。
阅读全文 →主动自觉地使用AI现已成为Shopify的基本要求 2025-04-07 ▼
Shopify CEO Tobi Lutke发布内部备忘录,宣布主动使用AI已成为公司对所有员工的基本要求。备忘录指出AI是倍增器,能让优秀员工产出百倍成果,并将AI使用纳入绩效评估体系。团队在申请增加人员前须先证明无法通过AI完成目标,公司致力于在AI普及时代重新定义创业形态。
阅读全文 →为什么我停止使用 AI 代码编辑器 2025-04-01 ▼
作者分享了自己从代码编辑器中移除所有AI集成工具的原因。通过与特斯拉自动驾驶的类比,他发现长期依赖AI工具导致基础编程能力退化和技术直觉丧失。他主张将AI作为独立于编辑器的辅助工具,手动管理上下文,保持较高的使用门槛,以避免过度依赖。文章建议开发者坚持练习基础技能,不要让AI替代自身思考。
阅读全文 →超越70%:最大化AI辅助编码中人类贡献的30% 2025-03-14 ▼
本文探讨了AI编码助手能够完成约70%的常规编码工作,但剩余30%的关键部分仍依赖人类技能。文章深入分析了AI在处理边缘情况、系统架构和代码正确性方面的局限,并为高级和初级开发者提供了在AI时代应重点培养的持久工程技能的实用指南。
阅读全文 →关于《对泛化的一个观察》的笔记 2023-10-01 ▼
本文是对 Ilya Sutskever 在2023年西蒙斯研究所研讨会演讲的详细笔记。演讲从压缩理论的视角解释无监督学习为何有效,核心论点是预测与压缩之间存在一一对应关系。通过引入柯尔莫戈洛夫复杂度、条件复杂度和联合压缩等概念,论证了好的无监督学习算法本质上是好的压缩器,并最终将联合压缩与最大似然估计联系起来。
阅读全文 →缔造谷歌庞大帝国的友谊 2018-12-03 ▼
本文讲述了谷歌两位顶尖工程师Jeff Dean和Sanjay Ghemawat长达数十年的合作友谊。他们通过在同一台电脑前共同编程的独特方式,解决了谷歌早期面临的索引崩溃、硬件故障和系统扩展等关键难题,重写了公司核心基础设施,推动谷歌从一家初创公司成长为互联网巨头。两人是谷歌仅有的十一级高级院士,被誉为公司一个大脑的两半。
阅读全文 →自动化的讽刺 1983-01-01 ▼
本文探讨了工业过程自动化中一系列讽刺性悖论——自动化程度越高,对操作人员的依赖反而越关键。自动化削弱了操作人员的手动技能和认知能力,却在异常情况下要求他们具备更高水平的判断与干预能力。文章分析了监控失效、技能退化、工作记忆不足等问题,并讨论了人机协作的可能解决途径。
阅读全文 →