用我爱人的数据训练大型语言模型
摘要
本文讲述了作者的挚友R和父亲在失业后加入AI数据标注行业,为OpenAI、Anthropic等公司提供高质量的数学推理训练数据。作者揭示了这一行业的矛盾:高学历的知识分子为训练AI提供专业数据,却最终被自己训练的模型取代。文章指出,数据标注工作没有职业发展路径,工作条件恶劣,劳动者被完全边缘化。当模型掌握了这些能力后,就能生成更廉价的合成数据,彻底取代人类专家。这是一个正在自我吞噬的行业,今天的专家数据标注者就是明天的裁员对象。
内容框架与概述
文章开篇讲述了作者与挚友R的友谊,R在大学期间通过Outlier平台开始为AI模型提供数学推理数据标注工作。作者详细描述了数据标注的具体流程:向黑盒模型提出数学问题,模型尝试重构推理路径,标注者需要纠正错误步骤。尽管广告宣传每小时50美元,但实际收入因审核任务和问题难度大打折扣。
接着作者讲述了自己的父亲在失业后也加入这个行业,每小时80美元的报酬吸引了他这样的博士持有者。作者意识到,自己正在硅谷训练的模型,正是依靠挚友和父亲提供的数据。作者用可可豆的比喻说明了数据的价值链:数据是可可豆,Scale AI加工可可豆碎,OpenAI制作巧克力,而劳动者是爬树摘可可豆的小猴子。
文章最后指出了这一行业的根本矛盾:数据标注是一种会自我吞噬的工作。当模型通过高质量人类数据训练后掌握了这些能力,就能以更低的成本生成合成数据,完全取代人类专家。作者以Uber为例,说明零工经济如何先吸引劳动者加入,再压低报酬并最终用自动化取代人类。R最终在没有任何解释的情况下被平台解雇,正是这一趋势的缩影。
核心概念及解读
数据标注的自我吞噬:数据标注是一种会自我消亡的工作。当模型通过人类标注数据掌握了某种能力,就能生成更廉价的合成数据,从而彻底取代人类专家。
推理轨迹:模型为得到最终答案而重构的数学推理路径。标注者需要纠正错误的推理步骤,帮助模型学会正确的推理过程。这种数据对于提升模型推理能力至关重要。
零工经济的陷阱:平台先用高薪吸引劳动者加入,当供应饱和后压低报酬,防止工会组织,最终用自动化技术完全取代人类。Uber和Lyft的发展轨迹预示了数据标注行业的未来。
隐性劳动:创造巨大价值的劳动者被完全边缘化,AI研究员的名字和头像伴随模型发布走红,而实际创造高质量训练数据的标注者却默默无闻,甚至无法将工作列入简历。
原文信息
| 字段 | 内容 |
|---|---|
| 原文 | Training large language models on my loved ones data |
| 作者 | circe |
| 发表日期 | 2026-01-12 |
此摘要卡片由 AI 自动生成