David Perell: 我来到哈佛大学,坐在 Steven Pinker 的办公室里。他著有九本书,毕生致力于研究语言、认知与写作。这次访谈,我们从最实用的话题切入——写作的规则。而他的独特之处在于,早在 1980 年代,他就已开始思考人工智能。因此,如果你想了解如何在大语言模型(Large Language Model,LLM)时代写出优质非虚构作品,这期访谈正是为你准备的。

章节目录

  • 开场
  • 为什么糟糕的写作如此普遍
  • 如何让文字产生画面感
  • 为什么写作比说话难得多
  • 脱离语境的例子为何毫无价值
  • 是什么让文字变得优美
  • 为什么学者往往写得如此糟糕
  • 孩子如何教会我们清晰表达
  • 为什么写作越简洁越好
  • 为什么 AI 写作如此平淡无味
  • AI 会如何改写我的书

嗨!我是 David Perell,作家、教师兼播客主播。我坚信,在线写作是当今世界最重要的机遇之一。这是人类历史上第一次,每个人都能自由地向全球受众分享自己的想法。我希望帮助尽可能多的人在网上发表他们的文章。

关注我:

  • Apple:https://podcasts.apple.com/us/podcast/how-i-write/id1700171470
  • Spotify:https://open.spotify.com/show/2DjMSboniFAeGA8v9NpoPv
  • X:https://x.com/david_perell

文字记录

开场介绍

David Perell: 我现在身处哈佛大学,坐在 Steven Pinker 的办公室里。他著有九本书,毕生致力于研究语言、认知与写作。这次访谈中,我们从最实用的内容入手——他的写作法则。他的独特之处在于,早在1980年代就已开始思考人工智能。如果你想在大语言模型(Large Language Model,LLM)时代写出出色的非虚构作品,这期访谈正是为你准备的。

我想聊聊"知识的诅咒"(Curse of Knowledge),以及你书中那幅漫画——上面写道:“开头不错,再多加些乱语就好了。”

为什么烂文章如此泛滥

Steven Pinker: 每当我提出"为什么烂文章如此泛滥"这个问题——无论是学术圈、官僚体系还是企业文化——人们最钟爱的答案,正是那幅漫画所传达的:烂文章是一种刻意为之的选择。这种说法有几个版本:学者无话可说,便用晦涩术语把平庸思想包装起来,以示自己高深莫测;或者某些书呆子借此报复高中时拒绝与他们约会的女生;又或者,人们刻意构建一套只有圈内人才能进入的"秘密语言体系",外人因为没学过那套术语,根本无法涉足。

但我不认为这是烂文章最合理的解释。部分原因来自我的切身观察:我认识很多言之有物的聪明人,他们丝毫没有故弄玄虚的意图,只是不知道如何把想法清晰地表达出来。有个说法叫"汉隆剃刀"(Hanlon’s Razor):凡是能用愚蠢解释的,就不要归咎于恶意。

我说的这些人并不愚蠢,但他们在沟通上犯了一种"糊涂"——不知道如何站在听众的角度思考。我用一段亲身经历来说明这一点:在一场TED大会(科技、娱乐与设计,Technology, Entertainment and Design)上,一位才华横溢的分子生物学家受邀展示其最新研究成果。他的讲话方式,与他在同行面前做报告时如出一辙——大约四秒钟后,台下所有人就已经完全听不懂了。他既没有介绍自己在研究什么问题,也没有说明这个问题为何重要,上来就直接讲实验,满口专业术语。台下坐着来自各行各业的数百人——有娱乐业从业者,有设计师——每个人都能感觉到,没有人听懂了什么。唯一没有意识到这一点的,正是那位杰出的生物学家本人。他绝不愚蠢,但在沟通上,他犯了一个极其低级的错误:他以为自己知道的,别人也知道。

“知识的诅咒"这一来自经济学的术语,描述的是我们共同面临的困境:很难想象自己"不知道"某件事是什么感觉,很难把那样东西从脑海中抹去,然后站到听众或读者的角度,去理解他们知道什么、不知道什么。我认为,这才是烂文章的根本原因。文章里充斥着外人无从理解的缩写和首字母缩略词,充斥着只有极少数圈内人才懂的术语,充斥着各种抽象表述——比如"刺激水平与反应强度成正比”,说的其实不过是"孩子盯着兔子看的时间比盯着卡车要长"。这些都是知识诅咒的具体体现,它还有一些别的名字:自我中心主义(Egocentrism),心智理论(Theory of Mind)的缺失——也就是对他人心理状态缺乏感知的能力。如果让我指出写作与沟通中最根本的一个缺陷,就是这个。

David Perell: 说到这里,我想问问你写书时的具体做法。我知道你会去科德角,在那里尽可能长时间地专注写作。我猜,克服知识诅咒的方法之一,就是和你的目标读者直接交流。你会把稿子给人看吗?具体怎么做?你写作时状态非常投入,在那个过程中,你是如何突破这道障碍的?

Steven Pinker: 我有一个办法——我知道它并不完美,但我尽力而为:努力想象对于那些不知道我所知道的人,读到这段文字是什么感受,也就是刻意培养自己的同理心。然而,知识诅咒的难题恰恰在于:当你身陷其中时,往往浑然不觉。某些对你来说理所当然的事,对别人而言根本不是这样。

所以说到底,我还是会把稿子给人看。我母亲在世时,每完成一份草稿,我都会先请她过目——这么做并非出于大多数学者惯用的那种逻辑,即把母亲当作没什么学问、见识浅薄的普通读者的代表。我母亲极为聪明,博览群书,见解深刻,只是她不是认知心理学家,不是心理语言学家,不在我的专业领域。

我的写作对象,并非随机抽取的普通大众——他们不会买我的书。我写给那些有求知欲、有一定教育背景的读者,但不是我领域内的同行。我母亲就是这类读者的典型代表。当然,在商业出版社出版时,你还有编辑——通常很聪明,但同样不在你的专业领域。我也会把稿子给其他学科的学者看。但令人惊讶的是,即便是学者,在面对其他学科时也同样局限。有时候,就连这栋楼里的同事、同系的学生,甚至同一研究方向的人,拿来给我看的论文提案,我也完全看不懂。原因在于,他们长期沉浸在自己的小圈子里:导师、几位研究生、几位博士后、一名研究助理,大家共用一套行话;一旦踏出这个小圈子,便立刻让人无法理解。


Steven Pinker: 对,就算把稿子给经济学家、历史学家、政治学家或演化生物学家朋友看,他们不是认知心理学家,同样会说:“不好意思,我完全不知道你在说什么。”

Dwarkesh: 说到你的写作,你在视觉与大脑运作机制方面做了大量研究,你的很多写作建议似乎都源于这一背景。我试着概括一下:我们的大脑,以及我们感知世界的方式,在很大程度上是以视觉为核心构建的——因此写好文章意味着要具体,要帮助读者"看见"你想传达的内容。这样概括准确吗?

Steven Pinker: 准确,这正是我的第二条建议。第一条是:想方设法进入读者的大脑,但不要只靠自己去揣摩——要找真实的人来读你的文章,看看对方是否读得懂。这是第一条。第二条是:我研究语言,作为写作者,我也生活在语言之中,但语言其实有些被高估了。所谓"理解",并非由一串文字构成,不是连篇的废话堆砌,语言只是手段,目的是让读者领会你想传达的思想——而思想本身并非一串词句的组合。这些思想往往是视觉性的,也可以是动觉性的(即身体感知的)、情感性的、听觉性的,总归是感官层面的,甚至是概念性的,但绝不仅仅是一堆元音和辅音的排列。因此,写作的关键之一,就是不断让读者能够根据你的文字在脑海中形成具体的画面。如果你说的是一只小兔子,就直接说"小兔子",而不是用"刺激物"这种词。不要动辄说什么"层面"、“视角”、“框架”、“范式”、“概念”。

如何让写作更具视觉感

这些词在你日常工作中或许意义丰富,但没有人能在脑海中为"范式"描绘出一幅具体的图像。

Dwarkesh: 那该怎么做呢?你曾说过,比如要多用"举例来说"。还有什么其他方法?

Steven Pinker: 视觉性的隐喻往往很有帮助。过去时代的散文之所以给我们留下更加生动的印象——我本想用"馥郁"这个词……

Dwarkesh: 馥郁,对。

Steven Pinker: ……部分原因在于,那些作者有一个我们没有的优势:他们写作时,几百年来学术界和知识圈尚未发明出那么多术语和抽象概念,他们不得不诉诸人们共同熟悉的视觉意象。所以与其说"攻击行为"或"反社会行为",他们会写"鹰的本性刺入了我们的血肉"。我们今天不会这样写,因为可以直接说"攻击性"或"反社会行为"——这些专业术语很多人已经熟悉,但它们并非自古有之。在它们出现之前,人们必须借助共同的意象来指称同一件事。我认为这正是为什么前几个世纪的文字往往更扣人心弦、更具感染力——作者们别无选择,只能诉诸视觉隐喻。

Dwarkesh: 我以前从没这样想过。《圣经》里就有大量这样的表达。我不知道为什么突然想到了密涅瓦的猫头鹰——那些以动物为载体的象征意象,总是特别震撼人心。你的意思是,学者们后来发展出的那些概念术语,固然是更高效的沟通方式,但确实失去了那种让文字鲜活起来的视觉质感?

Steven Pinker: 正是。这些术语在专业内部确实不可或缺——如果你是生物学家,就必须能够使用"生态系统"、“物种”、“系统”、“试剂”、“增强效应"这类概念。你不可能每次都从头解释:好,有一定量的化学物质,我们叫它"浓度”,随时间增加时,我们叫它……过了大一,你就不需要这样了。随着研究深入,你积累的抽象术语越来越多,两个音节就能指代庞大的知识体系,这当然很好。问题在于,当你需要向本领域顶尖圈子之外的人传达这些知识时,知识的诅咒(Curse of Knowledge)便会让你忘记:那些对你来说已经不言而喻、根本不需要解释的抽象概念,对别人而言根本不是常识。

Dwarkesh: 那么,关于写作的难度,我们需要了解什么?

写作为何远比说话更难

我想从这个角度来理解:说话对我们来说如此自然,写作却是必须后天习得的技能。你看一个二十个月大的孩子,问他父母,他们会兴奋地说:“他会说话了!你不敢相信,他说个不停,到处爬,总是这副样子。“但你问八岁孩子的父母写作进展如何,得到的却是:“嗯,还好吧,有点慢。“完全没有同样的兴奋感。似乎写作在某种意义上是"反自然"的,而说话却天生自然。从科学和实践的角度,这究竟是为什么?

Steven Pinker: 原因有几点。其一,在对话中,两个人从来不是被空降到一个舞台上然后立刻开始交谈的——他们之间总有某种共同基础(common ground)。他们知道自己为何而聚,正在谈论的是双方都熟悉的话题,那是他们对话的起点。对话中可以使用在特定语境下完全清晰的表达,比如"这个”、“那件事”、“我之前说的那个”、“她”——而如果你不在那个小圈子里,你可能完全不知道他们在指谁。写作则把人从语境中彻底剥离出来。有人从书架上拿起一本书,他从未见过你,可能住在另一个国家,而你甚至可能已经不在人世了。

他必须从页面上的文字中汲取所有信息,而不是依赖对话双方共同携带进来的那些背景知识。此外,说话时你知道自己在和某个具体的人交谈,你了解对方的特点,因此在一定程度上能更好地避免知识的诅咒——因为你能即时获得反馈:皱起的眉头、疑惑的神情、“我完全不知道你在说什么"这样的澄清请求,以及肢体语言和专注程度,这一切都是实时可见的。就算是现场演讲,演讲者也能感觉到听众何时开始坐立不安、走神,何时依然全神贯注。而这一切,在写作中都荡然无存。

Dwarkesh: 说得透彻。那接下来这一点——

缺乏语境的例子为何毫无意义


Steven Pinker: 我认为,没有例子的概括和没有概括的例子,同样毫无用处。当然,“毫无用处"这个说法也许稍显武断——但没有例子的概括,即便在我自己的领域,十之八九我都完全不知道对方在说什么,总想追问:你到底是什么意思?能不能举个例子?概括会抹去细节,它略过具体的特殊情况,让人往往无法真正把握它所指向的是什么。语言中的抽象词汇往往不够精确——英语里每一个词背后大概对应着上百个不同的概念,所以一个特定的词,尤其是抽象词,未必能让人联想到具体的所指。例子的作用就是将概括锚定:你说的大致范围是什么?这个概括究竟是关于什么的?

另一方面,光有例子、没有概括,同样令人困惑:你为什么要告诉我这个?你的重点是什么?跟什么有关?我最喜欢用来思考这一问题的框架是:语境(context)与压缩(compression)之间始终存在一种权衡。我可以用五个小时滔滔不绝地描述我去波士顿的那趟火车之旅,但那实在太长了;我也可以简单说"那趟车挺顺的”,但你从中什么都得不到,因为没有任何语境。我们始终在两者之间寻求平衡——例子提供语境,概括提供压缩——好的写作和好的沟通,恰恰发生在两者的来回摆荡之中。

举个例子:如果我说"熟悉的词语不必然对应其各组成部分的字面含义”,你大概能听懂,点点头说"嗯,好像是这么回事”。但如果我接着说:比如,“bathroom”(浴室)不一定是有浴缸的房间,“going to the bathroom”(上厕所)也不一定是去有浴缸的地方;“breakfast”(早餐)并不一定意味着打破禁食状态;“Christmas”(圣诞节)也不一定直接指"基督的弥撒”。说完这些例子,你再回头理解那句话,是不是豁然开朗了?没有这些例子,你或许会点头称是,觉得听起来有道理,但你并没有真正理解它。

再来玩个文字游戏:如果成人(adults)犯通奸罪(adultery),那婴儿(infants)是不是该犯"步兵罪”(infantry)?如果橄榄油(olive oil)是从橄榄(olives)里榨出来的,那婴儿油(baby oil)是从什么里榨出来的?如果素食者(vegetarian)吃蔬菜(vegetables),那人道主义者(humanitarian)吃什么?作家(writer)是写作(writes)的人,刺痛者(stinger)是会刺(stings)的东西。

但手指(fingers)并不"fing",杂货商(grocers)不"gross",锤子(hammers)不"ham",精彩绝伦的东西(humdingers)不"humding",引座员(ushers)不"ush",服饰商(haberdashers)不"habdash"。这到底是怎么回事?你为什么要引用这段话?这出自 Richard Lederer 之手,这个妙语的功劳不属于我,但我非常喜欢,觉得它实在太精彩了。

Lederer 写过许多令人愉快的书,比如《疯狂英语》(Crazy English)和《痛苦的英语》(Anguished English)。他耳朵极为灵敏,是英语语言中各种怪癖、错误、奇闻和失误的卓越收藏者。那段奇思妙想的列表之所以深刻,是因为它揭示了许多关于语言的真相——比如,随着时间推移,复合词或带有前缀后缀的词,有时会逐渐偏离其原始含义。以"adultery"(通奸)为例,它确实与"adulterate"(掺假)有关——从词源上说,通奸就是将外来物质引入不该有的地方——但这层联系在今天已经完全消失了。此外,复合词的各部分之间可以存在多种不同的语义关系:“olive oil"是用橄榄制成的油,“baby oil"是给婴儿用的油——两者结构相同,逻辑关系却截然不同,并没有统一的规律可循。

语言是如此古老。英语本身,算法不同大约有一千五百年或更长的历史,而它又源自日耳曼语,日耳曼语又源自印欧语系(Indo-European),再往前便无从追溯。许多词的起源早已深埋不见。你要去查词典才能找到这些词的来龙去脉,但它们就像语言中早已消亡的演化过程留下的化石。你知道"finger”(手指)中的”-er"是怎么来的吗?我得去查词源才能告诉你,但它和"singer"(歌手)中的"-er"完全不同——后者遵循的是一条至今仍有生命力的规则:"-er"可以将动词变成名词,指代从事某项活动的人。而"finger"里的"-er",则是语言化石记录中一条早已死去的规则留下的痕迹。

Dwarkesh: 说到写作——如果我要为我们整个对话画一条渐变的曲线,我会说:从"知识的诅咒"开始,大致是左右脑各半;然后我们慢慢偏向了左脑那一侧。而你说语言应该是一种乐趣的来源,我觉得这更偏向右脑。那么,当你真正坐下来写作、手指搭上键盘的时候,有哪些更偏右脑、也许不那么偏语言逻辑的概念在驱动你?

何为优美的写作

Steven Pinker: 首先当然是视觉意象——我能否在脑海中形成一幅画面?我的读者能否形成一幅画面?还有音韵美(euphony),也就是声音的维度——文章的散文中是否有一种诗意?我写作时会大声朗读,或者至少对自己低声喃喃。这是一个强烈推荐的写作建议,不是我发明的。当你朗读自己的草稿,如果读起来磕磕绊绊、不够流畅,那读者在脑海中默默"发音"时,多半也会同样不流畅。

美感有时甚至来自对语言韵律结构(metrical structure)的关注,也就是节奏。

Dwarkesh: 跟我讲讲这个。

Steven Pinker: 语言本身有一种内在的节奏,当然不是像节拍器那样绝对均匀的滴答声,但它有强拍与弱拍——如果打破得太厉害,会干扰说话,同样也会干扰阅读,即便只是纸上的字符。甚至嘶音(sibilant sounds)的美学也不可忽视——太多嘶音堆叠在一起,会让散文读来略显聒噪。我常常会挑选一个同义词来避免连续的嘶音出现。我也时常运用头韵(alliteration),因为它能带来一点文字的小火花、一点风格感。当然不能过于刻意,否则会显得生硬做作,但恰到好处的头韵,往往能让句子读起来更加流畅自然。

学者为何总是写不好文章

主持人: 为什么你会成为那个站出来、大声疾呼学术写作有多糟糕的人?每当我想到谁在追问"我们到底在干什么",你总是其中最积极发声的人之一。除了那些显而易见的原因,究竟是什么让你对这件事耿耿于怀,如此强烈?

Steven Pinker: 部分原因在于这种浪费实在触目惊心。学术界聚集着那么多真正聪明的人、那么多真正出色的研究,但他们为什么要做这些?难道只是为了在一个封闭的小圈子里互相娱乐?说到底,这些研究是用纳税人的钱资助的,它理应对公众开放,理应以人们能读懂的方式呈现出来。即便只是在学术圈内部,糟糕的写作也会造成大量的精力浪费和误解的隐患。

假如我在读一篇学生论文、本领域的学术文章、一份科研基金申请书,或者在做同行评审、评估某人的终身教职资格——如果我需要把同一段话反复读上五六遍才能搞清楚对方在说什么,那后果有两个:一是我很可能理解有误,二是我凭什么要读五六遍?我还有许多其他事情想做。所以这里有浪费,有误解,还有一种被白白辜负的享受与美感的机会——读一篇精心打磨的文章是令人愉悦的,而读一篇矫揉造作、晦涩臃肿的文章,则令人烦透了。

原因是多方面的,每当我看到学者们将那么多脑力投入学术研究,却对"向世界说清楚你做了什么"这件基本任务随随便便,我就会打心底里觉得不舒服。这可以说是当今学术界的一场真正的瘟疫。我对此格外关注,不仅是因为我自己在学术写作中努力追求清晰,更因为我研究的本就是语言——所以对语言学和心理语言学领域的学者,我尤其感到恼火。那么多人写作一塌糊涂,而他们研究的恰恰就是语言!你研究的是什么让句子难以理解,为什么不去关注自己的研究成果,把自己的句子写得更容易懂一点呢?

孩子的解释教会我们什么

主持人: 说到清晰的表达,你为什么那么喜欢孩子对事物的解释方式?比如"云是水蒸气,烟是火蒸气"这类说法。

Steven Pinker: 啊,那个例子来自我的外孙。这简直就是诗,是一种全新的并置。孩子的解释有一种难得的新鲜感——一方面,他们不会用陈词滥调说话;另一方面,他们没有积累起那一大堆抽象概念。几个世纪前的作家,不得不去抓取某个大家都熟悉的共同意象;而孩子们没有那数十年在学术界积累的专业术语,只能诉诸自己能看到、别人也能看到的东西。

主持人: 我在Twitter上关注了一个人,很喜欢他,他的简介写着:“聆听孩子,他们还没有忘记如何去看。“我认识一个YouTuber,她想出创意的方式之一,就是和朋友家的孩子聊天——那些孩子会问出各种奇妙的问题,比如"海有多深?““要造多高的塔才能到达天堂?“还有一个朋友,他小时候以为云是那些小烟囱冒出来的,所以他觉得那些烟囱就是"造云机器”。孩子看世界、谈事物的方式有一种无可替代的新鲜感。就像你说的,他们不可能被框住——因为他们根本不知道那个框的存在。

Steven Pinker: 是的,正是这样。历史上也曾有过各种形式的提醒,让人们重新发现孩子那种原初的、清新的视角。我小时候有一个电视节目的固定环节,叫"Kids Say the Darnest Things”(孩子说出最奇妙的话),主持人是Art Linkletter。

主持人: 我早就听说过他了。

Steven Pinker: 哦,是吗?好的。事实上,他和这个节目给后世留下了一笔遗产——“说出最奇妙的事"乃至"最奇妙的名词"这类表达,至今仍常见于各种新闻标题中,已经成为一种固定句式,而它的发明者正是他。长期主持《今夜秀》的Johnny Carson,有时也会在节目里朗读孩子对各种问题的回答,常常引发全场哄堂大笑。

那么,幽默在这一切中——在写作中——究竟扮演着什么角色呢?

主持人: 对,这是个很好的问题。甚至说到幽默本身的科学——哪些词语更具喜感——你大约十年前有一个非常精彩的演讲,我等一下会推荐给大家。

Steven Pinker: 我想,就像任何事情一样,幽默是有艺术性的——如果用力过猛,换来的是倒彩,而不是笑声。所以幽默必须得体,绝不能是那些已经被重复了三十七遍的老梗。幽默高度依赖新鲜感,同时也与好的写作有许多共通之处。

为何简洁永远是写作的灵魂

Steven Pinker: 《哈姆雷特》里有句话:“简洁是智慧的灵魂”(brevity is the soul of wit)。这句话妙在很多地方,其中之一就是"soul”(灵魂)这个词的选用——换成"对智慧至关重要”、“智慧所必需的"或者"智慧的精髓”,那些都是我们今天可能会说的表达,但都不如"智慧的灵魂"来得耐人寻味,需要你停下来想一想。“Soul"意指最深处的本质,而它本身只是一个单音节词,却有着如此丰富的回响。看来莎士比亚确实是个了不起的作家。这句话同时也以自身为例,因为它本身就极其简洁。

几个世纪后,这一原则在著名写作风格手册《写作的要素》(The Elements of Style)中再次被重申。E.B. White回忆了他在康奈尔大学听过的教授讲课,并将其整理成书。那位教授说,写作的第一原则就是"省去多余的词”(omit needless words)。这同样是一个以自身为例的完美表述——这句话里没有一个多余的词。据说教授有时如此坚信这几乎是写作唯一需要知道的道理,以至于不知道还能补充什么,只好一遍遍重复:“省去多余的词。省去多余的词。省去多余的词。”

就像"简洁是智慧的灵魂"一样,这句话除了以自身为例,本身也是一个真理。有时当我不得不将一篇文章压缩到某个固定字数时,这一点体会尤深——尤其是为报纸或杂志写稿时。与学术界可以漫无边际地写、没人叫你停不同,给报纸写稿,编辑会说:“对不起,800字。“如果你写了803个字,编辑会直接砍掉三个字,也不问你砍哪里——往往就把意思弄乱了。所以你必须真正学会如何在800字,或者规定的字数内,把你想说的话说清楚。


Steven Pinker:

但我发现,单是这种将文字压缩到字数上限的练习,往往就能像变魔术一样改善文章质量。你会想:该死,我得把这段写短,可我原本以为已经写得无懈可击了。可当你真正动手去删减时,却往往发现——去掉那些多余的词之后,文章确实更好了。部分原因在于认知负荷:每一个音节、每一个词,都需要读者付出更多的认知处理。如果能更快地传达同样的信息,读者的负担就减轻了。但这同时也让文章在美感上更令人愉悦。你必须在英语语言的约束之内工作。

语言的旋律、节奏与音乐性——简洁还能迫使你使用具体的语言,而非模糊的惯用语和陈词滥调。

Dwarkesh:

光是"简洁"这个词单独摆在那里,也已是一句妙语了。那句话的精妙之处刚才才真正击中了我——我听过这句话不下千遍,却从来没有像刚才这样被它直击心口。我想问……对不起,我提这句话的原因是——

Steven Pinker:

哦,是的。在幽默方面。是的,“智慧之魂”——这里的"智慧”(wit)在过去涵义比现在宽泛得多,不仅仅是哈哈大笑的那种搞笑,它意味着犀利与恰切。但就单纯的幽默感而言——

Dwarkesh:

这是每一位喜剧演员都深谙的道理。

Steven Pinker:

精简笑话,精炼台词。用幽默时,越短越精,越逗越妙。一旦拖拖拉拉,笑点就消失了。你会砸掉自己的包袱,把结局提前泄露出去。

Dwarkesh:

前几天我去洛克菲勒中心,看到一块巨大的石碑,上面刻着 John D. Rockefeller 关于社会理想与美好生活的论述,文笔之精彩令我叹为观止。

真的写得极好。《独立宣言》也是同样的道理——里面有些句子美得令人屏息:“我们认为以下真理不言而喻:人人生而平等。“这就是精妙的文字。你怎么看待旧时代的文章?人们通常觉得旧时的文章读起来更费力,会庆幸如今的写作已变得清晰易懂;但与此同时,我感觉语言本身所承载的那种美感、诗意,以及对语言本身的那份敬意,似乎已在当代英语中悄然流失。洛克菲勒就是个好例子——他在历史上并不以文笔著称。

Steven Pinker:

没错,正是。谢谢你的补充,这一点至关重要。

Dwarkesh:

他是个商界领袖,一个石油大亨。

Steven Pinker:

是的,正是。同样,我在《当下启蒙》(Enlightenment Now)中也引用了托马斯·爱迪生谈论电力将如何解放女性的一段话,写得也是美不胜收。想想看,这是一个把大量时间花在灯丝和灯泡上的人,文字却宛如天使之笔。

Herbert Spencer、Oliver Wendell Holmes Sr.,都是绝佳的例子。Charles Darwin 也是——这些人本职并非作家,各有其他专业,却都极擅写作。这是个很有意思的问题。

我认为原因之一,是他们自小受经典作品的熏陶,受过良好的文学教育。对其中许多人而言,当时既没有电话、收音机,更遑论短信和社交媒体——展示自我的方式就是文章,所以人们打磨文字,就像照镜子整理仪容一样自然,那是别人审视你的方式。此外,他们也有经典积淀的底气,有大量优秀范本可供借鉴。

第三个原因,我们的对话中已有所触及:正是因为他们没有数十年积累的抽象表达和陈词滥调可以依赖,他们某种程度上是在开拓无人涉足的思想领地——他们无法轻易抓取现成的套话,而必须将新的思想转化为读者或听众能够理解的形式。这就迫使他们诉诸视觉意象、隐喻和生动鲜活的措辞。

而在这背后,还有一个延续了逾百年的过程,叫做"非正式化”(informalization)——在着装上也可见一斑:男士不再戴帽,女士不再戴手套。翻看一百年前的登山照片,会发现男人系着领带,女人穿着长裙,他们正要去爬山——这对我们来说简直难以想象。过去人们互称"先生”(Mr.)……

为什么AI的文章读起来如此平庸

……和"女士”(Mrs.),而如今我们一律直呼其名。我小学三年级时曾因为直呼老师的名字而被罚去禁闭室。现在这种事根本不会发生了。

Dwarkesh:

都过去二十年了,我还能感受到那一刻的羞耻感,真的太奇怪了。这种事放在今天,根本想都不会去想——那是绝对不可能做出来的事。

Steven Pinker:

脏话和禁忌语被随意穿插进日常话语中——这在一个世纪前同样是不可想象的。

这一切背后,是一个走向更多平等、更少等级的社会进程,部分是民主化推进的副产品,是阶级与教育传统等级秩序瓦解的结果。还有一种浪漫主义的风尚——真实性与自发性被推崇,而刻意雕琢、深思熟虑则被视为摆架子。所有这些,都让精致的语言越来越被视为卖弄、生硬和疏离的象征,而文化的价值天平也已向自发性、亲密感、自然感和真实性倾斜。我想,如果我们今天还要像一两百年前那样花心思打磨文章,人们大概会觉得你在装腔作势——你甚至可能真的被认为太过矫情,不是吗?正因如此,随意的口语风格,而非精心锤炼的书面语,已然成为当代文章的主要面貌。说到这里,我想问你——你刚才谈到了随手抓取陈词滥调或抽象表达,而AI把这种趋势推向了一个全新的极端。

Dwarkesh:

你觉得AI是否在某种程度上强化了我们——姑且这么说——原创性思维的缺失?它会延续我们正在经历的这种趋势,还是说大语言模型(LLM)会催生出某种全新的表达方式,甚至开辟出一种全新的沟通模式?

Steven Pinker:

是的。大语言模型的输出在某种意义上颇为奇特——它写得不差,句子结构相当清晰流畅,不堆砌学术黑话;思路的推进也相当有序,有引入句,有收尾句。从这个意义上说,这是不错的写作。但它的问题在于过于通用、过于平铺直叙——你几乎一眼就能认出大语言模型的输出,实在是太平庸了。


Steven Pinker:

当然,也许可以通过训练或提示词来改变这种情况——比如告诉它"不要流水账式地写,不要毫无特色”。它能否发展出某种风格或新鲜感,这倒是个值得观察的问题。但这并非它的设计初衷——它本就是一种混搭、一种戏仿,是对网络上数十亿文本样本的提炼与融合。

有趣的问题是:为什么它的散文风格至少是通顺的?我认为这已经是对它最高的评价了。而大多数学者、律师、官僚的散文风格恰恰并不通顺。它为何反而更好?一种可能是,它通过微调(fine-tuning)和反馈被锤炼成形——不是单纯地反刍各类文本的混合体,而是经过强化学习(reinforcement learning),以及那些鲜少被提及但或许至关重要的因素:有真实的人类监督者强迫它写出规规矩矩的五段式文章。另一种可能——这纯属推测——是我们知道在视觉美学中,合成图像往往比构成它的单个元素更具吸引力。

把一堆面孔叠加融合,那个并不真实存在的人反而比所有参与合成的面孔都要英俊或美丽。拿一本高中毕业纪念册,把几百张面孔叠在一起,最终的合成结果确实相当好看。

主持人:

真的是这样吗?哇。

Steven Pinker:

至于这是否同样适用于散文风格——也就是说,如果你剔除所有那些糟糕透顶的晦涩繁复句式,只留下某种通用的句子结构,它也许谈不上优美,但至少会清晰明了。

主持人:

这倒是一个很有趣的假设。您已经写了九本书,现在正在写第十本了。


人工智能会如何改写我的著作

那么,面对大语言模型当前的发展走向,如果您现在重新开始写那些书,您会怎么写?考虑到我们对大语言模型的认识,以及写作世界正在发生的变化,您会写出不同的书吗?

Steven Pinker:

也许不会完全一样。我想我会更加重视从海量输入中抽象规律的能力。在我受训其中、后来又加以发展的研究范式里——也就是计算认知科学(computational cognitive science)、乔姆斯基语言学、经典人工智能——这种能力并未得到足够的重视。那个范式更多地围绕规则、算法、逻辑、逻辑编程展开。在那时,很难想象仅凭足够多的输入和训练,一个联结主义神经网络竟能从这庞大无序的输入中提炼出有意义的思想和通顺的文字。

当然,我并不认为这就证明了人类心智是一个大语言模型——那相当于一个孩子要听三万年的语言,才能说出第一句清晰的话。况且孩子的学习也不只是被动接受大量文本的灌输。他们身处真实的世界,能够理解与他们交谈的人究竟想表达什么,他们在与世界互动——这与单纯处理海量文本是截然不同的学习方式。

尽管如此,我确实觉得自己本应更认真地协调大语言模型的智能与人类智能之间的关系,给予从大规模语料库(corpora)中提取规律这一能力以更多的关注。

主持人:

非常感谢您接受这次采访。

Steven Pinker:

谢谢,这次交流非常愉快。


术语表

英文中文
alliteration头韵
brevity is the soul of wit简洁是智慧的灵魂(莎士比亚语)
common ground共同基础
computational cognitive science计算认知科学
context and compression语境与压缩
corpora语料库
Curse of Knowledge知识的诅咒
Egocentrism自我中心主义
euphony音韵美
fine-tuning微调
Hanlon’s Razor汉隆剃刀
Indo-European印欧语系
informalization非正式化
Large Language Model (LLM)大语言模型
metrical structure韵律结构
motoric动觉性的
omit needless words省去多余的词
reinforcement learning强化学习
sibilant sounds嘶音
The Elements of Style《写作的要素》
Theory of Mind心智理论
visual metaphors视觉隐喻

此文章由 AI 翻译