原文EN

撰写研究论文和学位论文的建议

格式技巧 - 内容

(a) 开始着手。

许多年前,我与一组声称几乎没有写作经验、对如何撰写研究论文感到困惑的学生合作过。但他们擅长编码。于是我问他们是否习惯用 C++ 写作,他们说“当然”。于是我告诉他们,我们将写一些新的东西,但不是用 C++ 编写,而是用“英语”编写。为什么这有帮助呢?许多 STEM 学生声称不擅长写作,但他们明白如何通过阅读他人的作品和使用他人的结构来学习良好的编程风格和格式。同样的思路对新手论文作者也非常有帮助。

如果你是一位科学写作新手,请找到目标期刊中你认为好的论文范例。遵循那些论文的格式。你不是在抄袭论文,而是在关注不同的部分、它们的长度、参考文献、方法、方程式、证明、图表等使用的细节程度。尝试以相似的风格呈现你自己的工作。

(b) 内容风格。你可能需要多次迭代内容,直到它读起来非常流畅。避免使用过长的复合句。避免在同一个句子或相邻的句子中多次使用相同的词语或短语。在这方面,让内容成为你的朋友。简单的句式——主语-动词-宾语——是你进行内容初稿或二稿时的好帮手。更复杂的句式可以在你准备好在写作中加入一些细微差别时再进行处理。

(c) 时态。请确保你的论文时态保持一致。最简单的方法是通篇使用现在时。在引用同一篇论文的前面部分时,你不需要使用过去时。二十年前完成的工作可以使用过去时。在校对论文的时态一致性时,你可以检查单词 “will” 以及以 “ed” 结尾的动词变位。请注意,这两点并不能找出所有的将来时和过去时。例如,一些常用动词如 “to do” 的过去时(例如 did)并不以 “ed” 结尾。因此,在校对时态一致性时要仔细阅读。

(d) 冠词。特别是对于非英语母语者,请注意你的冠词——例如 the、a、those、these 等。a 和 the 之间的区别可以改变句子的内涵,从而改变其预期的含义。

(e) 学会理解指称与内涵的区别。指称是精确的陈述。内涵是使用语言来暗示某事,而不是直接说出来。英语中这两种用法都很常见,并且都可以有效地用于科学写作,但不应该互换,因为它们会产生非常不同的效果。误用这些可能会导致你的论文中出现不准确的表述。

(f) 语言模型。近几年,我们突然看到了使用语言模型来协助撰写论文的现象。如果你想使用这项技术,请务必非常小心!首先,如果你使用了它,你必须承认。这是必须的。此外,不要假设 chatGPT 或类似的工具会比老式的仔细写作产生更好的风格!很可能不会。我最近和一位学生合作的一篇论文,在使用 LLM 完成初稿后,我不得不重写所有文本,以使其风格优于 LLM 的产出。我还注意到这些工具也会“幻觉”(hallucinate),所以如果你过于依赖像 LLMs 这样的自动化方法,你的论文中可能会出现虚假信息。

格式 - 细节程度

(a) 背景 - 在此背景非常重要。如果这是一篇学位论文,预期至少要写一章关于你论文的背景材料。这应该是一个全面的讨论,涉及该领域的先前工作以及它如何塑造你的原创研究。一位好的论文导师会要求学生进行仔细的文献检索,提供数十到数百篇参考文献,可能还包括一份带注释的参考书目。这样的材料是撰写你的学位论文背景部分的一个良好基础。

另一方面,对于研究论文,背景应该有不同类型的内容。这不是一篇教学论文。然而你希望它针对特定的读者群。因此,重要的是将自己置于该期刊更广泛读者的角度,问自己——你需要告诉他们什么,才能让他们愿意继续阅读你的论文。信息太少,他们会感到困惑。信息太多,他们会因为没有时间了解新的原创工作而感到厌倦。审稿人常常会因为作者花费太多时间在背景信息上而给作者扣分——因为他们担心这项工作不够原创。

(b) 严谨证明 - 多少细节?如何排版?你希望思路流畅,有时当你需要一些技术性的引理或命题来证明一个主要定理时,这可能会很困难。在这种情况下,你可以使用附录来放置那些必需但并非新论证核心的证明细节。一个引理或命题如果只是对现有文献中内容的变体——通常可以放在附录中,你可以指出证明出现在论文的后面部分。主要定理的细节应保留在正文中,特别是如果这是原创研究的核心部分。

在为期刊撰写严谨证明时,你应该避免厌烦地重复那些始终相同的想法的细节——你可以在这里稍作简化——比如写上“遵循与…中相同的论证,我们也可以推导出这个公式…”但同时不要犯一个错误,即假设读者拥有与你这位完成原创工作的人相同的专家水平。如果这是一个针对在某一领域训练有素的优秀研究生的习题,那么在进阶数学论文中可以删除一些细节。如果你的读者是科学家而不是数学家,要小心不要让他们在数学上感到过于困惑——为了科学论文的读者,有一定程度的数学“牵引式指导”(hand-holding)可能是必要的。

格式 - 标点和其他小细节

(a) 正确地为你的显示方程式加上标点!!!是的,事实上你的显示方程式是完整的句子。例如:

$$ Ax = b $$

其中 Ax 是主语,等号(=)是动词,而 b 是宾语。这意味着,如果它是一个句子的结尾,你需要在显示区域的末尾加上一个句号。有时你需要一个逗号而不是句号,有时你不需要任何标点。请仔细检查所有显示的方程式是否标点正确。

(b) 章节标题。确保这些标题的大小写在不同类型的章节中保持一致,并在所有标题中保持一致。如果你有一个目录(例如在学位论文中),你可以轻松地在一页上进行扫描,否则你必须手动检查。

(c) 正文中的自然数使用。例如,“我朋友家有两只宠物,但我岳父母家有 43 只鸟。”请注意,数字 two 是用英文写出来的,而数字 43 是用阿拉伯数字形式写出来的。老式的规则是:一位数的自然数用英文写出,两位或更多位数的自然数用阿拉伯数字格式写出。另外,据我所知,我岳父母家没有 43 只鸟,但这个例子很简单,可以说明数字的正确用法。

(d) 复合句和赘述句。对于复合句,学习短语和从句的区别以及如何正确地给它们加标点。学习何时过多的复合结构正式成为一个赘述句(run-on sentence),从而需要修改。这些细节过于复杂,无法在此描述,但应该由学生学习并在写作中正确使用。一般来说,如果你的读者需要阅读一个句子不止一遍才能理解其含义并消化其内容与同一段落中其他信息的关系,那么这个句子需要重构。

(e) That 与 Which 的区别。That" 和 “Which” 这两个简单的词在科学写作中经常被误用。一般的规则是:“that” 指的是特定的事物,而 “which” 指的是一种限定,即使你不说出来也是事实。例如 - I like to swim in oceans that are warmer than 70 degrees。请注意,这里在 “that” 之后指定了额外的限定性内容。Alternatively we could say - the 2024 Jeep Cherokee, which comes in the colors red, blue and black, is selling very well this year。 “which” 之后的信息确实提供了额外内容,但对于传达句子中的新信息来说不是必需的。读者可以去寻找使用不同来源提供颜色的信息。我以前的一位英语老师说,如果你可以在 “which” 后面插入 ,by the way, 而句意保持不变,那么你就应该使用 “which”。So in the above example we would say “The 2024 Jeep Cherokee, which, by the way, comes in the colors of red, blue and black, is selling very well this year. [Note that the content of this sentence is fiction, made up for the purpose of demonstrating the use of “which” and should not be interpreted as information related to your upcoming car purchase]. The same use of “by the way” does not make sense in the sentence about swimming in warmer oceans。

(f) 所有格(Possessive)。’s 用于所有格。除非被修饰的词是复数。The cat’s fur is dirty - 指的是一只猫。The cats’ fur is dirty 指的是多只猫,并根据上下文推测你正在谈论哪些猫。只要遵守这条规则,你就能走得很远。

(g) 缩略词(Contractions)。I won’t write any more because you will not stop pestering me about writing。在正式写作中,正确的用法是 “will not”。在非正式电子邮件中,可以使用缩略词。但对于正式写作,请尽量避免缩略词。注意,缩略词不是所有格。它们是不同的东西。另外,请注意 it’s 是一个缩略词,在某些上下文中表示 “it is”。例如 - It’s going be a lovely day today。在正式写作中,你应该写成:It is going to be a lovely day to day。

(h) 动名词(The gerund)。避免赘述句的一种方法是谨慎使用动名词。这是以 “ing” 结尾的言语形式。例如 - My cousin Bob, while walking to school, found a four-leaf clover。这比说 - My cousin Bob walked to school. On the way he found a four leaf clover. 要好。在科学写作中,第一种方式在一个易于阅读的句子中包含了几个想法。它不需要阅读多次来理解,并允许读者继续阅读下一句的新想法。注意不要过度使用动名词。我的个人经验是,我的学生们倾向于过度使用更长和更多的句子,而不是使用动名词。

(i) 短句。永远不要低估短句的力量。如果你想用一句话有力地传达一个强烈的讯息 - 就把它放在一个短句中。它会脱颖而出。同时,如果你碰巧写了一个非常短的句子,无论你是否希望,它都会脱颖而出。因此,在传达想法方面,请仔细考虑句子的长度。在正式写作中,句子的长度起着类似于口头表达中语调的作用。

(j) 拼写检查。如果你使用 Overleaf 等工具来编写 LaTeX 论文(或使用 MS Word 或类似软件),该软件通常带有自动拼写检查器。请校对所有文本或预编译代码,以确保没有拼写错误。如果你使用本地的 LaTeX,则必须直接检查源代码的拼写。在 Linux 机器上,有一个名为 ispell 的终端命令可以运行。你输入 ispell file.tex 来检查 tex 文件 file.tex 中单词的拼写。它会返回并显示有问题的单词,并列出键盘提示,询问如何处理该单词。只需按照菜单项操作,它就会滚动浏览你的文档。你也可以用它来编辑网页的 HTML 文档的源代码(我刚刚用它检查了这个网页)。

图表格式技巧

(a) 彩色图表。有些期刊会让你为彩色图表支付额外费用,或者除非你确有需要,否则会拒绝物理上以彩色打印。许多常用软件会自动用不同的颜色绘制线条。抵制在线状图中使用过多颜色。相反,使用不同的符号和不同的线条样式,但要避免使其混乱。请注意,图表在用黑白打印机打印时必须是可理解的,因为黑白打印机比彩色打印机更为常见。

(b) 图表中字体。当你在屏幕上编辑图表时,刻度标签、刻度线和轴标签的字体应该显得非常大(stupidly HUGE)。这是因为它在出版物中会缩小成一个较小的图表。论文中显示的字体不应小于图表标题中显示的字体。不要假设人们能够阅读微小的字体,除非你只希望 39 岁以下的人阅读你的论文。

(c) 线宽。使用足够宽的线宽,以便图表在实际论文中缩小时,线条仍易于阅读。你可能需要在原始图表中将它们设置得更宽。

(d) 保存图表数据和格式!如果你正在处理图表,请保存所有内容。数据和生成图表的代码。如果你不明白我说的“后者”是什么意思,请检查你的图表生成软件。它应该允许你保存一个格式文件以及数据 - 这个文件有刻度标签大小,字体大小等信息。这将使你在编辑论文时能够快速轻松地对图表进行微小的更改。并且再次保存修改后的版本!!!所有从事论文图表工作的人都应该学习如何在进行任何实质性的图表工作之前保存这些数据。这将在以后为你节省大量时间,你会感谢自己这样做了。

(e) 图表标题(Captioning)。图表应该独立存在。这意味着图表的内容应该在标题中不言自明。读者应该能够在不阅读正文的情况下理解图表及其目的。所以,在图表标题中用文字告诉他们数据是什么。如果它引用了正文中的某个特定方程式,请引用该方程式。一般来说,你应该尽量避免在标题中解释图表 - 使用正文来做这件事。图表标题应限于关于该特定图表的基本事实。比较和解释可以放在正文中。

(f) 数据的可重现性。尊重科学的黄金标准,即可重现性(reproducibility)。因此,请提供足够的细节,以便有人可以阅读论文并从头开始重现你的所有数据。如果你的数据是根据计算机代码生成的,请考虑将代码和输出放在像 Github 这样的公共场所。一些期刊现在允许你在论文中包含辅助信息,代码和数据就可以是这样的内容。这确实需要额外的工作,但它会带来更稳健的研究,更有可能被引用,特别是如果人们正在下载和使用你的代码的话。

致谢(Acknowledgments)

致谢部分的首要任务是正确拼写 “Acknowledgments”。请注意,与 “acknowledge” 的拼写不同,“Acknowledgments” 在 g 之后没有 “e”。我在网上读到过英式拼法可能有 “e”,但我是在美国工作,所以我使用这个版本。现在谈谈内容。询问论文的主要作者(们)是否需要引用资金来源,如果需要,是哪些,以及是否有特定的语言需要使用。如果你获得了培训资助,也要引用该奖项。是否有人为你提供了有价值的见解,帮助你推进了研究?这是你可以提及他们名字的地方。请注意,通常不会提及那些在你的生活中提供一般性帮助的人,例如家人、宠物、神职人员或你最喜欢的咖啡店。如果你收到了某个组织提供的与研究直接相关的材料捐赠,则可以引用。一般来说,请与论文的 PI 或资深科学家讨论此类问题。请注意,像 NSF 这样的政府机构要求在研究中引用资助项目。这些信息会被记录下来,并成为项目记录结果的一部分。在 NSF 的案例中,它也会在未来的提案中列入“先前支持的结果”部分,并作为此类提案评估过程的一部分。

最后但同样重要的 - 参考文献 - 在 LaTeX 中

以下是校对参考文献的一些具体提示。参考文献是最后的防线。即使你非常仔细地完成了此列表中的所有事情,期刊的文字编辑 - 我保证你 - 也会找到更多需要检查的地方。

(a) 这是 arXiv 版本吗?那么你还没有完成!你必须去寻找最终发表版本的最佳可能性。这意味着检查作者的网站。对标题进行 Google 搜索(不是 Google Scholar,而是 Google 本身 - 因为 Scholar 的更新不是实时的)。在几个地方查找,并查看 Google 搜索的第二页和第三页,而不仅仅是第一页。一旦你用尽了所有能想到的办法 - 并且不要偷懒 - 然后你才能使用 arXiv 版本。但在此之前不行。一个细心的作者会在 arXiv 上列出最终发表的版本,但许多人懒得去做,所以你必须自己去搜寻。

(b) 阅读每一个标题,检查专有名词。比如 Dirichlet。Gaussian。Laplace。Fourier。Los Angeles。你懂的。还有应该大写的缩略词。请注意,从期刊网站下载的 BibTeX 信息本质上是从一个通用文献数据库复制粘贴过来的。这意味着文章的标题不一定会被正确地格式化用于 BibTeX。因此,你必须手动编辑所有论文的标题,以确保大小写正确无误。在标题字段中,在专有名词周围加上 {}。例如,一篇标题为 “Machine learning for street data in Los Angeles County” 的论文需要有一个这样的 BibTeX 条目:

title={Machine learning for street data in {Los Angeles County}},

(c) 检查参考文献中列出的每一篇已发表论文,确保你拥有标题、卷、年份、页码等信息,并且它们正确打印。我说的 “Check” 是指你应该用眼睛逐行阅读编译后的 PDF 文件中的参考文献,仔细检查每行是否有缺失或错误的信息。不要假设如果信息在 BibTeX 文件中,它就会在手稿的打印版本中正确编译。BibTeX 文件中一个简单的打字错误可能会导致输出发生重大变化,所以你必须用眼睛仔细阅读编译后的版本并进行检查,以确保参考文献完整。常见的错误包括使用错误的 BibTeX 引用类型 - 例如,一旦文章发表,仍然使用 preprint 而不是 article 格式。你需要将其更改为 article 才能使所有字段正确编译。此外,你需要使用正确的作者姓名语法才能使其正确编译。这就是为什么你必须仔细阅读 PDF 版本来检查细节。

(d) 检查重复的参考文献。如果参考文献是按字母顺序排列的,这很容易。如果不是,则编译一个按字母顺序排列的版本,以检查它们是否有重复。如果你需要按顺序引用,则再次使用另一种格式重新编译。

(e) 参考文献编辑后的双重检查。这意味着在更改参考文献后 - 你必须重新编译论文并去阅读参考文献部分,以确保你添加或更改的材料正确显示。如果你不这样做 - 你就有可能因为一个小小的打字错误而突然“删掉”你一半的参考文献!

(f) 最后但同样重要的,是内容。如果你被允许包含许多作品,请对你的引用相当慷慨。不引用他人的工作会树敌。所以要避免树敌。为什么要这样做?有什么意义?此外,参考文献也被阅读你论文的学生和其他人使用 - 你通过提供好的参考文献为他们提供了服务。期刊编辑在试图确定合适的审稿人时,也会查看参考文献。与此同时要合理。你不必追溯到两百年前的科学工作。最近的和最相关的引用可能就足够了。这确实取决于你想在论文中提供什么样的背景。如今,有些作者订阅了关于引用他们工作的论文的自动电子邮件。因此,如果你想让领域内的人阅读你的论文,一种方法是引用他们的工作,他们可能会被 Google Scholar 或类似工具提示,从而查看你的预印本或重印本。但不要无缘无故地这样做。在引用与内容一致时,审慎地使用引用。

总结(Take away)

如果你完整阅读了本教程,你可能会觉得这个列表过于吹毛求疵,或者会为你撰写第一篇论文带来比预期更多的工作量。你是对的。但这也不是一个完整的列表。如果你有研究导师 - 请向他们咨询他们建议你检查的任何其他项目。我也没有包括与内容相关的科学细节 - 例如检查证明中的数学细节或检查计算机代码中的错误。这些不是写作细节,它们是研究中的细节,也应该进行检查。另一个收获是,好的写作需要付出努力。如果你正在撰写你的第一篇研究论文,你应该预料到你在写作上花费的时间,与研究和发现相比,会相当长。工作中有趣的部分可能只占总时间的 10-20%。与此同时,如果你不撰写这份工作并将其发表在同行评审的文献中,这项工作可能会被遗忘,就好像你从未进行过这项研究一样。因此,请将写作部分视为整个工作的不可或缺的一部分。此外,好的写作本身就是一门技艺。如果你能掌握它,你将为自己的工作感到骄傲,并且你将能够教导下一代研究人员如何正确地进行写作。