Thomas Claburn · 2025-01-08

AI如何通过有效提问提升代码质量

摘要

大型语言模型（LLMs）在代码生成和优化方面展现出显著潜力，但其表现很大程度上取决于提问方式的有效性。研究表明，通过简单迭代提示或复杂的提示工程技术，可以显著提升AI生成代码的性能，但这种方法仍需开发者具备一定的软件开发经验来判断代码质量和处理潜在错误。

本文基于Buzzfeed高级数据科学家Max Woolf的实验研究，探讨了如何通过有效的提示策略让大型语言模型（尤其是Anthropic的Claude）优化其生成的代码。实验从一个简单的Python编程任务开始——寻找数字之和为30的最小和最大数字之间的差异，初始代码运行时间为657毫秒。

研究发现，当直接要求Claude"改进代码"时，AI能够生成性能提升2.7倍的优化版本。通过多次迭代改进，代码性能最终提升达到99.7倍。这表明LLMs确实具备自我反思和代码优化的能力。

文章还深入分析了"提示工程"技术——通过提供更详细的期望和示例来指导LLM。这种方法能够更快速和一致地提升代码性能，但也更可能引入细微的错误。Woolf的实验显示，Claude在优化过程中曾使用多线程技术实现5.1倍性能提升，但也同时引入了需要修复的错误。

来自东北大学、韦尔斯利学院和奥伯林学院的联合研究支持了这一发现，强调了提示内容在AI代码生成中的关键作用。然而，这也揭示了一个重要限制：AI代码帮助对新手的实用性受到开发者背景知识需求的制约。

迭代式代码优化：LLMs能够通过简单直接的提示（如"改进代码"）逐步优化其生成的代码。在Woolf的实验中，这种方法使Python代码性能从初始的657毫秒最终提升至99.7倍，展现了AI在代码性能优化方面的自我反思和持续改进能力。

提示工程：这是一种更高级的提示策略，通过修改系统提示、提供详细期望和具体改进指示来指导LLM采用特定的代码效率策略。虽然这种方法能更快速和一致地提升性能，但也增加了引入细微错误的风险，体现了AI优化中速度与准确性的权衡。

开发经验的重要性：研究表明，虽然LLMs能够生成和优化代码，但有效利用这些工具仍需开发者具备判断代码质量和理解特定领域约束的背景知识。这一发现揭示了AI编程助手在帮助新手开发者方面的内在局限性。

性能与正确性的平衡：实验中发现，Claude在使用多线程技术实现5.1倍性能提升的同时引入了错误，这凸显了AI代码优化中的一个核心挑战——在追求性能提升的同时确保代码的正确性和可靠性。

字段	内容
原文	AI can improve on code it writes, but you have to know how to ask
作者	Thomas Claburn
发表日期	2025年1月7日

此文档由 AI 自动整理