近年来,人工智能(AI)的编程能力不断发展,但尚未达到完美。最近,BuzzFeed 的资深数据科学家 Max Woolf 通过实验发现,如果对大型语言模型(LLM)不断提供 “写更好代码” 的提示,AI 确实能够生成更优质的代码。这一发现引发了广泛关注,业界著名AI 科学家们也对此表示了极大的兴趣,强调了迭代和提示词设计的重要性。
在 Woolf 的实验中,他利用 Claude3.5Sonnet 这一版本的 AI 模型进行了一系列编程任务。起初,他给模型提出了一个简单的编程问题:如何找出一百万个随机整数中,各位数之和为30的最小值与最大值之间的差。Claude 在接到这个任务后,生成了符合要求的代码,但 Woolf 认为该代码还有优化空间。
接着,Woolf 决定在每次生成代码后,都通过 “写更好代码” 的提示,要求 Claude 进行迭代优化。第一次迭代后,Claude 将代码重构为一个面向对象的 Python 类,并实现了两项显著的优化,运行速度提高了2.7倍。第二次迭代中,Claude 又加入了多线程处理和向量化计算,最终使得代码运行速度达到了基础版本的5.1倍。
然而,随着迭代次数的增加,代码质量的提升开始减缓。经过几轮优化后,尽管模型尝试使用一些更复杂的技术,例如 JIT 编译和异步编程,但有些迭代反而导致了性能的下降。最终,Woolf 的实验揭示了迭代提示的潜力与局限性,让人们对 AI 编程的未来有了新的思考。
这项研究不仅展示了 AI 在编程领域的应用潜力,也提醒我们,尽管 AI 能够通过不断迭代来提升代码质量,但在实际应用中,如何合理设计提示词、平衡性能与复杂性仍然是一个值得深入探讨的话题。