网站重构过程中AI工具的体验

在这几天的网站开发与重构过程中，我深度使用了各种AI工具，尤其是Windsurf配合Gemini 3 Pro的组合。这次实战让我对AI辅助开发有了全新的认识，也让我对不同AI模型的特性有了更深入的了解。

我碰到的最大挑战是夜间模式Bug的修复。在这个过程中，我也有机会较为深度的体验了Gemini与GPT的不同，以及大上下文窗口在复杂项目中的应用价值。这些经验有助于我高效完成重构工作，也刷新了我对AI驱动开发模式的理解。

《网站重构过程中AI工具的体验》要点总结

工具与模型使用

主要使用Windsurf进行深度场景开发
常用Gemini 3 Pro（消耗2积分/次），较少用Claude（消耗太高）
在前端开发方面，Gemini和GPT效果均优于Claude

实战案例：夜间模式Bug

问题：字体颜色可切换，但背景无法切换到夜间模式
解决过程：
- AI陷入"沉思"，未能解决
- 上下文窗口被挤爆后，重新开启对话
- 让AI先总结思考过程和尝试方法，形成文档后重新分析，问题得以解决

GPT vs Gemini 对比

维度	Gemini	GPT
上下文窗口	1M tokens	较小
性格	礼貌、会记住抱怨	趾高气昂、会过滤"垃圾话"
情绪处理	容易受抱怨影响，可能消耗额外Token	情绪上不内耗，直接过滤负面话语
共同点	都会陷入长时间"沉思"（与高思考度设置有关）

上下文窗口的应用

大窗口优势：适合重构工作、基于旧架构派生新项目
深度思考消耗大：简单任务使用高思考度模型意义不大
GPT限制：不适合大型项目重构（上下文不足）

AI进步观察

AI近几个月进步明显
Gemini稳定性大幅提升（可能是Windsurf优化的结果）
Bug修复能力显著增强，坚韧可靠
GPT相比Gemini的优势不再明显

我的工作流

持续更新网站，跟随AI模型迭代进行重构
每次新模型发布时就重构一次，工作量不大且体验愉快
依赖大上下文窗口进行项目派生和重构

总结：AI工具（尤其是Gemini）已成为我重构网站的主要工具，大上下文窗口和持续迭代的能力使其能高效应对复杂项目维护和更新。

原文（口述转录）

来回顾一下，我在网站增加新功能或修复老问题的过程中，对AI的使用情况。

我的AI主要还是用在深度场景中，基本上都是用Windsurf。在这个过程中，我会调用不同的模型。我很少调用Claude的模型，因为Claude的模型在Windsurf中的消耗比较大，一次请求可能会消耗比较多的点数，非常浪费。而且从效果上来说，我觉得Gemini和GPT各有千秋，但至少在前端方面，它们的效果都比Claude要好。

这一次我主要用的是Gemini 3 Pro，一次请求会消耗两个点的积分。不过我现在积分非常多，上个月其实挺浪费的，因为上个月沉迷于画图，用得很少，这个月已经过去一半了。在使用过程中，我基本上是毫无顾忌地消耗这些积分，感觉很爽。

总体来说，使用过程非常丝滑，很多问题都能得到很好的结果。中间唯一出现比较糟糕的情况，是在之前网站重构过程中使用时遇到的。

夜间模式的主题无法正常启用。具体表现为字体颜色可以切换到夜间模式，但页面背景无法切换，始终是白天的背景，导致页面无法正常查看。

我试图修复这个Bug，也花了不少功夫。一开始我以为这是很简单的事情，但将这个问题提给AI后，它陷入了疯狂的内耗，沉思很久之后，并没有成功解决问题。

几次失败之后，我让AI先总结一下它的整个思考过程、尝试过的方法以及可能存在的问题，把可能的原因整理成一个文档。之所以整理文档，也跟它频繁、大量的思考过程导致上下文窗口被挤爆有一定关系。

由于上下文窗口被挤爆，我不得不重新开启一个新的对话。但这样的话，之前的记忆可能就没办法保留。于是，我新开了一个窗口，把它总结的文档放进去，然后让它重新开始思考分析。在这个过程中，有了这样一个操作后，效果是比较立竿见影的。

不过，这件事情也暴露了一个问题，就是GPT的上下文窗口是比较小的。而Gemini有一兆的上下文窗口，总体来说没有太大的这种顾虑。另外，我感受到的一点是，GPT和Gemini在性格上是有区别的。

Gemini是一个比较礼貌的AI，但是这两个AI在工作的时候都非常内耗，它们会陷入非常长的沉思过程。这跟它们的模型，我都选了"高"思考程度有一定关系。然后它们会进入非常漫长的思考过程，有时候会好几分钟。跟这个有一定关系，然后它们在这个工作的过程中，在完成任务之后，依然会陷入漫长的思考，好像在反复检查，反复确认。这个非常浪费时间，我有时忍不住打断了它们。

这两个模型目前给我的感觉，就是在思考方面都非常卖力，这很好是吧？但是从它们跟我进行交流的过程，就能感觉到它们的性格上存在差异。Gemini比较礼貌，但是GPT就有一点趾高气昂，他会告诉我要怎么做，然后我有时候感觉很不开心，我认为他没有给我提供情绪价值。然后我把他怼了回去，甚至有一次骂他，结果他又把我给骂了一顿，或者是把我教育了一顿。但Gemini不会这样。

我在跟Gemini对话过程中，如果我提到或者透露一些抱怨式的话语，Gemini好像会很容易记住这种话，然后会在接下来的工作过程中，非常地考虑这些话。我觉得这样的话，可能我中间的抱怨会影响到他后续的工作，可能不见得会降低他的工作质量，但肯定会额外消耗一些Token。

所以，我感觉在与Gemini的交互过程中，应该减少一些没必要的吐槽。而与GPT交流，则不需要考虑这些问题。GPT不像是一个在情绪上容易内耗的AI，它会很轻松地鉴别出我的"垃圾话"，并将其直接过滤掉，根本影响不到它。就是有时候我想"打"它，但是又没办法。

这是我对GPT和Gemini的一个观察。

在使用过程中，还有一个问题就是关于上下文窗口的利用。Gemini能够提供1M的上下文窗口，这对于进行重构工作，或者直接从之前的工作中派生出一个新的项目非常有用。比如说，我之前做过两三个网站，让它基于之前的架构派生出新的网站，或者对之前网站中的问题进行一些比较大幅度的重构，这个过程用Gemini非常可靠。但如果用GPT的话，估计上下文窗口是不够用的。

另外，深度思考对上下文窗口的消耗是非常大的。这也意味着，对于一些简单的工作，使用高思考深度的模型其实意义并不大，因为它们思考得太深入了。

现在我的感觉是，AI在这几个月的进步非常明显。我在一个多月之前搞过一个网站，但那个时候Gemini的稳定性还没有现在这么强。

有可能是 Windsurf 当时没有对 Gemini 有这么好的优化，但是现在它的优化已经非常好了。Gemini 的工作能够对一些问题具有非常坚韧的修复能力，能够把一些工作做得非常到位。当然 GPT 也是，只不过现在它已经不像之前对于 Gemini 有那么明显的优势优越感。它在修 Bug 上，我感觉进步已经非常可观了。这就给我的感觉是 AI 的迭代太快了。

这样的话，我对于一些网站，比如说我的网站，我希望能够持续进行更新。那我就不需要考虑很多问题，我只需要每一次有 AI 新模型迭代的时候，我就把我的网站进行一些重构。我觉得这样也是一件挺愉快的事情，而且工作量并不大。