Mar 3, 2026 - AlpacaNotes

昨天晚上开始折腾 Zotero 的仓库。它本身是非常成熟、也非常著名的文献管理软件，插件体系很丰富。但这些插件大多停留在旧时代的思路里。这几年 AI 发展太快了，Zotero 的生态在这方面明显有些滞后，我觉得有必要往更底层挖一挖。

运气不错，我发现它的数据库文件是可以直接访问和解析的，并没有加密。这一下就打开了局面。我可以直接从数据库里提取文献目录、元数据等信息，绕开原本的界面层。基于这个数据库，我做了一个简单的前端，有点像一个轻量版的 Zotero 界面。界面本身并不复杂，但有了它，我就可以直接调用自己定制的功能，比如用 AI 去读取和分析文献文件。整个流程突然变得顺滑了很多。

这个项目我感觉是有延展性的，后面完全可以继续往下走。整体实现基本都是用 Python。额外做了两个核心功能模块：

一个是通过现成的库，把 PDF 文档转成结构化的数据格式，方便 AI 直接读取和分析；

另一个是通过 Claude Agent SDK，对每篇文章做自动分析。单篇分析确实需要时间，但整体效果是值得的，尤其在规模化处理时优势会逐渐显现。

严格说来，除了"数据库可以直接被解析"这个发现之外，其余几个环节我之前都做过。真正让我兴奋的是这次意识到：很多软件在 AI 时代，其实可以绕开表层接口，直接下沉到数据层去重构工作流。这种思路的变化，对我来说是一次观念上的转折。

整体感觉是，进入 AI 时代之后，软件进一步扁平化几乎成了一种趋势。界面不再是中心，数据与模型的连接才是中心。谁能把这条路打通，谁就真正获得了效率的杠杆。