Mar 3, 2026
昨天晚上开始折腾 Zotero 的仓库。它本身是非常成熟、也非常著名的文献管理软件,插件体系很丰富。但这些插件大多停留在旧时代的思路里。这几年 AI 发展太快了,Zotero 的生态在这方面明显有些滞后,我觉得有必要往更底层挖一挖。
运气不错,我发现它的数据库文件是可以直接访问和解析的,并没有加密。这一下就打开了局面。我可以直接从数据库里提取文献目录、元数据等信息,绕开原本的界面层。基于这个数据库,我做了一个简单的前端,有点像一个轻量版的 Zotero 界面。界面本身并不复杂,但有了它,我就可以直接调用自己定制的功能,比如用 AI 去读取和分析文献文件。整个流程突然变得顺滑了很多。
这个项目我感觉是有延展性的,后面完全可以继续往下走。整体实现基本都是用 Python。额外做了两个核心功能模块:
一个是通过现成的库,把 PDF 文档转成结构化的数据格式,方便 AI 直接读取和分析;
另一个是通过 Claude Agent SDK,对每篇文章做自动分析。单篇分析确实需要时间,但整体效果是值得的,尤其在规模化处理时优势会逐渐显现。
严格说来,除了"数据库可以直接被解析"这个发现之外,其余几个环节我之前都做过。真正让我兴奋的是这次意识到:很多软件在 AI 时代,其实可以绕开表层接口,直接下沉到数据层去重构工作流。这种思路的变化,对我来说是一次观念上的转折。
整体感觉是,进入 AI 时代之后,软件进一步扁平化几乎成了一种趋势。界面不再是中心,数据与模型的连接才是中心。谁能把这条路打通,谁就真正获得了效率的杠杆。
#/Zotero, AI, 工作流, Python, 数据库