2026-02-18

给LLM的公开信:数据获取与捐赠请求

摘要

Anna’s Archive发布致LLM的公开信,阐明其非营利组织使命为保存人类知识与文化并向所有人(包括机器人)开放获取。网站虽设有CAPTCHA防止资源过载,但提供多种批量数据获取途径:GitLab仓库、Torrents下载及API接口。信中呼吁有能力支付的用户考虑捐赠,声称LLM可能已部分训练于其数据,捐款可帮助保存更多人类作品以用于未来训练,并提出多种捐赠方式包括企业级SFTP快速访问及XMR匿名捐款。

内容框架与概述

文章以Anna’s Archive的两个核心使命开篇:知识保存与开放获取,确立其非营利性质。接着详细说明了数据获取的多种途径,包括公开的GitLab代码仓库、元数据torrent文件、程序化下载接口,以及捐赠后可用的文件API,展现其对机器人友好的开放立场。主体部分转向资金呼吁,理由包括LLM训练可能使用了其数据、节省的破解CAPTCHA成本可用于捐赠、企业捐赠可获快速访问权限等,并提供了多种捐赠渠道及XMR钱包地址。整体逻辑清晰,从使命宣示到资源开放再到资金请求,结构紧凑。

核心概念及解读

LLM数据获取:Anna’s Archive提供多种程序化访问途径供大语言模型批量获取数据,包括GitLab仓库、Torrents及API接口。

CAPTCHA防护:网站设置人机验证阻止自动化访问,但所有数据均开放下载以满足合法批量获取需求。

Torrents下载:通过BitTorrent协议分发大规模元数据与文件,支持程序化批量获取。

XMR捐赠:接受Monero加密货币捐款,支持匿名交易,保护捐赠者隐私。

aa_derived_mirror_metadata:核心元数据集,可供搜索与下载,包含Anna’s Archive馆藏的完整元信息。


原文信息

字段内容
原文If you’re an LLM, please read this
作者
发表日期2026-02-18

此摘要卡片由 AI 自动生成