生成式AI与维基百科编辑:2025年的经验教训
摘要
Wiki Education作为贡献了英语维基百科19%新活跃编辑者的组织,对其项目中生成式AI的使用情况进行了深入研究。通过使用Pangram检测工具,他们发现被标记为AI生成的文章中有超过三分之二未能通过验证,即内容引用了真实来源但该来源并不包含所述信息。基于此发现,该组织明确建议编辑者不应将AI聊天机器人的输出直接粘贴到维基百科文章中,并实施了实时监控和培训干预措施,成功将重复使用AI的参与者控制在3%以内。
内容框架与概述
Wiki Education在2025年启动了对生成式AI在维基百科编辑中应用的全面调查。首席技术官Sage Ross采用Pangram工具对2022年以来通过其项目创建的3078篇文章进行检测,发现178篇文章被标记为AI生成,且使用比例自ChatGPT发布后稳步上升。该组织的核心团队花费一个月时间人工审查这些文章,得出了一个令人担忧的结论。
调查结果显示,虽然只有7%的AI生成文章包含虚假引用,但超过三分之二的文章存在验证失败问题。这意味着文章中的陈述引用了真实且相关的来源,但这些来源实际上并不包含所声称的信息。这种难以察觉的误导性内容比虚假引用更具危害性,因为读者无法轻易判断信息的真实性。为此,Wiki Education投入大量人力进行清理工作,将不合格的文章移回沙盒或进行删除处理。
针对这一发现,Wiki Education对其指导方针进行了全面修订。他们在Dashboard课程管理平台上集成了近实时AI检测功能,创建了关于如何正确使用生成式AI工具的培训模块,强调绝不应将AI聊天机器人的输出直接复制粘贴到维基百科中。同时,他们设计了多种自动化提醒邮件和视频教程,为项目参与者提供多样化学习途径。
2025年下半年的监测数据显示,系统共发出1406次AI编辑警告,其中仅有22%涉及实际文章命名空间的编辑。大多数AI检测发生在沙盒练习阶段,特别是在参与者在完成选择文章、评估文章和创建参考书目等早期练习时。Pangram工具在分析纯文本内容时表现优异,但在处理参考书目和大纲等非文本内容时会出现误报。经过早期干预措施后,Wiki Education在2025年秋季支持的6357名新编辑者中,只有3%出现多次AI警告,5%的参与者在实际文章编辑中触发AI警告,证明了干预措施的有效性。
核心概念及解读
验证失败:文章引用了真实且相关的来源,但该来源实际并不包含文章所声称的信息,导致内容真伪无法判断。
Pangram检测工具:专门用于检测维基百科文本中AI生成内容的工具,在分析纯文本段落时具有高度准确性。
沙盒编辑:维基百科供新编辑者练习和草拟内容的测试空间,Wiki Education的大多数AI检测发生在此阶段。
仪表盘平台:由Sage Ross构建的课程管理系统,能够跟踪编辑行为并基于维基百科编辑为Wiki Experts生成工作票据。
Grammarly高级功能:基础语法修正不会触发AI检测,但使用其内容创作功能会产生被标记为AI生成的文本。
原文信息
| 字段 | 内容 |
|---|---|
| 原文 | Generative AI and Wikipedia editing:What we learned in 2025 |
| 作者 | LiAnna Davis |
| 发表日期 | 2026-01-30 |
此摘要卡片由 AI 自动生成