Deep

ClaudeCode论文流水线开源获6.4k星

Yuchen

18 May 2026 — 6 min read

一款名为 academic-research-skills（ARS）的开源项目在 GitHub 上迅速蹿红，斩获 6.4k Stars，成为学生党撰写论文的“神器”。该项目深度整合了 Anthropic 的 Claude Code，将论文全流程——从文献调研、写作、审稿到定稿——打包成一套可复用的智能体技能包。不同于简单的提示词组合，ARS 在底层设计中嵌入了引用核验、完整性闸门、反谄媚协议以及三层数据隔离等机制，试图系统性解决 AI 辅助学术研究中的幻觉、讨好与不可复现等核心痛点。项目作者是来自中国台湾的开发者 Edward Cheng-I Wu，他通过 300 多次迭代，展示了如何让 AI 真正成为“副驾驶”而非“飞行员”。

6.4k Stars：从研究到发表的完整流水线

ARS 的核心由四个技能模块构成，覆盖学术研究全链路。首先是 Deep Research——一支由 13 个 Agent 组成的研究团队，负责文献调研、研究问题构建、方法论设计，并能撰写系统性的 PRISMA 综述。团队中设有专门进行文献溯源的 Agent，通过调用 Semantic Scholar API 验证每篇引用的真实性；还有苏格拉底导师 Agent 通过对话引导研究者理清思路，以及魔鬼代言人 Agent 专门“挑刺”，防止思维定式。

其次是 Academic Paper——12 个 Agent 的写作团队，从大纲设计、论证构建、草稿撰写，到双语摘要生成、图表可视化、引用格式转换，一应俱全。风格校准功能可学习用户过往作品风格，使输出更接近个人写作习惯，避免“AI 味”。输出格式支持 Markdown、DOCX、LaTeX，最终可编译成 APA 7.0 或 IEEE 格式的 PDF。

第三是 Academic Paper Reviewer——7 个 Agent 的审稿团队，模拟真实学术期刊评审流程，由主编 EIC 领导三位领域审稿人和一位魔鬼代言人，从方法论、学科视角、跨学科价值等多维度按 0~100 分量化评分。80 分以上接受，65~79 小修，50~64 大修，50 以下拒稿，并生成详细修改路线图。

最后是 Academic Pipeline——流程编排器，将前三者串联成 10 个阶段的流水线，每个阶段都有明确产物和检查点。用户可在任意阶段插入，例如已有初稿则从完整性检查开始，收到审稿意见则直接从修订切入。费用透明：一篇 1.5 万字的论文全程约需 4~6 美元。

系统性防错：引用核验、完整性闸门与反谄媚设计

ARS 最亮眼之处在于其底层设计哲学——系统性防止 AI 搞砸学术研究。第一是 引用核验：每篇文献必须通过 Semantic Scholar API 的存在性确认，并使用 Levenshtein 相似度算法进行模糊匹配，阈值设定在 0.70 以上才算通过。这不仅能捕获编造的文章，还能检测标题相似但作者年份全错、DOI 真实但内容对不上等隐蔽问题。

第二是 完整性闸门：在流水线的 Stage 2.5 和 Stage 4.5 设置两道不可跳过的检查点，运行一份 7 项 AI 失败模式检查清单（源自 2026 年 Nature 发表的自主 AI 科研研究）。任何被标记为 SUSPECTED 的问题必须在 4.5 阶段变为 CLEAR，或由人工手动覆盖并留下记录。实测中，该机制在一篇真实论文里抓到了 15 个伪造引用和 3 个统计错误。

第三是 反谄媚协议与让步阈值：审稿团队中的魔鬼代言人（Devil's Advocate）负责挑刺，但其反驳会被评分 1~5 分，若低于 4 分，写作团队不允许承认。换句话说，AI 不能为了显得好合作就轻易让步。同时，攻击强度在修订过程中必须保持，评分轨迹被追踪，任何维度的分数下降都会被标记为回归，以此防止“改一处搞砸另一处”。

第四是 三层数据隔离：ARS 将数据流严格分为三层——Layer 1 原始输入（默认不可信）、Layer 2 完整性验证后的产物、Layer 3 评分标准与参考答案（永远不能出现在写作 AI 的上下文中）。写作团队和审稿团队分两次独立调用，写作 AI 只能收到自然语言反馈，看不到原始评分标准。该设计灵感源自 Anthropic 的 w2s-researcher 研究。

此外，ARS 还为每个产物生成 repro_lock 文件，记录运行时的完整配置，并强制声明 LLM 输出不是字节级可复现的，模型提供商可能更新权重而不改模型 ID，外部 API 每天返回不同数据——这是一份配置文档，而非重放保证。

安装简单，费用透明：两行命令开启 AI 论文写作

安装方式极为便捷：如果在使用 Claude Code，只需在终端执行两行命令：/plugin marketplace add Imbad0202/academic-research-skills 和 /plugin install academic-research-skills。验证安装可运行 /ars-plan 启动苏格拉底对话。单条命令测试可用 /ars-lit-review “你的研究主题”。更简单的办法是将 SKILL.md 直接上传到 claude.ai 项目知识库，无需安装 Claude Code，但仅支持单 Agent 版本。

项目支持繁体中文和英文。完整跑完 10 个阶段，单次可消耗超过 20 万输入 token 和 10 万输出 token，单独使用子模块则少得多。按当前 API 价格，一篇一万五千字的论文全程费用不过 4~6 美元，对于有科研经费的学生而言几乎可以忽略不计。

项目作者 Edward Cheng-I Wu（吴政宜）来自中国台湾，他在 GitHub 上还发布了台湾正式文件写作 Skill、本地数据匿名化工具等项目。ARS 的 README 中写道：“AI 是你的副驾驶，不是飞行员。”这种克制而务实的设计哲学，或许比工具本身更值得学术社区借鉴。

阿里免费高考志愿Agent上线

2026年高考落下帷幕，志愿填报这一决定考生命运的关键环节，正在被AI Agent技术彻底重塑。面对1290万考生、近3000所高校与2000多个专业构成的庞大选择迷宫，传统的被动式问答Chatbot已显力不从心。阿里巴巴旗下的千问近日宣布，推出国内首个全周期高考志愿填报Agent，并面向全国考生免费开放。这款产品不仅能够主动规划、持久记忆用户偏好，更通过40万“AI考生”的对抗压测，将志愿规划师的专业经验沉淀进了模型底层。从知识库构筑、对抗强化学习到动态方案生成，千问正试图用AI弥合长期存在的高考信息鸿沟，让每一位考生都能享受公平而专业的选择权。 Agent入场：从“被动应答”到“主动规划”的范式革命千问高考志愿Agent的上线，标志着AI在复杂决策场景中的进化。与聊天机器人不同，Agent具备三大核心能力：持久记忆，能记住用户说过的每一句话；主动规划，如自动生成“志愿日历”提醒关键时间节点；实时工具调用与反思，让回答更加精准。以北京一位660分、理化生选科、目标人工智能专业的考生为例，Agent在接收填写的省份、成绩、专业偏好乃至MBTI性格类型后，自动生成包含院校推荐、专

科大讯飞发布SpaceMind

2026年6月10日，科大讯飞在其英文名iFLYTEK于香港举办的全球发布会上，正式推出智慧空间Agentic架构SpaceMind。这一架构标志着人工智能Agent从虚拟数字世界加速迈入物理空间，赋予楼宇、家居等实体环境以自主思考、真实记忆与自学习能力。SpaceMind通过60GHz毫米波雷达实现5厘米级精准定位，并采用双模型协同架构将设备指令响应速度压缩至700毫秒以内，能够实时感知用户需求与环境变化，主动联动各类设备提供个性化服务。此举不仅巩固了科大讯飞在AI软硬一体战略中的技术护城河，也为智慧空间行业树立了新的交互基准。 60GHz毫米波雷达与双模型协同：重新定义空间感知精度 SpaceMind的核心技术突破在于其感知层与决策层的协同设计。根据发布会披露，该架构搭载60GHz毫米波雷达，能够实现5厘米级的室内定位精度，远超传统蓝牙或Wi-Fi方案的米级误差。在决策层面，双模型协同架构将设备指令的响应速度提升至700毫秒以内，这意味着用户在物理空间中的一举一动——从走进房间到语音指令发出——系统均能在亚秒级内完成感知、理解与设备联动。这种低延迟、高精度的交互能力，使Spa

GitHub和Hugging Face创始人注资AI代理初创Zaro

总部位于伦敦的初创公司Zaro成功完成510万美元融资，由知名风投Cherry Ventures领投，并罕见地获得了代码托管巨头GitHub联合创始人Thomas Dohmke与开源AI平台Hugging Face联合创始人Thomas Wolf的个人背书。这笔投资不仅点燃了AI Agent（智能体）赛道的新热度，更揭示了行业正在从“通用聊天机器人”加速迈向“定制化数字劳动力”的关键拐点。硅谷传奇创始人押注，企业级AI Agent从“演示”到“部署” Zaro的创始团队由Tommy Barav领导，他此前是AI初创公司Lovable（原名GPT Engineer）的增长顾问。该公司提供的核心服务是帮助客户构建定制化的AI Agent，其目标市场直指企业自动化中尚未被完全开发的“灰色地带”。据Zaro透露，其技术栈能够将AI Agent从单纯的对话工具升级为能够独立执行复杂业务流程的“虚拟员工”。本次融资的投资者阵容星光熠熠，GitHub的Dohmke和Hugging Face的Wolf以“天使投资人”身份加入，此外还有Spotify早期高管Petter Carlsson和马士基

代理AI引爆700亿安全市场重塑

全球网络安全市场在2026年第一季度突破70亿美元大关，同比增长14%，这一稳健增长背后隐藏着更深层的结构性变革：Agentic AI（自主人工智能）时代的到来正逼迫企业重新设计安全架构。Dell'Oro Group最新报告揭示，传统硬件安全设备正被抛弃，软件定义、云原生平台成为投资重镇。企业不仅要保护人类员工，还要为数十亿自主决策的“AI数字员工”建立行为护栏，一个全新的安全市场逻辑正在诞生。 70亿美元安全市场爆发：Agentic AI驱动转型 2026年第一季度的网络安全支出创下历史新高，但Dell'Oro Group分析师Mauricio Sanchez指出：“物理防火墙和单一产品并未消失，但Agentic AI时代正在提升软件和云原生安全平台的价值。”这份报告的核心洞察是，企业不再购买“更多相同的东西”，而是大规模从硬件安全向集成化、软件定义的平台迁移。市场增长的核心驱动力来自企业急需为自主非人类行为体（AI代理）建立数字护栏，这直接推动了特定云原生安全领域的爆发式增长。政策平面扩张：SSE增长22%，WAF增长20% 传统“有边界可防御”的安全模型已被抛弃，取