research harness

做证据可信、过程可追、自主优化的长程自动化 AI 科研工具

Research Harness 是科研 agent 的 harness 层：为 agent 提供证据状态、过程记录、工具接口和反馈回路，让检索、阅读、判断与写作成为可长期运行、可持续积累的自动化科研流程。

适用于 Codex、Claude Code、Gemini CLI、OpenCode、Cline、Cursor Agent、Kilo Code 等主流 AI 编程 agent；也支持通过 agent profile 接入 OpenClaw 等第三方 agent 工具。

为什么需要 RH

普通 agent 已经可以检索论文、总结 PDF、提取观点和生成草稿，但科研真正难的是让这些动作持续积累。一次对话结束后，paper、claim、gap、baseline、实验判断和草稿版本往往散落在聊天记录、临时文件和人的记忆里。Research Harness 解决的是这个断点：让科研过程从一次次回答，变成有证据、有轨迹、可接续、可优化的研究资产。

产品特点

特点	说明
证据可信	绑定论文、证据片段与来源链，减少无依据推断。
过程可追	记录判断、阶段、版本与门控结果，支持回放、审查和接续。
自主优化	沉淀失败、修正、矛盾和反馈，让后续轮次基于证据继续改进。
长程任务	支持跨会话、跨工具、跨 agent 的连续科研自动化。

核心能力

能力	说明
🔎 论文池管理	围绕研究主题检索、筛选并入库论文，维护可持续扩展的主题级文献池。
🧾 研究声明提取	从论文中提取研究声明、假设、局限、数据集、指标和可复现性风险。
🧭 来源链追踪	记录论文、声明、证据、产出和阶段决策之间的关系，让关键结论可回查。
🧪 空白与基线分析	识别研究空白、关键基线、方法矛盾和可推进的实验方向。
📝 证据约束写作	生成实验 brief、proposal、related work 或章节草稿，并保留对应证据链。
🚦 阶段编排与门控	通过阶段状态、门控检查、一致性检查和产出记录管理长程研究流程。
🔁 自主优化闭环	将失败原因、审查反馈、矛盾发现和修正记录写入研究状态，支持后续轮次持续改进。
📚 Zotero 阅读工作流	以 Zotero 文献库、PDF 和阅读现场为入口，把本地阅读过程接入 RH 研究状态。
🔌 多 agent 接入	支持主流 AI 编程 agent，并可通过 agent profile 接入第三方 agent 工具。

快速开始

先安装一个你常用的 AI 编程 agent。下面以 Codex 为例：

npm install -g @openai/codex

然后把下面这段交给 Codex：

请为当前环境安装 Research Harness：

1. 克隆仓库：https://github.com/Biajin-PKU/research-harness.git
2. 进入项目目录并运行 ./setup.sh
3. 运行 rh --json doctor 验证安装
4. 为 Codex 安装 RH skills：rh skill install --agent codex
5. 运行 rh skill verify --agent codex 检查 skills 是否可用
6. 如果任何步骤失败，先诊断原因并修复，不要跳过失败步骤

手动安装、模型路径和 MCP 配置见：

场景展示

下面提供的是可以直接交给 agent 的 prompt。RH 会把这些指令组织成 topic、paper pool、claim、gap、artifact 和 provenance 等结构化状态，而不是只生成一次性聊天回答。

从零建立研究主题

Prompt

围绕「robust budget pacing for online advertising」创建一个研究 topic。
检索近期论文，筛选有用论文入库，并建立第一版 literature map。

RH 如何执行：创建 topic，检索并入库论文，维护 paper pool，并将 literature map 记录为可接续的研究产出。

把阅读变成证据资产

Prompt

精读这个 topic 中最相关的论文。
提取研究声明、关键假设、局限、数据集、指标和可复现性风险。

RH 如何执行：调用论文精读和声明提取能力，把 claim、假设、局限和风险写入主题状态，并保留来源关系。

从证据收敛到实验方向

Prompt

基于已记录证据识别 research gaps。
比较相关 baselines，并为最有潜力的方向生成 experiment brief。

RH 如何执行：基于已入库论文和声明识别 gap 与 baseline，将实验方向收敛为带证据约束的 experiment brief。

生成可审查的写作草稿

Prompt

基于当前 topic 的 paper pool 和 claims，起草 related work。
每个关键结论都需要保留对应证据来源。

RH 如何执行：从 paper pool、claim 和 provenance 中组织写作材料，生成可审查、可追溯的章节草稿。

使用入口

入口	适合场景	文档
Zotero 侧边栏	以论文 / 文献库为中心的研究工作流	docs/zotero-rh-panel.md
MCP / Agent 客户端	Codex、Claude Code、Gemini CLI、OpenCode、Cline、Cursor Agent、Kilo Code 等 agent 工作流	docs/agent-guide.md
CLI	本地终端、脚本、批处理、自动化	docs/quickstart.zh.md
Python API	Notebook、pipeline、程序化集成	docs/python-api.md

开源维护与 Codex

Research Harness 本身也使用 Codex 维护开源工作流：生成和审查测试、回放回归用例、检查 release hygiene、更新文档、复核 MCP / CLI / Zotero bridge 变更，并在合并前辅助进行安全检查。RH 的目标不是只让 agent 生成一次性答案，而是把维护过程中的判断、失败、修正和证据记录下来，沉淀为后续可复用的项目状态。

面向开源维护者，RH 提供一套可迁移的 agent 工作模式：Codex 负责执行与验证，RH 负责 paper、claim、artifact、gate、provenance 和长期任务状态，让复杂研究型项目在多轮、多工具、多会话中仍然可追踪、可恢复、可审查。

文档导航

License

MIT License

为什么需要 RH

产品特点

核心能力

快速开始

场景展示

使用入口

开源维护与 Codex

文档导航

License

Yorumlar (0)