research-harness

mcp
Guvenlik Denetimi
Uyari
Health Gecti
  • License — License: MIT
  • Description — Repository has a description
  • Active repo — Last push 0 days ago
  • Community trust — 70 GitHub stars
Code Uyari
  • process.env — Environment variable access in .github/workflows/codex-review.yml
Permissions Gecti
  • Permissions — No dangerous permissions requested

Bu listing icin henuz AI raporu yok.

SUMMARY

做证据可信、过程可追、自主优化的长程自动化 AI 科研工具。

README.md

research harness

简体中文 · English

License Python MCP

做证据可信、过程可追、自主优化的长程自动化 AI 科研工具

Research Harness 是科研 agent 的 harness 层:为 agent 提供证据状态、过程记录、工具接口和反馈回路,让检索、阅读、判断与写作成为可长期运行、可持续积累的自动化科研流程。

适用于 Codex、Claude Code、Gemini CLI、OpenCode、Cline、Cursor Agent、Kilo Code 等主流 AI 编程 agent;也支持通过 agent profile 接入 OpenClaw 等第三方 agent 工具。

为什么需要 RH

普通 agent 已经可以检索论文、总结 PDF、提取观点和生成草稿,但科研真正难的是让这些动作持续积累。一次对话结束后,paper、claim、gap、baseline、实验判断和草稿版本往往散落在聊天记录、临时文件和人的记忆里。Research Harness 解决的是这个断点:让科研过程从一次次回答,变成有证据、有轨迹、可接续、可优化的研究资产。

产品特点

特点 说明
证据可信 绑定论文、证据片段与来源链,减少无依据推断。
过程可追 记录判断、阶段、版本与门控结果,支持回放、审查和接续。
自主优化 沉淀失败、修正、矛盾和反馈,让后续轮次基于证据继续改进。
长程任务 支持跨会话、跨工具、跨 agent 的连续科研自动化。

核心能力

能力 说明
🔎 论文池管理 围绕研究主题检索、筛选并入库论文,维护可持续扩展的主题级文献池。
🧾 研究声明提取 从论文中提取研究声明、假设、局限、数据集、指标和可复现性风险。
🧭 来源链追踪 记录论文、声明、证据、产出和阶段决策之间的关系,让关键结论可回查。
🧪 空白与基线分析 识别研究空白、关键基线、方法矛盾和可推进的实验方向。
📝 证据约束写作 生成实验 brief、proposal、related work 或章节草稿,并保留对应证据链。
🚦 阶段编排与门控 通过阶段状态、门控检查、一致性检查和产出记录管理长程研究流程。
🔁 自主优化闭环 将失败原因、审查反馈、矛盾发现和修正记录写入研究状态,支持后续轮次持续改进。
📚 Zotero 阅读工作流 以 Zotero 文献库、PDF 和阅读现场为入口,把本地阅读过程接入 RH 研究状态。
🔌 多 agent 接入 支持主流 AI 编程 agent,并可通过 agent profile 接入第三方 agent 工具。

快速开始

先安装一个你常用的 AI 编程 agent。下面以 Codex 为例:

npm install -g @openai/codex

然后把下面这段交给 Codex:

请为当前环境安装 Research Harness:

1. 克隆仓库:https://github.com/Biajin-PKU/research-harness.git
2. 进入项目目录并运行 ./setup.sh
3. 运行 rh --json doctor 验证安装
4. 为 Codex 安装 RH skills:rh skill install --agent codex
5. 运行 rh skill verify --agent codex 检查 skills 是否可用
6. 如果任何步骤失败,先诊断原因并修复,不要跳过失败步骤

手动安装、模型路径和 MCP 配置见:

场景展示

下面提供的是可以直接交给 agent 的 prompt。RH 会把这些指令组织成 topic、paper pool、claim、gap、artifact 和 provenance 等结构化状态,而不是只生成一次性聊天回答。

从零建立研究主题

Prompt

围绕「robust budget pacing for online advertising」创建一个研究 topic。
检索近期论文,筛选有用论文入库,并建立第一版 literature map。

RH 如何执行:创建 topic,检索并入库论文,维护 paper pool,并将 literature map 记录为可接续的研究产出。


把阅读变成证据资产

Prompt

精读这个 topic 中最相关的论文。
提取研究声明、关键假设、局限、数据集、指标和可复现性风险。

RH 如何执行:调用论文精读和声明提取能力,把 claim、假设、局限和风险写入主题状态,并保留来源关系。


从证据收敛到实验方向

Prompt

基于已记录证据识别 research gaps。
比较相关 baselines,并为最有潜力的方向生成 experiment brief。

RH 如何执行:基于已入库论文和声明识别 gap 与 baseline,将实验方向收敛为带证据约束的 experiment brief。


生成可审查的写作草稿

Prompt

基于当前 topic 的 paper pool 和 claims,起草 related work。
每个关键结论都需要保留对应证据来源。

RH 如何执行:从 paper pool、claim 和 provenance 中组织写作材料,生成可审查、可追溯的章节草稿。

使用入口

入口 适合场景 文档
Zotero 侧边栏 以论文 / 文献库为中心的研究工作流 docs/zotero-rh-panel.md
MCP / Agent 客户端 Codex、Claude Code、Gemini CLI、OpenCode、Cline、Cursor Agent、Kilo Code 等 agent 工作流 docs/agent-guide.md
CLI 本地终端、脚本、批处理、自动化 docs/quickstart.zh.md
Python API Notebook、pipeline、程序化集成 docs/python-api.md

开源维护与 Codex

Research Harness 本身也使用 Codex 维护开源工作流:生成和审查测试、回放回归用例、检查 release hygiene、更新文档、复核 MCP / CLI / Zotero bridge 变更,并在合并前辅助进行安全检查。RH 的目标不是只让 agent 生成一次性答案,而是把维护过程中的判断、失败、修正和证据记录下来,沉淀为后续可复用的项目状态。

面向开源维护者,RH 提供一套可迁移的 agent 工作模式:Codex 负责执行与验证,RH 负责 paper、claim、artifact、gate、provenance 和长期任务状态,让复杂研究型项目在多轮、多工具、多会话中仍然可追踪、可恢复、可审查。

文档导航

License

MIT License

Yorumlar (0)

Sonuc bulunamadi