research-harness
Health Gecti
- License — License: MIT
- Description — Repository has a description
- Active repo — Last push 0 days ago
- Community trust — 70 GitHub stars
Code Uyari
- process.env — Environment variable access in .github/workflows/codex-review.yml
Permissions Gecti
- Permissions — No dangerous permissions requested
Bu listing icin henuz AI raporu yok.
做证据可信、过程可追、自主优化的长程自动化 AI 科研工具。
做证据可信、过程可追、自主优化的长程自动化 AI 科研工具
Research Harness 是科研 agent 的 harness 层:为 agent 提供证据状态、过程记录、工具接口和反馈回路,让检索、阅读、判断与写作成为可长期运行、可持续积累的自动化科研流程。
适用于 Codex、Claude Code、Gemini CLI、OpenCode、Cline、Cursor Agent、Kilo Code 等主流 AI 编程 agent;也支持通过 agent profile 接入 OpenClaw 等第三方 agent 工具。
为什么需要 RH
普通 agent 已经可以检索论文、总结 PDF、提取观点和生成草稿,但科研真正难的是让这些动作持续积累。一次对话结束后,paper、claim、gap、baseline、实验判断和草稿版本往往散落在聊天记录、临时文件和人的记忆里。Research Harness 解决的是这个断点:让科研过程从一次次回答,变成有证据、有轨迹、可接续、可优化的研究资产。
产品特点
| 特点 | 说明 |
|---|---|
| 证据可信 | 绑定论文、证据片段与来源链,减少无依据推断。 |
| 过程可追 | 记录判断、阶段、版本与门控结果,支持回放、审查和接续。 |
| 自主优化 | 沉淀失败、修正、矛盾和反馈,让后续轮次基于证据继续改进。 |
| 长程任务 | 支持跨会话、跨工具、跨 agent 的连续科研自动化。 |
核心能力
| 能力 | 说明 |
|---|---|
| 🔎 论文池管理 | 围绕研究主题检索、筛选并入库论文,维护可持续扩展的主题级文献池。 |
| 🧾 研究声明提取 | 从论文中提取研究声明、假设、局限、数据集、指标和可复现性风险。 |
| 🧭 来源链追踪 | 记录论文、声明、证据、产出和阶段决策之间的关系,让关键结论可回查。 |
| 🧪 空白与基线分析 | 识别研究空白、关键基线、方法矛盾和可推进的实验方向。 |
| 📝 证据约束写作 | 生成实验 brief、proposal、related work 或章节草稿,并保留对应证据链。 |
| 🚦 阶段编排与门控 | 通过阶段状态、门控检查、一致性检查和产出记录管理长程研究流程。 |
| 🔁 自主优化闭环 | 将失败原因、审查反馈、矛盾发现和修正记录写入研究状态,支持后续轮次持续改进。 |
| 📚 Zotero 阅读工作流 | 以 Zotero 文献库、PDF 和阅读现场为入口,把本地阅读过程接入 RH 研究状态。 |
| 🔌 多 agent 接入 | 支持主流 AI 编程 agent,并可通过 agent profile 接入第三方 agent 工具。 |
快速开始
先安装一个你常用的 AI 编程 agent。下面以 Codex 为例:
npm install -g @openai/codex
然后把下面这段交给 Codex:
请为当前环境安装 Research Harness:
1. 克隆仓库:https://github.com/Biajin-PKU/research-harness.git
2. 进入项目目录并运行 ./setup.sh
3. 运行 rh --json doctor 验证安装
4. 为 Codex 安装 RH skills:rh skill install --agent codex
5. 运行 rh skill verify --agent codex 检查 skills 是否可用
6. 如果任何步骤失败,先诊断原因并修复,不要跳过失败步骤
手动安装、模型路径和 MCP 配置见:
场景展示
下面提供的是可以直接交给 agent 的 prompt。RH 会把这些指令组织成 topic、paper pool、claim、gap、artifact 和 provenance 等结构化状态,而不是只生成一次性聊天回答。
从零建立研究主题
Prompt
围绕「robust budget pacing for online advertising」创建一个研究 topic。
检索近期论文,筛选有用论文入库,并建立第一版 literature map。
RH 如何执行:创建 topic,检索并入库论文,维护 paper pool,并将 literature map 记录为可接续的研究产出。
把阅读变成证据资产
Prompt
精读这个 topic 中最相关的论文。
提取研究声明、关键假设、局限、数据集、指标和可复现性风险。
RH 如何执行:调用论文精读和声明提取能力,把 claim、假设、局限和风险写入主题状态,并保留来源关系。
从证据收敛到实验方向
Prompt
基于已记录证据识别 research gaps。
比较相关 baselines,并为最有潜力的方向生成 experiment brief。
RH 如何执行:基于已入库论文和声明识别 gap 与 baseline,将实验方向收敛为带证据约束的 experiment brief。
生成可审查的写作草稿
Prompt
基于当前 topic 的 paper pool 和 claims,起草 related work。
每个关键结论都需要保留对应证据来源。
RH 如何执行:从 paper pool、claim 和 provenance 中组织写作材料,生成可审查、可追溯的章节草稿。
使用入口
| 入口 | 适合场景 | 文档 |
|---|---|---|
| Zotero 侧边栏 | 以论文 / 文献库为中心的研究工作流 | docs/zotero-rh-panel.md |
| MCP / Agent 客户端 | Codex、Claude Code、Gemini CLI、OpenCode、Cline、Cursor Agent、Kilo Code 等 agent 工作流 | docs/agent-guide.md |
| CLI | 本地终端、脚本、批处理、自动化 | docs/quickstart.zh.md |
| Python API | Notebook、pipeline、程序化集成 | docs/python-api.md |
开源维护与 Codex
Research Harness 本身也使用 Codex 维护开源工作流:生成和审查测试、回放回归用例、检查 release hygiene、更新文档、复核 MCP / CLI / Zotero bridge 变更,并在合并前辅助进行安全检查。RH 的目标不是只让 agent 生成一次性答案,而是把维护过程中的判断、失败、修正和证据记录下来,沉淀为后续可复用的项目状态。
面向开源维护者,RH 提供一套可迁移的 agent 工作模式:Codex 负责执行与验证,RH 负责 paper、claim、artifact、gate、provenance 和长期任务状态,让复杂研究型项目在多轮、多工具、多会话中仍然可追踪、可恢复、可审查。
文档导航
License
Yorumlar (0)
Yorum birakmak icin giris yap.
Yorum birakSonuc bulunamadi