mathmodel-skill (v6.0.0)

面向 CUMCM (国赛) / MCM·ICM (美赛) / 电工杯三类数学建模竞赛的 10 阶段工程化流程。全程问答式——用户只需回答编号问题, 不必手敲 bash / python / json。同时支持 Codex 与 Claude Code, 状态文件跨 harness 互通。带 4 层反馈、跨阶段一致性回检、终局多视角评审、题型差异化加权、实测分位锚定打分。

这是什么

数学建模竞赛是 3-4 天完成 1 篇 25-40 页论文的紧迫工程, 流程从选题、建模、求解、灵敏度到写作很容易在某一环悄悄崩。这套 skill 把每个阶段的检查项、典型反模式、跨阶段一致性约束固化下来, 让大模型按固定流程跟使用者一起走, 减少返工。

v6 起三条设计:

Codex-native packaging — 按 OpenAI Codex Skills / AGENTS.md / Plugins 的官方形态补齐 agents/openai.yaml 与 .codex-plugin/plugin.json, 适合放入 $HOME/.agents/skills/ 或项目 .agents/skills/。
全程问答式 (Friendly Mode) — 关键决策 (选题/选模型/verdict/refine) 全部以编号选项呈现, 用户输入 1-4 即可推进, 全程不需要手敲 bash / python / json。每个问题都有 "让我决定 (推荐 X)" 兜底, 完全无脑也能跑通。
harness-agnostic — 同一份 skill, Codex 通过 skill 目录 / AGENTS.md / plugin 入口, Claude Code 通过 SKILL.md 入口, 状态文件 cwd/state/decision_log.json 跨 harness 互通。Day 1 在 Codex 跑 stage 0-2, Day 2 切回 Claude Code 接着 stage 3+, 完全不丢状态。

它不替选题、不替建模、不保证拿奖。作用是把节奏卡住, 把容易忘的细节固化, 把别人论文里反复出现的句式与命名提取出来供模仿。

蒸馏内容来源:

CUMCM: 91 篇真国赛 2023-2025 获奖论文自动烘焙 (empirical.json 含 11 维 p25/p50/p75 实测分位)
MCM/ICM: 基于 COMAP 公开 scoring rubric + Outstanding Winner 公开模式手写, seed v0.1
电工杯: 基于历年题量 + 公开评审标准估算, seed v0.1

支持的竞赛

竞赛	时长	语言	LaTeX	子问数	数据状态
CUMCM 国赛	72h	中文	xelatex / cumcmthesis	3-5	stable (91 篇真烘焙)
MCM/ICM 美赛	96h	English	pdflatex	3-6	seed v0.1 (公开评审标准 + 教材共识)
电工杯	72h	中文	xelatex / ctex	6-8	seed v0.1 (历年题量估算)

切换方式: stage 0 kickoff 第一问选竞赛 → 自动写入 decision_log.competition → 后续阶段从 competitions/<comp>/ 加载对应 winning_patterns / phrase_bank / anti_patterns / abstract_template / paper_skeleton。

怎么用

Claude Code

git clone https://github.com/handsomeZR-netizen/mathmodel-skill.git ~/.claude/skills/mathmodel-skill
pip install -r ~/.claude/skills/mathmodel-skill/templates/shared/requirements.txt

启动 Claude Code, 跟 Claude 说"开始建模"或"打 mcm"。

Codex (推荐 V6 安装)

git clone https://github.com/handsomeZR-netizen/mathmodel-skill.git ~/.agents/skills/mathmodel-skill
pip install -r ~/.agents/skills/mathmodel-skill/templates/shared/requirements.txt
cd <your-team-workspace>
codex

跟 Codex 说"开始建模"或显式说"使用 $mathmodel-skill 开始建模"。Codex 会按 skill metadata 触发 SKILL.md; 如果当前 workspace 也有 AGENTS.md, Codex 会把它作为项目级 instructions 叠加。

项目级安装也可以:

mkdir -p .agents/skills
git clone https://github.com/handsomeZR-netizen/mathmodel-skill.git .agents/skills/mathmodel-skill

Codex 没有原生选项 UI 时, skill 自动回退成 markdown 编号列表 (1) ... 2) ... 4) 让我决定 (推荐 X)), 你回数字即可。

Codex Plugin 分发

V6 已包含 .codex-plugin/plugin.json, 可作为 Codex plugin 形式分发。该 manifest 按官方结构指向 ./skills/, 其中 skills/mathmodel-skill/SKILL.md 是薄 shim, 会继续加载根目录主 SKILL.md。GitHub Release 源码包即可作为云端分发物。

OpenAI 官方文档对齐点

Codex 按层级读取 AGENTS.md, 用于项目级 instructions。
Codex Skills 使用 SKILL.md frontmatter description 做触发, agents/openai.yaml 做 UI 元数据。
Codex Plugins 可以声明并分发 skills, 适合团队复用。
后续维护 OpenAI/Codex 相关规则时, 优先用 OpenAI Docs MCP 或 OpenAI 官方文档核对。

之后的事

第一次会问 5 个问题 (竞赛、题号、队员、截止、PDF), 然后从 Stage 0 开始走。每个 stage 的关键决策点都会以编号问答呈现; 想偷懒就一直选"让我决定 (推荐 X)", 也能跑通。

跨 harness 接力: 状态全部在 cwd/state/decision_log.json, 队友换 harness 接着跑不丢进度。详见 references/harness_compat.md。

结构

SKILL.md                       # Claude Code 入口, 三竞赛矩阵 + 加载协议 + verdict 定义
AGENTS.md                      # Codex 项目级 instructions, 指向 SKILL.md + 说明 harness 差异
agents/openai.yaml             # Codex skill UI 元数据 + 默认 prompt
.codex-plugin/plugin.json      # Codex plugin 分发 manifest
skills/mathmodel-skill/        # Codex plugin 官方 skills/ 布局 shim
README.md                      # 当前文件
competitions/                  # 竞赛特化层
  cumcm/                       # 91 篇真烘焙: empirical.json + 蒸馏 markdown
    winning_patterns.md
    phrase_bank.md
    anti_patterns.md            # 32 条
    distilled_*.md              # 4 份蒸馏: 段落 / 命名 / 结构 / 格式
    empirical.json              # p25/p50/p75 进入 L1 critic prompt
    abstract_template.md        # 5 段式 + 完整示例
    paper_skeleton.md           # 22-25 页骨架
    rubric_overlay.json         # 国赛特化 dim
    topic_specs.json            # A-E + task_type 映射
  mcm/                         # SEED v0.1 - 1-page summary + Letter
    (同结构, 加 SEED 标记)
  diangong/                    # SEED v0.1 - 工程导向, 6-8 子问
    (同结构, 加 SEED 标记)
references/                    # 通用层 (跨竞赛共享)
  stage_00 ~ stage_09           # 10 阶段细则 (含 YAML frontmatter)
  feedback_layer1 ~ 4           # 自评 / 跨阶段回检 / 5 视角 panel / 防 gaming
  rubrics.md                    # 评分量表 (与 SKILL.md verdict 三处统一)
  model_catalog.md              # 60+ 模型按 10 类 + 历年题速查
  harness_compat.md             # Claude Code / Codex 适配协议 (问答式 + state 互通)
templates/
  latex/{cumcm,mcm,diangong}/   # 各竞赛 LaTeX 模板
  shared/                       # 跨竞赛通用
    decision_log.json           # 跨阶段状态 schema (含 v3.0 三新字段)
    assumption_table.md
    notation_table.md
    sensitivity_table.md
    code_starter/               # Python 起手代码 (优化/预测/评价/分类/仿真)
    requirements.txt
config/
  dim_weights.json              # 三竞赛 × 题型 × stage × dim → 权重表
scripts/
  score_artifact.py             # L1 评分 + verdict 重算 + empirical 注入 + per-Qi 聚合 + 题型加权
  extract_diff.py               # section-level patch 精修 (省 60% token)
  render_paper.py               # md → tex → pdf 三竞赛分支 (xelatex/pdflatex)
  ingest_papers.py              # PDF 烘焙 (cumcm 蒸馏后已存档; 后续 mcm/diangong 可用)
tests/fixtures/                 # score_artifact 单元测试样本

设计选择

Codex-native packaging (v6): SKILL.md 仍是主 workflow, agents/openai.yaml 提供 Codex UI 元数据, .codex-plugin/plugin.json + skills/mathmodel-skill/ 提供 plugin 分发入口, AGENTS.md 只保留项目级 harness shim.
Friendly Mode 优先: 关键决策必须以编号选项呈现, 每问都有 "让我决定 (推荐 X)" 兜底. 用户不必读 stage 文档, 不必编辑 json, 不必敲 bash. 目标是把"工程化流程"对用户的认知负担降到最低.
harness-agnostic: skill 目录 / AGENTS.md / plugin / SKILL.md 多入口, decision_log.json 跨 harness 互通. 团队成员可以混用 Claude Code 与 Codex 接力打比赛.
10 阶段 / 4 反馈层 / 3 模式 / 3 竞赛 / 2 harness 正交组合: 每个轴向独立, 组合矩阵 ≥ 72 种行为. 切 harness 不影响 mode, 切竞赛不影响反馈层, 反之亦然.
评分锚定实测分位 (cumcm): 91 篇 p25/p50/p75 直接进入 L1 Critic prompt 的 evidence 字段, 而非"推荐 600-900 字"这种估计值
Stage 5 per-Qi 加权聚合 (v3.0): 单 Qi 弱不再被全 stage 平均掩盖. pass_with_review 与 refine_partial 两个新 verdict 实现差异化降级 — Q2 单独 refine 不重做 Q1/Q3, 节省 ~60% 时间
题型 dim 权重: A 优化题强化模型 dim, C 数据题强化统计/灵敏度, MCM 全题型强化 communication, F 政策题加权 Letter. 权重 clamp [0.7, 1.5] 防过激.
路径协议严格: <skill>/ 内文件用 skill 相对路径, 用户产物 (state/results/figures/paper_workspace) 用 cwd 相对路径, 三竞赛特化文件用 competitions/<comp>/ 通配. harness 无关.
token 纪律: section-level patch 精修, references/competitions 懒加载, decision_log 持久化, 早退阈值 (iter-1 全维 ≥9 即跳)

不做的事

不替选题、不替建模、不保证拿奖。蒸馏内容仅作模仿模板, MCM 与电工杯 seed v0.1 准确性低于 cumcm, 文件头部均有 SEED 标记。

实测

模式	Token	耗时	适用
fast	≤ 50k	~30 min	选题试跑 / sanity check
standard (默认)	≤ 200k	~6h	主流程
championship	≤ 500k	~12h	提交前最后冲刺 (含 L3 panel + L4 校准 + red-team)

实测 cumcm fast 模式跑通一次约 30 min, 含 cwd/state/decision_log.json 写入和 panel 串行 5 视角. mcm 模式 1-page summary 与 Letter 部分需手工打磨, 自动产出仅作骨架.

数据来源

CUMCM 91 篇真烘焙:

教育部"中国大学生在线"数学建模论文展廊 (2023-2025, 32 篇)
GitHub zhanwen/MathModel/国赛论文/2023年优秀论文/ (58 篇, A-F 全)
GitHub Jackyleo-Zhao/cumcm-2025 (1 篇国二 C 题)
烘焙时间 2026-05-05; 91 篇 PDF 已存档不读, 仅蒸馏 markdown 与 empirical.json

MCM/ICM seed v0.1:

COMAP 官方 scoring rubric (公开) + Outstanding Winner press release 总结段落
MCM Tutorial (Frank Giordano) 等已发表备赛教材共识

电工杯 seed v0.1:

电工杯官网历年题目题量分析
中国电机工程学会公开论文评审标准 (工程类)

开发日志

V1: 初次搭建, 10 阶段 + 4 反馈层
V2: 审计修了 20 条 (协议矛盾、schema 漂移、脚本 bug)
V3: 模板瘦身 + 91 篇 PDF 蒸馏成 4 份 markdown 后删除 PDF (释放 494MB)
V4: 三竞赛通用化 (competitions/{cumcm,mcm,diangong}/); 评分系统升级 — empirical 真正进入 L1 prompt; Stage 5 per-Qi 加权聚合 + 差异化降级 (pass_with_review / refine_partial 两个新 verdict); 题型 dim 权重 (config/dim_weights.json); SKILL.md 由 9k 字节瘦身到 ≤ 6k.
V5: harness-agnostic — 新增 AGENTS.md 作为 Codex CLI 入口, references/harness_compat.md 定义跨 harness 行为约定, decision_log.json 跨 Claude Code / Codex CLI 互通. Friendly Mode — 所有关键决策点 (选题/选模型/verdict/refine 决策) 强制问答式 (编号选项 + "让我决定" 兜底), 用户不再需要手敲 bash / python / 编辑 json. stage_00 / stage_01 / stage_05 已落实问答式样板, 其余 stage 由 SKILL.md 顶层协议统一约束.
V6 (current): Codex-native packaging — 按 OpenAI Codex Skills / AGENTS.md / Plugins 官方形态补齐 agents/openai.yaml、.codex-plugin/plugin.json 与 skills/mathmodel-skill/ plugin shim, README 改为 .agents/skills/ 安装方式, AGENTS.md 降级为项目级 instructions shim, references/harness_compat.md 同步 Codex skill / plugin 发现协议. 运行时 workflow、评分脚本与 decision_log.json schema 保持兼容.

License

MIT. 蒸馏出的 markdown 是从公开论文统计模式与改写而来, 不含原文。

学生作品, 发现 bug / 建议欢迎开 issue。