MathorCup Template

这是一个面向 MathorCup 一类数学建模竞赛项目的模板源仓库。

它不是某一场比赛的实例项目，也不是单纯的 LaTeX 模板或代码模板。它的目标是把一套已经在实战里验证过的协作方式固化下来，让你后续创建的新比赛仓库天然具备这些能力：

容器内执行，减少宿主环境漂移
代码脑 / 论文脑分工明确
多 Agent 协作时有共享共识源，不靠聊天记忆硬猜
当前运行事实、论文入口、验收产物、任务边界可以被显式检查
即使没有 vendor-specific sub-agent，也能用多会话稳定协作

这份 README.md 主要写给人类维护者和使用者看。
仓库里的大部分协议文档、合同文档、模板文档，默认都是面向 Agent 的。

0. 快速地图

如果你只是想判断“这个仓库是什么、现在能不能用”，先看这几条：

这里是模板源仓库，不是 live 比赛项目。
scaffold/ 是未来实例文件的 source of truth。
根目录 project/ 只是 placeholder，不要当作当前比赛运行目录。
真实使用路径是先渲染到一个实例目录，再在实例里跑 validator、doctor、容器和 Agent workflow。
reports/ 只放需要长期保留的报告；时间戳 smoke 报告默认是本地验证产物，不入库。

最小自检：

bash scripts/validate_agent_docs.sh --template-source-only

tmpdir="$(mktemp -d)"
bash scripts/setup.sh demo --render-only --target "$tmpdir"
bash scripts/validate_agent_docs.sh --root "$tmpdir"
bash scripts/doctor.sh --root "$tmpdir"

完整链路 smoke 要避开本机已有容器端口：

bash scripts/smoke_realflow.sh \
  --with-docker \
  --with-exec \
  --jupyter-port 18889 \
  --rstudio-port 18789 \
  --keep-temp

1. 这个仓库到底是什么

建议先建立一个清晰心智模型：

mathorcup-template 是模板源仓库。
scaffold/ 是模板真正的 source of truth。
你以后真正参赛、真正写代码、真正写论文的目录，是“从这个模板渲染出来的实例仓库”。

换句话说：

这里不是 live 比赛项目。
这里的职责是“定义以后每个比赛项目该长什么样、怎么跑、怎么协作、怎么校验”。
未来实例仓库中的 AGENTS.md、MEMORY.md、runtime contract、workflow contract、task registry、paper config，都是从这里渲染出来的。

2. 适合什么场景

这个模板适合下面这类工作流：

你希望代码建模、论文写作、排版编译可以并行推进
你希望 Agent 不要频繁猜“当前入口文件是什么”“当前该改哪个目录”
你希望把主脑调度、worker 回传、经验复盘固化为机制
你希望项目默认运行在 Docker 容器里，而不是把 Python / C++ / LaTeX 依赖散落在 host
你希望后续每次新比赛都能快速起一个结构一致的实例仓库

如果你只想要一个轻量单文件比赛模板，这个仓库会显得偏重。
如果你要的是“多人 / 多会话 / 多 Agent”长期协作脚手架，它就是按这个目标设计的。

3. 先理解两层世界

这个仓库里有两套“世界”，不要混淆。

3.1 模板源世界

也就是当前这个仓库本身。

关键特点：

scaffold/ 才是模板源
repo root 下的 project/ 不是某次比赛的真实运行状态
根目录不维护 live MEMORY.md
在这里直接跑 bash scripts/validate_agent_docs.sh 时，现在会识别出“template-source mode”，不会再把你误报成实例坏掉了

3.2 渲染后的实例世界

也就是你未来真正使用的比赛仓库。

关键特点：

会拥有 live AGENTS.md
会拥有 live MEMORY.md
会拥有 project/spec/runtime_contract.md
会拥有 project/spec/callback_hooks.json
会拥有 project/runtime/task_registry.json
会拥有 project/runtime/event_log.jsonl
会拥有 project/paper/runtime/paper.env
这里才是日常建模、写论文、跑容器、交接 handoff、做 retrospective 的地方

4. 仓库结构总览

4.1 你最该关心的目录

scaffold/
- 模板源目录
- 未来实例里绝大多数关键文件都从这里渲染
.codex/
- 模板源仓库自己的 Codex native front door
- 只负责 requirements / skills 入口约束，不承担 runtime truth
scripts/
- 脚本入口目录
- 负责 render / bootstrap / deps / reset / validate / doctor / launcher
project/
- 这里只是模板源仓库里的 placeholder
- 不要把它当真实实例目录来理解

4.2 `scaffold/` 里有什么

scaffold/AGENTS.md.template
- 实例仓库根协议模板
scaffold/.codex/
- 未来实例仓库的 Codex native front door 模板
scaffold/MEMORY.md.template
- 实例运行状态板模板
scaffold/project/spec/
- runtime contract、workflow contract、roles matrix、callback hooks 等协议层
scaffold/project/runtime/
- task registry、work queue、event log 等运行时状态骨架
scaffold/project/workflow/
- task packet、main-brain acceptance、queue board 等协作骨架
scaffold/project/output/review/
- worker feedback 模板，以及 callback/exec harness 的轻量运行产物目录
scaffold/project/output/retrospectives/
- retrospective 模板
scaffold/project/paper/runtime/paper.env.template
- 论文 active entrypoint 单一事实源

4.3 `scripts/` 里最重要的入口

scripts/setup.sh
- 已实例化仓库的总编排入口
scripts/instantiate.sh
- 从 template-source clone 原地生成实例；首次创建比赛仓库时优先用它
scripts/render_templates.sh
- 只负责从 scaffold/ 渲染实例文件
scripts/bootstrap_container.sh
- 只负责容器创建 / 启动
scripts/export_reference_image.sh
- 检测并导出厚镜像 reference runtime
scripts/install_deps.sh
- 只负责容器内依赖安装
scripts/reset_state.sh
- 只负责重置运行状态；状态写入使用 instance-local workflow lock
scripts/validate_agent_docs.sh
- 校验协议、roles、tasks、queue、paper config 等
scripts/doctor.sh
- 轻量诊断入口
scripts/smoke_instance.sh
- 低风险模板自测入口：render temp instance、validate、advisory checks、dispatch/gate/reset；默认不启动 Docker、不运行 codex exec
scripts/smoke_realflow.sh
- 可选真实链路自测入口；默认 dry run，不启动 Docker、不运行 codex exec，必须显式传 --with-docker / --with-exec
- 本机已有容器占用默认端口时，用 --jupyter-port / --rstudio-port 覆盖 smoke 实例端口
scripts/check_state_consistency.sh
- 只读检查 registry、queue、event log、feedback / retrospective artifact 是否互相矛盾
scripts/dual_brain.sh
- 多脑 launcher
scripts/make_task_packet.sh
- 从角色 / task registry 生成任务包
scripts/claim_task.sh
- 认领任务并锁定路径
scripts/list_open_tasks.sh
- 列出当前可直接派发或按条件过滤的任务
scripts/dispatch_task.sh
- 主脑一键完成 claim + packet 落盘 / 输出
scripts/paper_acceptance_check.sh
- 论文构建后只读检查 host-visible PDF / LOG / AUX 是否和 paper.env 对齐
scripts/artifact_index.sh
- 汇总 packet、feedback、retrospective、callback / exec run、handoff、adjudication、paper acceptance report 等派生产物
scripts/exec_healthcheck.sh
- 对 codex exec 做一次最小真实探活
scripts/run_exec_worker.sh
- 用 codex exec 串起 claim + packet + feedback init + worker 执行
scripts/process_callbacks.sh
- 处理 event log 对应的 callback hooks，并生成可审计 callback artifact；写入时使用 workflow lock
scripts/run_exec_batch.sh
- 并行启动多个 write-scope 不冲突的 exec workers
scripts/show_task.sh
- 主脑快速查看单个 task 的当前状态、artifact、recent events、next-step hint
scripts/list_history.sh
- 主脑快速查看单个 task 的 event timeline、queue history、callback artifacts、exec artifacts
scripts/adjudicate_task.sh
- 主脑生成结构化 adjudication artifact，用来比较多个 worker 结果并形成裁决草案
scripts/main_brain_summary.sh
- 主脑一页式决策面板，快速看 runtime facts、queue、active/review、gate 缺口、recent events 和下一步命令建议
scripts/submit_feedback.sh
- 为 worker 初始化 feedback / retrospective skeleton
scripts/submit_handoff.sh
- 校验 code-brain handoff，默认更新 MEMORY.md -> Handoff Index，并记录 handoff_submitted event；不改变 task 状态
scripts/extract_policy_hints.sh
- 从 feedback / retrospective 提取结构化经验候选，写入 policy_hints_candidate.md，供主脑人工审核
scripts/close_task.sh
- 把任务从 in_progress 推进到 review 或 done
scripts/reopen_task.sh
- 把 blocked/review/done 任务按规则重新放回工作流
scripts/cancel_task.sh
- 中止当前 active task，并释放 path lock
scripts/check_worker_feedback.sh
- 检查 worker feedback 是否达标
scripts/check_retrospective.sh
- 检查 retrospective 是否达标

5. 最常见的人类使用路径

5.1 创建一个新比赛实例

最常用流程：

git clone <this-template-repo> mathorcup-<比赛名>
cd mathorcup-<比赛名>
bash scripts/instantiate.sh <比赛名>

默认会做这些事：

从 scaffold/ 渲染实例文件
生成 .env 和 paper runtime config
在渲染校验通过后删除模板 .git，重新 git init，并创建实例初始提交
创建 / 启动容器
安装依赖
执行 doctor 和 validator

这意味着实例仓库默认从当前比赛的第一个 commit 开始，不继承模板仓库历史。如果你确实想保留模板 Git 历史，显式使用：

bash scripts/instantiate.sh <比赛名> --keep-template-git

如果只是预览渲染结果，--render-only 默认不会重置 Git；如需把预览目录也直接变成干净实例，显式使用：

bash scripts/instantiate.sh <比赛名> --render-only --reset-git

默认不会做这些事：

不会强制清空 MEMORY.md
不会删除历史 handoff
不会无提示覆盖已有 runtime config
不会把 rerun setup.sh 等同于“重置项目状态”

5.2 只想先渲染，不想启动容器

bash scripts/setup.sh demo --render-only --target /tmp/demo

适合：

想 smoke-test 模板是否自洽
想看渲染后的实例结构
想在临时目录里验证协议和脚本联动

5.3 只想检查当前实例是否健康

bash scripts/validate_agent_docs.sh --root <实例目录>
bash scripts/doctor.sh --root <实例目录>

两者区别：

validate_agent_docs.sh
- 更偏“协议 / 文档 / 运行配置 / workflow 一致性检查”
doctor.sh
- 更偏“给人看的一页诊断摘要”，包括 repo mode、runtime config、tooling、validation、container state

5.4 进入主脑视角并派发第一个任务

人类通常不直接手改 task_registry.json / work_queue.json。
推荐把自己当成“主脑监督者”，用脚本读取状态、派发任务、检查回传。

在实例仓库里先看全局：

bash scripts/doctor.sh
bash scripts/main_brain_summary.sh
bash scripts/list_open_tasks.sh --open-only

选择一个任务后，由主脑派发：

bash scripts/dispatch_task.sh \
  --task TASK_CODE_MODEL_P1 \
  --owner code_p1_agent

这会完成三件事：

claim 任务并写入 queue / event log
生成 role-aware task packet，并默认落盘到 project/workflow/packets/
自动补建 canonical feedback skeleton

如果你用多会话协作，把生成的 packet 发给另一个 Agent 会话即可。
如果你想让本机 codex exec 跑 worker，先探活再执行：

bash scripts/exec_healthcheck.sh
bash scripts/run_exec_worker.sh \
  --task TASK_CODE_MODEL_P1 \
  --owner exec_code_p1

worker 回传后，主脑再验收：

bash scripts/show_task.sh --task TASK_REVIEW_CONSISTENCY
bash scripts/list_history.sh --task TASK_REVIEW_CONSISTENCY
bash scripts/check_worker_feedback.sh --task TASK_REVIEW_CONSISTENCY
bash scripts/close_task.sh --task TASK_REVIEW_CONSISTENCY --to review

如果多个 worker 给出不同结论，先生成裁决草案，不要直接 close：

bash scripts/adjudicate_task.sh --task TASK_REVIEW_CONSISTENCY

数模实战里更推荐优先派发阶段化任务，而不是反复复用一个大槽位：

bash scripts/dispatch_task.sh --task TASK_CODE_MODEL_P1 --owner code_p1_agent --target <dir>
bash scripts/dispatch_task.sh --task TASK_CODE_MODEL_P23 --owner code_p23_agent --target <dir>
bash scripts/dispatch_task.sh --task TASK_CODE_MODEL_P4 --owner code_p4_agent --target <dir>
bash scripts/dispatch_task.sh --task TASK_PAPER_INTEGRATION --owner paper_integrator --target <dir>
bash scripts/dispatch_task.sh --task TASK_PAPER_FINAL_FIX --owner paper_final_fix --target <dir>

代码阶段如果形成建模假设、canonical numbers、算法边界、枚举上限或论文可消费结果，应从 project/output/MODEL_MANIFEST_TEMPLATE.json 初始化并维护 project/output/model_manifest.json。论文和主脑验收时优先对照这个 manifest，减少数值口径分散在 handoff / MEMORY / feedback / paper 中。

5.5 只想重置运行状态，不碰容器

bash scripts/reset_state.sh --target <实例目录>

这个动作和 setup.sh 是分离的。
这是本模板的刻意设计：setup 不是 reset bomb。

5.6 只想修复容器或重装依赖

bash scripts/setup.sh --bootstrap-only --target <实例目录>
bash scripts/setup.sh --deps-only --target <实例目录>

这样做的好处是：

容器修复不等于状态重置
依赖修复不等于模板重渲染
Agent 和人都更敢重复执行

5.7 默认 reference image 与权限基线

当前模板默认复用的基础镜像是：

mathorcup-runtime:latest

这个 tag 现在来自参考容器 mathorcup_v1-dev 的导出镜像，并保留了版本标签：

mathorcup-runtime:20260419

初始化后的默认容器权限基线会写进实例 .env，并由 bootstrap_container.sh 读取：

CONTAINER_RUNTIME=nvidia
CONTAINER_GPUS=all
CONTAINER_PRIVILEGED=true
CONTAINER_USER=root
CONTAINER_GRANT_SUDO=yes

也就是说，默认行为就是：

以 root 用户启动
以 --privileged 模式启动
请求全部 GPU
容器内保留 GRANT_SUDO=yes

基于当前 reference image 的已验证内部环境：

Python 3.12.12
pip 24.1.2
latexmk 4.83
XeTeX (TeX Live 2023/Debian)
R 4.5.1
sudo 免密可用
nvidia-smi 可用（前提是宿主 Docker GPU runtime 可用）
biber
fd
tree
yq

如果你用的不是这份已导出的 reference image，或者容器内部 baseline 有漂移，再执行：

bash scripts/install_deps.sh --target <实例目录>

如果后续你想用新的 reference container 刷新这套厚镜像，优先使用：

bash scripts/export_reference_image.sh \
  --container mathorcup_v1-dev \
  --image mathorcup-runtime:20260419 \
  --tag-latest

这个脚本会：

检测厚镜像 baseline
如果 reference container 的 Ubuntu 主仓 codename 与容器真实 OS 不一致，先自动归一化
自动补装 biber / fd-find / tree / yq
在只有 fdfind 时补出 fd 命令
再执行 docker commit 导出 reference image

6. 实例仓库创建后，你会得到什么

渲染后的实例仓库里，最重要的几个文件是：

AGENTS.md
- 根协议入口
MEMORY.md
- 运行状态板
.codex/requirements.toml
- Codex native front door summary
.codex/skills/
- Codex native working-method skills
.env
- container / image / host-path 的 machine truth
project/spec/runtime_contract.md
- 当前项目运行事实的 rendered mirror
project/spec/multi_agent_workflow_contract.md
- 多 Agent 协作协议
project/spec/agent_roles.json
- machine-readable 角色权限矩阵
project/runtime/task_registry.json
- machine-readable 任务注册表
project/runtime/work_queue.json
- 当前任务占用与并发状态
project/workflow/MAIN_BRAIN_QUEUE.md
- 给主脑和人类都更易读的队列表
project/workflow/packets/
- dispatch_task.sh 默认写入的历史任务包
project/output/MODEL_MANIFEST_TEMPLATE.json
- 建模假设、算法边界、canonical numbers、输出文件和验证命令的初始化模板
project/output/model_manifest.json
- 实例运行中由 code-brain 维护的建模结果 manifest
project/output/review/PAPER_ACCEPTANCE_CHECKLIST.md
- 终稿提交前的人类 / 主脑检查清单
project/paper/runtime/paper.env
- paper active entrypoint / acceptance artifacts 的 machine truth

可以把它们理解为四层：

AGENTS.md
- 规定读哪些文档、按什么顺序工作
runtime_contract.md
- 给人和 Agent 看的一份 rendered mirror；如果和 .env / project/paper/runtime/paper.env 冲突，config wins
agent_roles.json / task_registry.json / work_queue.json
- 规定谁能改什么、谁正在改什么、能不能并行；其中 owner 只表示当前 active owner
MEMORY.md / feedback / retrospective
- 记录当前状态、已验证事实、经验教训

另外还有一层 native bridge：

.codex/requirements.toml / .codex/skills/
- 负责把 Codex 引导到正确的 repo truth 和正确的工作法
- 不和 .env / paper.env / MEMORY.md / task_registry.json / work_queue.json / event_log.jsonl 争夺 truth
- 本轮默认不启用 hooks.json；repo harness 仍然是唯一必需的 workflow engine

7. 这个模板如何支持“人类 + Agent”协作

这个项目的核心思路不是“让 Agent 自己随便发挥”，而是：

把高频误判点写成合同
把高频冲突点写成 machine-readable 状态
把交接和复盘写成固定模板

7.1 角色划分

实例仓库默认支持这些角色：

main_brain
- 负责任务拆解、状态同步、验收、共识维护
code_brain
- 负责建模、代码、实验、图表、handoff
paper_brain
- 负责 LaTeX 写作和整合
layout_worker
- 负责编译、版式、验收产物
review_worker
- 负责一致性审查、验收审查、复盘沉淀
citation_worker
- 负责引用和术语审校
utility_worker
- 负责有限范围的脏活和辅助自动化

7.2 人类在这套体系里的位置

通常人类扮演的是“项目拥有者 / 主脑监督者”：

决定这轮任务目标
判断哪些任务可以并行
看 task_registry.json 和 MAIN_BRAIN_QUEUE.md
让 Agent 先 claim task，再开始改文件
验收 feedback 和 retrospective

这套系统当前不是全自动 pipeline orchestration。
它的定位是：

人工 / 主脑驱动
machine-readable state 托底
用脚本把多步手工操作串成半自动 workflow
用 append-only event log 和受控 callback hooks 提供可回放的 orchestration harness

也就是说，它不会后台自动派发任务、不会轮询队列、不会自动把任务发到别的会话；但主脑可以用现成脚本把“派工、回填、打回、撤销”这些动作标准化。

7.3 没有 sub-agent 也能工作

如果你的环境没有 vendor-specific delegation，也暂时不想用 codex exec：

仍然可以先看 dispatch pool
再 dispatch task
然后把生成的任务包贴给另一个终端 / 另一个会话里的 Agent

典型顺序通常是：

bash scripts/list_open_tasks.sh --open-only --target <dir>
bash scripts/dispatch_task.sh --task <task_id> --owner <owner> --target <dir>
把任务包发给某个 Agent 会话
dispatch 的 task.dispatched callback 会在缺失时自动补建 feedback skeleton
Agent 完成后填写 feedback / retrospective
code-brain handoff 通过 submit_handoff.sh 提交、校验并索引到 MEMORY.md -> Handoff Index
如需快速汇总当前派生产物，运行：
- bash scripts/artifact_index.sh --target <dir>
如果 feedback 缺失，或你要手工初始化 retrospective，再执行：
- bash scripts/submit_feedback.sh --task <task_id> --with-retrospective --target <dir>
如需重放最新 callback，可执行：
- bash scripts/process_callbacks.sh --latest --target <dir>
bash scripts/check_worker_feedback.sh --task <task_id> --target <dir>
视情况执行：

bash scripts/close_task.sh --task <task_id> --to review|done --target <dir>
bash scripts/reopen_task.sh --task <task_id> --to ready|review|in_progress --reason <reason> --target <dir>
bash scripts/cancel_task.sh --task <task_id> --reason <reason> --target <dir>

这套模板依赖的是“文件化机制”，不是某个产品按钮：

role matrix
task registry
work queue
feedback gate
retrospective gate

7.4 `codex exec` worker 模式

如果你的环境里 codex exec 比 sub-agent 更稳，那么它可以作为这套系统的一等公民执行后端。

推荐顺序：

bash scripts/exec_healthcheck.sh --target <dir>
bash scripts/run_exec_worker.sh --task <task_id> --owner <owner> --target <dir>
如需显式重放最新 callback，可执行：
- bash scripts/process_callbacks.sh --latest --target <dir>
主脑检查：
- bash scripts/check_worker_feedback.sh --task <task_id> --target <dir>
- 如本轮创建了 retrospective，再执行 bash scripts/check_retrospective.sh --task <task_id> --target <dir>
主脑再决定：
- bash scripts/close_task.sh --task <task_id> --to review|done --target <dir>
- 或 bash scripts/reopen_task.sh ...
- 或 bash scripts/cancel_task.sh ...

这条路径的边界要理解清楚：

run_exec_worker.sh 不是后台调度器
它不会自动 close task
它不会替主脑判定 feedback 是否合格
它只是把“生成 packet、初始化回传骨架、调用 codex exec、保存最后一条消息”串成一条显式命令
如果 provider run 成功但没有写出 last-message，它会保留 fallback status artifact 并发出 worker.partial event；主脑仍需检查 feedback / exec artifacts 后再决定 close、reopen 或 cancel
关键动作会写入 project/runtime/event_log.jsonl，并触发受控 callback_hooks

7.5 callback / event-log / harness 是怎么工作的

这轮之后，实例仓库里不只有 packet + gate，还多了一个轻量 orchestration harness：

project/runtime/event_log.jsonl
- append-only event stream
project/spec/callback_hooks.json
- machine-readable event -> action 路由表
bash scripts/process_callbacks.sh
- 前台 callback processor
project/output/review/callback_runs/
- callback 派生出的可审计 artifact

这层机制的作用不是“替你自动做决定”，而是：

记录关键状态变化
在事件发生后执行受控 built-in action
帮主脑生成 next-step hint 和 run summary
让主脑可以重放、排查、复盘

你可以把它理解为：

不是后台守护进程
不是自动工作流引擎
而是文件化、可重放、由主脑显式触发的事件驱动 harness

7.6 有 sub-agent 时怎么用

如果环境支持 sub-agent delegation，也不要再维护一套独立状态系统。

推荐做法仍然是：

主脑看 task_registry.json / MAIN_BRAIN_QUEUE.md
主脑用 dispatch_task.sh 领取并生成 packet
把 packet 发给 sub-agent
sub-agent 按同一套 feedback / retrospective / close / reopen / cancel 机制回传

也就是说：

sub-agent 只是执行媒介
不是另一套 workflow contract
如果 codex exec 也可用，它和 sub-agent 只是两个不同的 worker backend
不建议 worker 自己继续任意分裂新总任务，除非主脑任务包显式允许

7.7 主脑怎么做审计与裁决

这轮之后，主脑侧不需要再手翻多个 json/jsonl/md 去猜一个 task 到底发生了什么。

主脑默认入口链是：

bash scripts/doctor.sh --target <dir>
bash scripts/main_brain_summary.sh --target <dir>
bash scripts/validate_agent_docs.sh --state-consistency-only --root <dir>
bash scripts/recommend_tasks.sh --target <dir>
如果准备派发任务，再执行：
- bash scripts/dispatch_task.sh --task <task_id> --owner <owner> --target <dir>
worker 回传后，先检查 gate：
- bash scripts/check_worker_feedback.sh --task <task_id> --target <dir>
- bash scripts/check_retrospective.sh --task <task_id> --target <dir>
再由主脑显式决定：
- bash scripts/close_task.sh ...
- 或 bash scripts/reopen_task.sh ...
- 或 bash scripts/cancel_task.sh ...
如需做经验候选汇总，再执行：
- bash scripts/extract_policy_hints.sh --target <dir>
若需要 drill down 单任务，再执行：
- bash scripts/show_task.sh --task <task_id> --target <dir>
如需看完整时间线，再执行：

bash scripts/list_history.sh --task <task_id> --target <dir>

如果多个 worker 或多个 artifact 对同一 task 给出不同结论，再执行：

bash scripts/adjudicate_task.sh --task <task_id> --target <dir>

如果 artifacts 分散，再生成索引：

bash scripts/artifact_index.sh --target <dir>

这条链的分工是：

doctor.sh
- 先确认 repo mode、tooling、runtime config truth 入口是否正常
main_brain_summary.sh
- 主脑第一屏，先看 runtime facts、queue、active/review、gate 缺口、recent events 和下一步命令建议，再判断该 drill down 哪个 task
validate_agent_docs.sh --state-consistency-only
- 只读 gate，检查 registry / queue / event log / feedback / retrospective 是否互相矛盾
recommend_tasks.sh
- dispatch 前 advisory recommender，只推荐 safe-to-dispatch，不 claim、不写状态
dispatch_task.sh
- 真正进入派发路径，claim task 并输出 packet
check_worker_feedback.sh / check_retrospective.sh
- 在主脑 close / reopen / cancel 前检查 worker 回传 gate
- gate now checks minimum non-empty content in required body sections, not only heading structure
extract_policy_hints.sh
- 只生成 policy_hints_candidate.md，供主脑人工审阅，不自动提升为 contract 或规则
show_task.sh
- 看单任务当前状态、active owner、last actor、反馈/复盘是否齐全
list_history.sh
- 看事件链、queue history、callback / exec artifact
adjudicate_task.sh
- 只在需要结构化比较多个 worker 证据时再进入
artifact_index.sh
- 只生成 review-side 索引，帮助主脑定位 packet / feedback / retrospective / exec / callback / handoff / acceptance report，不推进任务状态

这里要强调一条边界：

不推荐把“多个 Agent 彼此讨论”实现成自由聊天 relay
推荐方式是：
- packet
- feedback
- retrospective
- event log
- callback artifacts
- adjudication artifact
- main-brain decision

也就是说，adjudication 是结构化比较与裁决草案，不是自动决定 done。

这条默认入口链里，只有下列命令会推进 workflow 状态或写 runtime truth：

dispatch_task.sh
submit_feedback.sh
close_task.sh
reopen_task.sh
cancel_task.sh

而下列命令都属于 advisory 或 read-only：

doctor.sh
main_brain_summary.sh
validate_agent_docs.sh --state-consistency-only
check_state_consistency.sh
recommend_tasks.sh

extract_policy_hints.sh 只写 project/output/review/policy_hints_candidate.md，不写 runtime truth。

7.8 主脑摘要命令

如果你想先看全局，再决定要不要 drill down 到某个 task：

bash scripts/main_brain_summary.sh --target <dir>

它会优先回答这些问题：

当前实例 root / container / image / paper entrypoint / acceptance PDF 是什么
queue 中各状态 task 数量是多少
哪些 task 正在跑，占用了哪些 locked_paths
哪些 review task 需要主脑检查 feedback / retrospective / close gate
是否存在 in_progress/review/done 任务缺 feedback，或 done 任务缺 retrospective
最近 5 条 event log 发生了什么
下一步应先运行哪些只读检查、dispatch 建议或 gate 命令

注意：

show_task.sh 和 main_brain_summary.sh 里出现的 owner 现在只表示当前 active owner
task 一旦离开 in_progress，registry 里的 owner 会被清空
如果你想看最近执行者，应该看 last_actor、event_log.jsonl 或 work_queue.json -> history
main_brain_summary.sh 是 advisory-only，不 dispatch、不 close、不 reopen、不 cancel、不改 runtime state

8. paper 工作流的关键设计

论文侧最容易出错的点，是“大家以为入口文件是 A，实际在编 B”。

当前 paper scaffold 已集成 latexstudio/CUMCMThesis 的 cumcmthesis.cls，用于生成更接近全国大学生数学建模竞赛格式的论文骨架。实例化后默认结构是：

project/paper/main.tex
- 论文 active entrypoint，默认使用 \documentclass[withoutpreface,bwprint]{cumcmthesis}
project/paper/metadata.tex
- 题号、队号、学校、队员、日期等比赛元数据
project/paper/sections/
- 正文分章内容
project/paper/cumcmthesis.cls
- 随实例渲染的 CUMCMThesis class，不需要全局安装
project/paper/spec/CUMCMTHESIS_UPSTREAM.md
- 上游来源、导入 commit 和本模板适配说明

正常写论文时，只改 metadata.tex 和 sections/。不要在实例项目里直接改 cumcmthesis.cls，除非任务明确是维护论文模板。

这个模板用 project/paper/runtime/paper.env 作为 paper side 的单一事实源，里面会定义：

PAPER_ACTIVE_ENTRYPOINT
PAPER_ACCEPT_PDF
PAPER_ACCEPT_LOG
PAPER_ACCEPT_AUX
以及构建相关参数

这意味着：

paper.sh
dual_brain.sh
validator
runtime contract
task packet

都能共享同一份事实，而不是各自猜一套。

同时要注意：

project/paper/runtime/paper.env 是 machine truth
project/paper/spec/paper_runtime_contract.md 是 rendered mirror
如果二者有冲突，以 paper.env 为准

如果你在实例仓库里切换论文入口，应该优先修改这个文件，而不是四处改脚本和文档。

构建论文后，主脑或 layout worker 应执行：

bash scripts/paper_acceptance_check.sh --target <实例目录> --write-report

这个脚本不会编译论文，也不会 close task。它只读取 paper.env，检查 active entrypoint、host-visible PDF / LOG / AUX、页数可读性和高信号 LaTeX log findings。最终提交前再对照：

project/output/review/PAPER_ACCEPTANCE_CHECKLIST.md

9. 为什么保留“代码脑 / 论文脑”而不是只讲通用 Agent

因为在数模实战里，这两个角色的读写边界天然不同：

code_brain 主要关心 project/src、project/output、project/figures
paper_brain 主要关心 project/paper

把这个边界显式保留下来，有几个实际好处：

降低误改目录的概率
降低上下文污染
让主脑更容易拆任务
让“编译型脏活”和“建模型脏活”能独立下放

所以虽然模板已经扩展到多角色，但 dual_brain 仍然保留，是为了保持低成本心智模型。

10. 模板源仓库和实例仓库的常用命令区别

10.1 在模板源仓库里

你通常做的是：

bash scripts/validate_agent_docs.sh
bash scripts/validate_agent_docs.sh --template-source-only

tmpdir="$(mktemp -d)"
bash scripts/setup.sh demo --render-only --target "$tmpdir"
bash scripts/validate_agent_docs.sh --root "$tmpdir"
bash scripts/doctor.sh --root "$tmpdir"

如果要跑完整临时实例链路：

bash scripts/smoke_realflow.sh \
  --with-docker \
  --with-exec \
  --jupyter-port 18889 \
  --rstudio-port 18789 \
  --keep-temp

注意：

模板源仓库根目录不是实例目录
这里跑 validator 时会识别 template-source mode
真正的实例校验要对渲染后的目录执行
默认 8888/8787 端口常被长期容器占用，临时 smoke 建议显式指定备用端口

10.2 在实例仓库里

你通常做的是：

bash scripts/instantiate.sh <比赛名>
bash scripts/validate_agent_docs.sh
bash scripts/doctor.sh
bash scripts/dual_brain.sh both

11. 常用脚本速查

11.1 `scripts/instantiate.sh` / `scripts/setup.sh`

用途：instantiate.sh 负责首次把 template-source clone 转成实例；setup.sh 负责已实例化仓库的 bootstrap / deps / reset / doctor。

常见模式：

bash scripts/instantiate.sh demo
bash scripts/instantiate.sh demo --keep-template-git
bash scripts/instantiate.sh demo --render-only --reset-git
bash scripts/setup.sh demo --render-only --target /tmp/demo
bash scripts/setup.sh --bootstrap-only --target <dir>
bash scripts/setup.sh --deps-only --target <dir>
bash scripts/setup.sh --doctor-only --target <dir>
bash scripts/setup.sh --reset-state --target <dir>

11.1.1 `scripts/export_reference_image.sh`

用途：以参考容器为母体，补齐厚镜像 baseline 后导出 reference image。

常见模式：

bash scripts/export_reference_image.sh --check-only
bash scripts/export_reference_image.sh --container mathorcup_v1-dev --image mathorcup-runtime:20260419 --tag-latest

11.2 `scripts/validate_agent_docs.sh`

用途：做结构和一致性校验。

常见模式：

bash scripts/validate_agent_docs.sh --root <dir>
bash scripts/validate_agent_docs.sh --root <dir> --roles-only
bash scripts/validate_agent_docs.sh --root <dir> --tasks-only
bash scripts/validate_agent_docs.sh --root <dir> --queue-only
bash scripts/validate_agent_docs.sh --root <dir> --feedback-only
bash scripts/validate_agent_docs.sh --root <dir> --retrospective-only
bash scripts/validate_agent_docs.sh --root <dir> --state-consistency-only

模板源仓库还支持：

bash scripts/validate_agent_docs.sh --template-source-only

其中 --state-consistency-only 只读检查 task_registry.json、work_queue.json、event_log.jsonl、feedback / retrospective artifact 是否一致；WARN 不会导致失败，ERROR 会导致非零退出。

状态变更入口会在写入后自动运行同一套轻量 consistency check；如果检查失败，命令以非零退出并报告 post-change consistency check failure。

11.3 `scripts/doctor.sh`

用途：给人类一个比较容易读的诊断摘要。

常见模式：

bash scripts/doctor.sh
bash scripts/doctor.sh --root <dir>

11.3.1 `scripts/main_brain_summary.sh`

用途：给主脑看的一页式决策面板，只读汇总 runtime facts、queue overview、active/review tasks、missing gates、recent events 和下一步建议命令。

常见模式：

bash scripts/main_brain_summary.sh --target <dir>
bash scripts/main_brain_summary.sh --root <dir>

注意：

在 template-source 根目录运行时，它只会提示先 render 一个实例，不会把 repo-root project/ 当 live instance
它只输出建议，不会 dispatch / close / reopen / cancel，也不会写 task_registry.json、work_queue.json 或 event_log.jsonl

11.3.2 `scripts/check_state_consistency.sh`

用途：只读检查控制面状态、audit trace 和 gate artifact 是否互相矛盾。

常见模式：

bash scripts/validate_agent_docs.sh --state-consistency-only --root <dir>
bash scripts/check_state_consistency.sh --target <dir>
bash scripts/check_state_consistency.sh --root <dir>

它会检查：

work_queue.active_items 是否能和 task_registry.json 中的 in_progress task 对齐
active task 的 owner / role / locked_paths 是否一致且不冲突
非 in_progress task 是否错误保留 owner
review/done task 是否缺 feedback，done task 是否缺 retrospective
event_log.jsonl 的 JSONL 基本结构、重复 event_id、task_id / role 是否和 registry 匹配

注意：

这是 checker，不是 fixer；不会从 event log replay 状态，也不会写 runtime state
fresh rendered instance 的空 event log 会以 OK 形式通过
WARN 不会导致失败；ERROR 会导致非零退出

11.4 `scripts/dual_brain.sh`

用途：启动代码脑 / 论文脑工作入口。

常见模式：

bash scripts/dual_brain.sh code
bash scripts/dual_brain.sh paper
bash scripts/dual_brain.sh both

11.5 `scripts/make_task_packet.sh`

用途：根据 role 或 task 自动生成 prompt/task packet。

常见模式：

bash scripts/make_task_packet.sh --role code_brain --target <dir>
bash scripts/make_task_packet.sh --task TASK_PAPER_DRAFT_SLOT --target <dir>

11.6 `scripts/list_open_tasks.sh` / `scripts/recommend_tasks.sh` / `scripts/dispatch_task.sh`

用途：让主脑先看 dispatch pool，用 advisory-only 推荐器判断当前哪些任务更适合派发，再一键派单。

常见模式：

bash scripts/list_open_tasks.sh --target <dir>
bash scripts/list_open_tasks.sh --open-only --target <dir>
bash scripts/list_open_tasks.sh --status blocked --target <dir>
bash scripts/recommend_tasks.sh --target <dir>
bash scripts/recommend_tasks.sh --target <dir> --owner-prefix exec
bash scripts/dispatch_task.sh --task TASK_CODE_MODEL_P1 --owner alice --target <dir>
bash scripts/dispatch_task.sh --task TASK_PAPER_DRAFT_SLOT --owner alice --target <dir>
bash scripts/dispatch_task.sh --task TASK_REVIEW_CONSISTENCY --owner bob --packet-out /tmp/review_packet.md --target <dir>
bash scripts/dispatch_task.sh --task TASK_REVIEW_CONSISTENCY --owner bob --print-only --target <dir>

注意：

--open-only 只看 todo/ready 且 owner="" 的任务
recommend_tasks.sh 只读 agent_roles.json、task_registry.json、work_queue.json，只输出 safe-to-dispatch / blocked reason / dispatch 建议命令，不 claim、不写状态
dispatch_task.sh 默认会把 packet 写到 project/workflow/packets/<task>_<time>.md；只有显式 --print-only 才不落盘
blocked 不在直接派发池里，想看它必须显式 --status blocked

11.7 `scripts/exec_healthcheck.sh` / `scripts/run_exec_worker.sh` / `scripts/run_exec_batch.sh`

用途：把 codex exec 接成一个可选但正式的 worker backend。

常见模式：

bash scripts/exec_healthcheck.sh --target <dir>
bash scripts/exec_healthcheck.sh --target <dir> --model gpt-5.4
bash scripts/run_exec_worker.sh --task TASK_REVIEW_CONSISTENCY --owner exec_review --target <dir>
bash scripts/run_exec_worker.sh --task TASK_REVIEW_CONSISTENCY --owner exec_review --with-retrospective --goal "只做 review output，不改源码" --target <dir>
bash scripts/run_exec_batch.sh --tasks TASK_CODE_MODEL_SLOT,TASK_UTILITY_SUPPORT --owner-prefix exec --lock TASK_CODE_MODEL_SLOT:project/src --lock TASK_CODE_MODEL_SLOT:project/output/review/TASK_CODE_MODEL_SLOT_feedback.md --lock TASK_UTILITY_SUPPORT:project/runtime --lock TASK_UTILITY_SUPPORT:project/output/review/TASK_UTILITY_SUPPORT_feedback.md --max-concurrency 2 --target <dir>

注意：

exec_healthcheck.sh 只做一次最小真实探活，不是后台 health monitor
run_exec_worker.sh 会串起 dispatch、feedback skeleton、codex exec、last-message 落盘
run_exec_batch.sh 只负责并行 supervisor，不会自动判定任务 done
如果 task slot 的默认 allowed_paths 太宽，可以用 --lock task_id:path 给 batch 指定更窄的 claim scope
它不会自动 close_task.sh
如果 exec 失败，任务不会被自动取消，仍由主脑决定是 retry、cancel 还是 reopen
如果 exec provider 成功但没生成 last-message，wrapper 会写 fallback status artifact 并标记 worker.partial，避免主脑只因 last-message 缺失丢失 worker 证据
默认运行产物会落到 project/output/review/exec_runs/

11.7.1 `scripts/paper_acceptance_check.sh` / `scripts/artifact_index.sh`

用途：终稿验收和主脑复盘时减少“产物到底在哪、PDF 是否最新、关键 artifact 怎么找”的人工成本。

常见模式：

bash scripts/paper_acceptance_check.sh --target <dir>
bash scripts/paper_acceptance_check.sh --target <dir> --write-report
bash scripts/paper_acceptance_check.sh --target <dir> --json
bash scripts/artifact_index.sh --target <dir>
bash scripts/artifact_index.sh --target <dir> --json --no-write

注意：

paper_acceptance_check.sh 是 read-only checker，不编译、不修改 runtime truth、不 close task
--write-report 只写 project/output/review/paper_acceptance_check.md
artifact_index.sh 只写派生 review artifact：project/output/review/artifact_index.md/json
这两个脚本都不能替代主脑验收，只是减少误判和定位成本

11.8 `scripts/process_callbacks.sh`

用途：重放或显式处理 event_log.jsonl 对应的 callback hooks。

常见模式：

bash scripts/process_callbacks.sh --latest --target <dir>
bash scripts/process_callbacks.sh --event-id <event_id> --target <dir>
bash scripts/process_callbacks.sh --replay-from <event_id> --target <dir>

注意：

它只执行受控 built-in actions，不执行任意 shell callback
它不是后台 listener
callback 派生 artifact 默认写到 project/output/review/callback_runs/

11.9 `scripts/claim_task.sh` / `scripts/close_task.sh`

用途：管理任务占用、状态推进和并发约束。

这些状态变更脚本会在 rendered instance 的 project/runtime/.workflow.lock 上获取 repo-local 写锁，保护 task_registry.json、work_queue.json、event_log.jsonl 和生成的 MAIN_BRAIN_QUEUE.md。read-only/advisory 命令不获取该写锁。

常见模式：

bash scripts/claim_task.sh --task TASK_CODE_MODEL_SLOT --owner alice --target <dir>
bash scripts/claim_task.sh --task TASK_PAPER_DRAFT_SLOT --owner bob --lock project/paper/sections --target <dir>
bash scripts/close_task.sh --task TASK_CODE_MODEL_SLOT --to review --target <dir>
bash scripts/close_task.sh --task TASK_REVIEW_CONSISTENCY --to done --accepted-by main_brain --target <dir>

11.10 `scripts/submit_feedback.sh` / `scripts/submit_handoff.sh`

用途：repair missing feedback skeleton、初始化 retrospective、或手工补建回传文件。

常见模式：

bash scripts/submit_feedback.sh --task TASK_CODE_MODEL_SLOT --target <dir>
bash scripts/submit_feedback.sh --task TASK_REVIEW_CONSISTENCY --with-retrospective --target <dir>
bash scripts/submit_handoff.sh --task TASK_CODE_MODEL_SLOT --handoff <dir>/project/output/handoff/P1_model_20260425.md --target <dir>
bash scripts/submit_handoff.sh --task TASK_CODE_MODEL_SLOT --handoff <dir>/project/output/handoff/P1_model_20260425.md --target <dir> --no-index

注意：

canonical path 是 dispatch_task.sh 触发 task.dispatched callback 自动补 feedback skeleton
submit_feedback.sh 不是和 dispatch 并列的主路径
它更适合 repair missing feedback、补 retrospective、或者手工补录
submit_handoff.sh 是 code-brain handoff 的提交入口：它只接受 rendered instance root，检查 project/output/handoff/P*.md 的 6 个 heading 和最低具体内容，默认原子更新 MEMORY.md -> Handoff Index，并写入 handoff_submitted event；--no-index 只校验并记事件，不改 MEMORY

11.10.1 `scripts/extract_policy_hints.sh`

用途：只读扫描 worker feedback / retrospective，提取结构化经验候选并生成 project/output/review/policy_hints_candidate.md，供主脑人工审查。

常见模式：

bash scripts/extract_policy_hints.sh --target <dir>
bash scripts/extract_policy_hints.sh --root <dir>

注意：

它只写 project/output/review/policy_hints_candidate.md
它不会修改 AGENTS.md、runtime contract、workflow contract、README、task_registry.json、work_queue.json 或 event_log.jsonl
fresh rendered instance 下如果没有有效候选，也会生成 candidate 文件并写明 no policy hints found

11.11 `scripts/reopen_task.sh` / `scripts/cancel_task.sh`

用途：标准化处理“任务打回重做”“任务中止撤销”。

常见模式：

bash scripts/cancel_task.sh --task TASK_PAPER_DRAFT_SLOT --reason "manual stop" --target <dir>
bash scripts/reopen_task.sh --task TASK_PAPER_DRAFT_SLOT --to ready --reason "retry later" --target <dir>
bash scripts/reopen_task.sh --task TASK_PAPER_DRAFT_SLOT --to in_progress --owner alice --reason "resume now" --target <dir>
bash scripts/reopen_task.sh --task TASK_LAYOUT_ACCEPTANCE --to review --reason "acceptance needs recheck" --target <dir>

状态机上要注意：

done 不能直接跳回 ready 或 in_progress
如果要重开已验收任务，应先 done -> review
然后再由主脑决定是否 review -> ready 或 review -> in_progress
task 一旦离开 in_progress，owner 会被清空；最近执行者应从 event_log.jsonl 或 work_queue.json -> history 读取

11.12 `scripts/check_worker_feedback.sh` / `scripts/check_retrospective.sh`

用途：在主脑验收前检查 worker 回传是否满足最小结构和最低内容质量要求。现在 gate 会检查必填主体 section 是否有最低非空有效内容，而不只是检查标题结构；policy-hint candidate 字段仍可保留默认 none / no。

常见模式：

bash scripts/check_worker_feedback.sh --task TASK_CODE_MODEL_SLOT --target <dir>
bash scripts/check_retrospective.sh --task TASK_REVIEW_CONSISTENCY --target <dir>

12. 人类最容易踩的坑

12.1 把模板源仓库误当成实例仓库

这是最常见的误区。

症状：

直接在模板源仓库根目录里找 live MEMORY.md
直接把 repo root 下的 project/ 当成比赛项目
直接对模板源仓库根目录跑实例级 validator，再疑惑为什么缺 live 文件

正确做法：

模板维护改 scaffold/
实例验证对渲染目录执行

12.2 把 rerun `setup.sh` 当成 reset

现在不是这个语义。

正确理解：

setup.sh 默认是安全重跑的 orchestration
reset_state.sh 才是显式 destructive path

12.3 让 Agent 直接凭感觉改文件

正确做法是：

先看 runtime contract
再看 role matrix
再看 task registry / work queue
再生成 task packet

12.4 论文入口漂移后只改脚本不改 `paper.env`

正确做法：

优先改 project/paper/runtime/paper.env
再让脚本和文档自动消费这份共享事实

13. 如果你要维护这个模板本身

维护模板时，建议遵守这条顺序：

先改 scaffold/ 中对应模板源
如果改到脚本行为，再看 scripts/setup.sh / scripts/render_templates.sh / scripts/validate_agent_docs.sh
用临时目录做渲染验证
确认模板源仓库模式和实例模式都没有被破坏

推荐最小验证：

tmpdir="$(mktemp -d)"
bash scripts/setup.sh demo --render-only --target "$tmpdir"
bash scripts/validate_agent_docs.sh --root "$tmpdir"
bash scripts/doctor.sh --root "$tmpdir"

完整可用性验证：

bash scripts/smoke_realflow.sh \
  --with-docker \
  --with-exec \
  --jupyter-port 18889 \
  --rstudio-port 18789 \
  --keep-temp

如果你改的是模板源仓库自身的行为，也建议补一次：

bash scripts/validate_agent_docs.sh
bash scripts/doctor.sh

14. 相关文档

MIGRATION_TO_AGENT_FIRST_WORKFLOW.md
- 解释为什么模板从旧结构迁移到现在的 scaffold-first / agent-first 结构
AGENTS.md
- 模板仓库维护协议

15. 一句话总结

如果只用一句话概括这个项目：

它不是“给人手工搭比赛目录”的模板，而是“给人和 Agent 共同维护比赛项目”的可执行脚手架。

Name		Name	Last commit message	Last commit date
Latest commit History 49 Commits
.codex		.codex
legacy/claude		legacy/claude
project		project
reports		reports
scaffold		scaffold
scripts		scripts
.gitignore		.gitignore
AGENTS.md		AGENTS.md
MIGRATION_TO_AGENT_FIRST_WORKFLOW.md		MIGRATION_TO_AGENT_FIRST_WORKFLOW.md
README.md		README.md
docker-compose.yml		docker-compose.yml

Folders and files

Latest commit

History

Repository files navigation

MathorCup Template

0. 快速地图

1. 这个仓库到底是什么

2. 适合什么场景

3. 先理解两层世界

3.1 模板源世界

3.2 渲染后的实例世界

4. 仓库结构总览

4.1 你最该关心的目录

4.2 scaffold/ 里有什么

4.3 scripts/ 里最重要的入口

5. 最常见的人类使用路径

5.1 创建一个新比赛实例

5.2 只想先渲染，不想启动容器

5.3 只想检查当前实例是否健康

5.4 进入主脑视角并派发第一个任务

5.5 只想重置运行状态，不碰容器

5.6 只想修复容器或重装依赖

5.7 默认 reference image 与权限基线

6. 实例仓库创建后，你会得到什么

7. 这个模板如何支持“人类 + Agent”协作

7.1 角色划分

7.2 人类在这套体系里的位置

7.3 没有 sub-agent 也能工作

7.4 codex exec worker 模式

7.5 callback / event-log / harness 是怎么工作的

7.6 有 sub-agent 时怎么用

7.7 主脑怎么做审计与裁决

7.8 主脑摘要命令

8. paper 工作流的关键设计

9. 为什么保留“代码脑 / 论文脑”而不是只讲通用 Agent

10. 模板源仓库和实例仓库的常用命令区别

10.1 在模板源仓库里

10.2 在实例仓库里

11. 常用脚本速查

11.1 scripts/instantiate.sh / scripts/setup.sh

11.1.1 scripts/export_reference_image.sh

11.2 scripts/validate_agent_docs.sh

11.3 scripts/doctor.sh

11.3.1 scripts/main_brain_summary.sh

11.3.2 scripts/check_state_consistency.sh

11.4 scripts/dual_brain.sh

11.5 scripts/make_task_packet.sh

11.6 scripts/list_open_tasks.sh / scripts/recommend_tasks.sh / scripts/dispatch_task.sh

11.7 scripts/exec_healthcheck.sh / scripts/run_exec_worker.sh / scripts/run_exec_batch.sh

11.7.1 scripts/paper_acceptance_check.sh / scripts/artifact_index.sh

11.8 scripts/process_callbacks.sh

11.9 scripts/claim_task.sh / scripts/close_task.sh

11.10 scripts/submit_feedback.sh / scripts/submit_handoff.sh

11.10.1 scripts/extract_policy_hints.sh

11.11 scripts/reopen_task.sh / scripts/cancel_task.sh

11.12 scripts/check_worker_feedback.sh / scripts/check_retrospective.sh

12. 人类最容易踩的坑

12.1 把模板源仓库误当成实例仓库

12.2 把 rerun setup.sh 当成 reset

12.3 让 Agent 直接凭感觉改文件

12.4 论文入口漂移后只改脚本不改 paper.env

13. 如果你要维护这个模板本身

14. 相关文档

15. 一句话总结

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

4.2 `scaffold/` 里有什么

4.3 `scripts/` 里最重要的入口

7.4 `codex exec` worker 模式

11.1 `scripts/instantiate.sh` / `scripts/setup.sh`

11.1.1 `scripts/export_reference_image.sh`

11.2 `scripts/validate_agent_docs.sh`

11.3 `scripts/doctor.sh`

11.3.1 `scripts/main_brain_summary.sh`

11.3.2 `scripts/check_state_consistency.sh`

11.4 `scripts/dual_brain.sh`

11.5 `scripts/make_task_packet.sh`

11.6 `scripts/list_open_tasks.sh` / `scripts/recommend_tasks.sh` / `scripts/dispatch_task.sh`

11.7 `scripts/exec_healthcheck.sh` / `scripts/run_exec_worker.sh` / `scripts/run_exec_batch.sh`

11.7.1 `scripts/paper_acceptance_check.sh` / `scripts/artifact_index.sh`

11.8 `scripts/process_callbacks.sh`

11.9 `scripts/claim_task.sh` / `scripts/close_task.sh`

11.10 `scripts/submit_feedback.sh` / `scripts/submit_handoff.sh`

11.10.1 `scripts/extract_policy_hints.sh`

11.11 `scripts/reopen_task.sh` / `scripts/cancel_task.sh`

11.12 `scripts/check_worker_feedback.sh` / `scripts/check_retrospective.sh`

12.2 把 rerun `setup.sh` 当成 reset

12.4 论文入口漂移后只改脚本不改 `paper.env`

Packages