Skip to content

chap14:优化 Reversi 训练参数化并增加报告导出#6030

Open
cccrrr0429 wants to merge 1 commit intoOpenHUTB:mainfrom
cccrrr0429:chap14-reversi-update-clean-20260505
Open

chap14:优化 Reversi 训练参数化并增加报告导出#6030
cccrrr0429 wants to merge 1 commit intoOpenHUTB:mainfrom
cccrrr0429:chap14-reversi-update-clean-20260505

Conversation

@cccrrr0429
Copy link
Copy Markdown
Contributor

修改概述:

对 `src/chap14_reinforcement_learning/reversi_main.py` 进行小幅工程化改进,在不改变 Reversi 强化学习主流程的前提下,增强参数可配置性、实验可复现性和结果可追踪性;同步更新 `README.md` 补充运行说明。

修改的详细描述

  1. 更新 src/chap14_reinforcement_learning/reversi_main.py
    • 新增环境变量参数:
      • REVERSI_SEED
      • REVERSI_MAX_EPOCHS
      • REVERSI_RENDER_INTERVAL
      • REVERSI_MAX_STEPS
      • REVERSI_REPORT_OUT
      • REVERSI_DRY_RUN
    • 增加随机种子设置(randomnumpy)。
    • 增加训练报告导出功能,自动生成 outputs/reversi_train_report.json
    • 增加 DRY_RUN 模式,便于在不完整依赖环境下快速验证脚本流程与输出文件。
  2. 更新 src/chap14_reinforcement_learning/README.md
    • 补充本次工程化改进说明。
    • 增加 PowerShell 运行示例(含 dry-run 与正常运行示例)。

经过了什么样的测试?

  1. 操作系统:Windows(PowerShell)
  2. Python版本:Python 3.9
  3. 测试命令:
    $env:REVERSI_DRY_RUN=1
    $env:REVERSI_REPORT_OUT="outputs/reversi_train_report.json"
    python .\reversi_main.py

运行效果

动图、视频、截图等
d6fd193b-e0cc-461b-902a-b89fbf2256a3

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant