【请勿合入】Update triton-ascend-coder.md by wwwbby · Pull Request #175 · Just-it/AscendOpGenAgent

wwwbby · 2026-05-06T07:59:35Z

变更说明

变更类型

影响范围

Triton 侧
AscendC 侧
共享（router / benchmark-scheduler）

性能数据（涉及算子生成/优化时必填）

Benchmark 评测（与 BASELINE.md 对比）

指标	BASELINE	本次评测
编译通过数
精度通过数
平均 Speedup

测试环境

设备型号：
CANN 版本：
PyTorch 版本：

冒烟测试（涉及算子生成/框架改动时必填）

Triton 通路：✅ / ❌（失败原因：）
AscendC 通路：✅ / ❌（失败原因：）

验证清单

双通路冒烟测试通过
通过率不退化（编译、精度均 >= BASELINE）
平均 Speedup 不退化（>= BASELINE × 0.95）
性能优化类：已跑全量评测、逐任务无退化、至少 1 个提升 >= 5%

退化说明（如有通过率下跌）

修复脚本支持绝对路径

修复提前退出

将 Model.forward 从 torch_npu.npu_dequant_swiglu_quant 替换为基于 CANN 9.0 V2 文档的 fp32 CPU 实现 (经验 reconcile 后 49/50 与 CANN 自身一致, case 32 上 CANN 自身偏离其 documented formula)。原因详见 PR 描述。

…u-quant benchmark/11_DequantSwigluQuant: 改用 doc-grounded fp32 CPU 实现作为 ref

[triton & ascendc] 合并 br_430 分支到主分支

Just-it and others added 5 commits April 25, 2026 17:43

Merge pull request Just-it#130 from Just-it/br_debug

fd6b8f8

修复脚本支持绝对路径

修复提前退出

b2c0460

Merge pull request Just-it#133 from chopper0126/temp_main

3bb6bad

修复提前退出

Merge pull request Just-it#138 from wabluy/cpu-truth-11-dequant-swigl…

f39a70a

…u-quant benchmark/11_DequantSwigluQuant: 改用 doc-grounded fp32 CPU 实现作为 ref

wwwbby force-pushed the gpu2ascend branch from 50edaf0 to f39a70a Compare May 6, 2026 08:50

Merge pull request Just-it#177 from ElleElleWu/br_430

10fc649

[triton & ascendc] 合并 br_430 分支到主分支

wwwbby force-pushed the gpu2ascend branch 2 times, most recently from ad4b1b8 to b59b84a Compare May 6, 2026 09:07

make gpu2ascend robust

b339fa4

wwwbby force-pushed the gpu2ascend branch from b59b84a to b339fa4 Compare May 6, 2026 09:09

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

【请勿合入】Update triton-ascend-coder.md#175

【请勿合入】Update triton-ascend-coder.md#175
wwwbby wants to merge 7 commits into
Just-it:br_430from
wwwbby:gpu2ascend

wwwbby commented May 6, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

wwwbby commented May 6, 2026

变更说明

变更类型

影响范围

性能数据（涉及算子生成/优化时必填）

Benchmark 评测（与 BASELINE.md 对比）

测试环境

冒烟测试（涉及算子生成/框架改动时必填）

验证清单

退化说明（如有通过率下跌）

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants