AI-infra-LearningNote

AI 基础设施学习笔记，聚焦 GPU 编程、LLM 训练与推理、通信系统、深度学习框架和性能分析。

这个仓库不是一个单一软件项目，而是一个持续演进的知识库：每个目录对应一个主题，README 负责解释核心概念、源码链路、实验代码或性能现象。

如何使用

如果你刚开始看，可以按下面的路线进入：

GPU / CUDA Infra：从 CUDA 硬件架构开始，再看内存层次、TensorCore、CUTLASS / CuTe。
LLM Training Infra：先看 Attention、MoE，再进入 TP、PP、FSDP。
LLM Inference Infra：从 KV Cache、Continuous Batching、Chunked Prefill 和 FlashDecode 入手。
Framework / Serving：看 PyTorch 架构、torch.compile、vLLM、SGLang 权重加载。
Training Compute / Scaling Law：看 Chinchilla Scaling Law，理解固定训练算力下参数量和训练 token 数的分配。
系统与调优：看通信原语、NCCL、系统与硬件、CUDA Profiling。

目录地图

AI-infra-LearningNote/
├── 01-cuda/       CUDA 编程、GPU 架构、算子、CUTLASS/CuTe
├── 02-lang/       C++、Python、Triton 与底层编程语言基础
├── 03-llm/        LLM 架构、训练、推理、量化、并行与评测
├── 03-multi/      多模态模型 Infra，含 ViT/CLIP/VAE/DiT/LDM
├── 04-comm/       通信后端、NCCL、集合通信与计算通信重叠
├── 05-framework/  PyTorch、vLLM、SGLang、Megatron、DeepSpeed
├── 06-agent/      Agent 框架与向量检索
├── 07-system/     CPU/GPU/NPU、内存系统、OS I/O、进程模型
├── 08-tools/      编译器、项目管理、第三方库与工程工具
├── 09-profile/    性能分析、调试、优化方法与评测工具
├── 010-dist/      分布式训练专题
├── 011-train/     训练算力、Scaling Law 与训练策略
├── concept/       pre-training / SFT / RL 等基础概念
├── cuda/          CUTLASS / CuTe 实践代码
└── dao/           算子开发范式与任务划分

核心主题

当前重点

近期新增和重点维护方向：

CUDA VMM、Pin Memory、Hopper Pipeline、Blackwell 架构
Triton Matmul、FlashAttention、Kernel Fusion
Chinchilla Scaling Law、训练算力与数据/参数配比
PyTorch compile/custom ops/memory/linear 源码链路
vLLM 架构、并行策略、显存管理、Sleep Mode
多模态 DiT/LDM/ADM、DiT Cache、Text2X
FSDP、分布式转置、通信 overlap、NCCL 专题

待补主题见 TODO.md。

维护约定

根 README 保持为高层入口，不追求列出每个叶子目录。
每个主题目录优先维护自己的 README，根 README 只链接稳定入口。
新增目录时尽量保持路径命名一致，避免大小写混用和拼写漂移。
示例代码、实验日志和图表应放在对应主题目录下，README 只保留结论、关键路径和复现实验入口。

最后更新：2026-05-15

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AI-infra-LearningNote

如何使用

目录地图

核心主题

CUDA 与 GPU 编程

编程语言与 Kernel DSL

LLM 架构、训练与推理

多模态 Infra

通信、框架与系统

当前重点

维护约定

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 175 Commits
.claude		.claude
.vscode		.vscode
01-cuda		01-cuda
010-dist		010-dist
011-train		011-train
02-lang		02-lang
03-llm		03-llm
03-multi		03-multi
04-comm		04-comm
05-framework		05-framework
06-agent		06-agent
07-system		07-system
08-tools		08-tools
09-profile		09-profile
concept		concept
cuda		cuda
dao		dao
skills/look-with-camera		skills/look-with-camera
.gitignore		.gitignore
CLAUDE.md		CLAUDE.md
README.md		README.md
TODO.md		TODO.md
run1.log		run1.log

Folders and files

Latest commit

History

Repository files navigation

AI-infra-LearningNote

如何使用

目录地图

核心主题

CUDA 与 GPU 编程

编程语言与 Kernel DSL

LLM 架构、训练与推理

多模态 Infra

通信、框架与系统

当前重点

维护约定

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages