Skip to content

jiajun-c/AI-infra-LearningNote

Repository files navigation

AI-infra-LearningNote

AI 基础设施学习笔记,聚焦 GPU 编程、LLM 训练与推理、通信系统、深度学习框架和性能分析。

这个仓库不是一个单一软件项目,而是一个持续演进的知识库:每个目录对应一个主题,README 负责解释核心概念、源码链路、实验代码或性能现象。


如何使用

如果你刚开始看,可以按下面的路线进入:

  1. GPU / CUDA Infra:从 CUDA 硬件架构 开始,再看 内存层次TensorCoreCUTLASS / CuTe
  2. LLM Training Infra:先看 AttentionMoE,再进入 TPPPFSDP
  3. LLM Inference Infra:从 KV CacheContinuous BatchingChunked PrefillFlashDecode 入手。
  4. Framework / Serving:看 PyTorch 架构torch.compilevLLMSGLang 权重加载
  5. Training Compute / Scaling Law:看 Chinchilla Scaling Law,理解固定训练算力下参数量和训练 token 数的分配。
  6. 系统与调优:看 通信原语NCCL系统与硬件CUDA Profiling

目录地图

AI-infra-LearningNote/
├── 01-cuda/       CUDA 编程、GPU 架构、算子、CUTLASS/CuTe
├── 02-lang/       C++、Python、Triton 与底层编程语言基础
├── 03-llm/        LLM 架构、训练、推理、量化、并行与评测
├── 03-multi/      多模态模型 Infra,含 ViT/CLIP/VAE/DiT/LDM
├── 04-comm/       通信后端、NCCL、集合通信与计算通信重叠
├── 05-framework/  PyTorch、vLLM、SGLang、Megatron、DeepSpeed
├── 06-agent/      Agent 框架与向量检索
├── 07-system/     CPU/GPU/NPU、内存系统、OS I/O、进程模型
├── 08-tools/      编译器、项目管理、第三方库与工程工具
├── 09-profile/    性能分析、调试、优化方法与评测工具
├── 010-dist/      分布式训练专题
├── 011-train/     训练算力、Scaling Law 与训练策略
├── concept/       pre-training / SFT / RL 等基础概念
├── cuda/          CUTLASS / CuTe 实践代码
└── dao/           算子开发范式与任务划分

核心主题

CUDA 与 GPU 编程

编程语言与 Kernel DSL

LLM 架构、训练与推理

多模态 Infra

通信、框架与系统


当前重点

近期新增和重点维护方向:

  • CUDA VMM、Pin Memory、Hopper Pipeline、Blackwell 架构
  • Triton Matmul、FlashAttention、Kernel Fusion
  • Chinchilla Scaling Law、训练算力与数据/参数配比
  • PyTorch compile/custom ops/memory/linear 源码链路
  • vLLM 架构、并行策略、显存管理、Sleep Mode
  • 多模态 DiT/LDM/ADM、DiT Cache、Text2X
  • FSDP、分布式转置、通信 overlap、NCCL 专题

待补主题见 TODO.md


维护约定

  • 根 README 保持为高层入口,不追求列出每个叶子目录。
  • 每个主题目录优先维护自己的 README,根 README 只链接稳定入口。
  • 新增目录时尽量保持路径命名一致,避免大小写混用和拼写漂移。
  • 示例代码、实验日志和图表应放在对应主题目录下,README 只保留结论、关键路径和复现实验入口。

最后更新:2026-05-15

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors