maocheng23

maocheng23

Achievements

Megatron-LM Megatron-LM Public

Forked from NVIDIA/Megatron-LM

Ongoing research training transformer models at scale

Python
sglang sglang Public

Forked from sgl-project/sglang

SGLang is a fast serving framework for large language models and vision language models.

Python
THUDM/slime THUDM/slime Public

slime is an LLM post-training framework for RL Scaling.

Python 5.6k 774
radixark/miles radixark/miles Public

Miles is an enterprise-facing reinforcement learning framework for LLM and VLM post-training, forked from and co-evolving with slime.

Python 1.2k 183