Skip to content

Sunhaiy/llm

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 

Repository files navigation

LLM From Scratch

一个用 PyTorch 从零手搓的字符级 Transformer / MiniGPT 项目,用来理解大模型的核心原理。

Python PyTorch Model Built

项目简介

这个项目不依赖现成的大模型封装,而是直接从底层把一个最小可运行的语言模型流程搭出来,包括:

  • input.txt 读取训练语料
  • 构建字符级词表
  • 手写 encode / decode
  • 实现 Self-Attention、多头注意力、前馈网络和 Transformer Block
  • 训练 MiniGPTLanguageModel
  • 在命令行里进行文本生成

当前配置

项目 配置
框架 PyTorch
词表方式 字符级
batch_size 16
block_size 32
n_embd 128
n_head 8
n_layer 6
优化器 AdamW
训练轮次 5000

项目结构

llm/
├── haiy.py
├── input.txt
├── README.md
└── .gitignore

运行方式

安装依赖:

pip install torch

运行项目:

python haiy.py

输入 quit 可以退出交互。

仓库描述

A hand-built character-level Transformer / MiniGPT project in PyTorch, created to understand large language models from scratch.

Tags

llm, transformer, pytorch, gpt, language-model, nlp, from-scratch, educational

About

PyTorch 从零手搓的字符级 Transformer / MiniGPT 项目,用来理解大模型的核心原理

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages