MiniGPT

MiniGPT目前已提供or已给出框架的部分内容如下列举。

数据预处理

首先进入数据目录:

cd data/

准备数据：我们在清华云盘准备了预训练数据，请根据作业要求预先下载。
数据预处理（需实现）：
```
python prepare.py [dataset_names] # tokenize
```
通过[dataset_names]指定若干个数据集，将他们统一处理为一份数据（包含训练集train.bin与验证集val.bin）。

模型训练

通过运行如下命令启动训练：

python train.py config/train_config.py --dataset=[dataset_name]

其中--dataset参数指定使用数据在data/下的二级目录名。

在训练过程中，会自动通过torch.save(checkpoint, os.path.join(out_dir, 'ckpt.pt'))保存训练过程中生成的模型

微调（在原有模型基础上继续训练），运行如下指令：

python train.py config/train_config.py --dataset=[dataset_name] --init_from=finetune --ckpt_dir=[/path/to/ckpt/dir]

其中--dataset参数指定使用数据在data/下的二级目录名, --ckpt_dir参数指定加载的训练模型目录位置

模型推理

通过运行如下命令加载训练完毕的模型权重进行推理：

python sample.py --out_dir=[/dir/to/training/output] --save_path=/path/to/save/output # or add prompts by --start=FILE:/path/to/prompts.txt

其中：

--out_dir参数指定使用的模型权重的目录（由模型训练过程生成）。
--save_path参数指定生成文本的保存路径，不设置则不保存仅打印。
--start参数可以设置指导模型生成的prompt。可以在prompts.txt文件中逐行给出输入的各个prompt

最终文件结构

.
├── README.md
├── arena.py
├── config
│   ├── sft_config.py
│   └── train_config.py
├── configurator.py
├── data
│   ├── download.sh
│   ├── merge.py
│   ├── prepare.py
│   ├── prepare.sh
│   ├── prepare_sft.py
│   ├── sft_data
│   │   ├── generate.py
│   │   └── generate.sh
│   ├── sft_data_aug
│   │   ├── gen.py
│   │   ├── gen1.py
│   │   ├── gen2.py
│   │   ├── gen3.py
│   │   └── json_to_qa.py
│   └── update.py
├── data_utils.py
├── evaluations.py
├── generate_answer.py
├── model.py
├── sample.py
├── sample_gradio.py
├── train.py
└── visualize.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MiniGPT

数据预处理

模型训练

模型推理

最终文件结构

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
config		config
data		data
report		report
.gitignore		.gitignore
README.md		README.md
Report.pdf		Report.pdf
arena.py		arena.py
configurator.py		configurator.py
data_utils.py		data_utils.py
evaluations.py		evaluations.py
generate_answer.py		generate_answer.py
model.py		model.py
report.pdf		report.pdf
sample.py		sample.py
sample_gradio.py		sample_gradio.py
train.py		train.py
visualize.py		visualize.py

Folders and files

Latest commit

History

Repository files navigation

MiniGPT

数据预处理

模型训练

模型推理

最终文件结构

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages