- This post is all you need(①多头注意力机制原理)
- This post is all you need(②位置编码与编码解码过程)
- This post is all you need(③网络结构与自注意力实现)
- This post is all you need(④Transformer的实现过程)
- This post is all you need(⑤基于Transformer的翻译模型)
- This post is all you need(⑥基于Transformer的分类模型)
- This post is all you need(⑦基于Transformer的对联模型)
- This post is all you need(层层剥开Transformer)
- BERT原理与NSP和MLM
- 从零实现BERT网络模型
- 基于BERT预训练模型的中文文本分类任务 代码
- 基于BERT预训练模型的英文文本蕴含任务 代码
- 基于BERT预训练模型的英文多选项(SWAG)任务
- 基于BERT预训练模型的英文问答(SQuAD)任务
- 基于NSL和MLM任务从头训练BERT任务