distributed-bert-fine-tuning PyTorch Distributed Data Parallel を使用して、Azure Machine Learning のコンピューティングクラスター (マルチノード/シングル GPU) 環境で BERT を fine-tuning するサンプルコード