Skip to content

Latest commit

 

History

History
13 lines (8 loc) · 796 Bytes

File metadata and controls

13 lines (8 loc) · 796 Bytes

pytorch-image-captioning

Deep Learning Mini-Challenge 2 - Image Captioning

Kaggle-Notebook (only used for training): https://www.kaggle.com/simonstaehli/image-captioniong-flickr8k-pytorch

Vorgehen

  1. Zuerst müssen die trainierten Modelle heruntergeladen werden.
    • Die Links zu den Modellen können in den beiden Ordnern ./models/pretrained und ./models/fulltrained gefunden werden. Es sind jeweils zwei vortrainierte und zwei komplett neu trainierte Modelle
  2. Das Notebook kann gestartet werden. Im Chunk nach den Imports ist ein Flag download_custom_data = True (per default = True) mit welchem die Custom Daten und auch der Flickr8k Datensatz direkt heruntergeladen werden können. Dies beansprucht jedoch ein wenig Zeit.
  3. Das Notebook sollte danach ausführbar sein.