Deep Autoencoding Gaussian Mixture Model for Image Anomaly Detection

This repository extends the ICLR’18 DAGMM architecture to the image domain, exploring both standard convolutional and residual-convolutional variants. We demonstrate significant AUROC and precision/recall improvements over a naïve flattened-vector baseline.

Please find attached the slides to the presentation/submission.

🔧 Requirements & Setup

Python: 3.10
Install dependencies:
```
pip install -r requirements.txt
```

📂 Repository Structure

.
├── data/                 # (optional) place your image datasets here
├── models/               # saved model checkpoints
├── notebooks/            # exploratory analysis and plotting
├── trials/               # training logs & inference outputs
├── src/                  # core implementation of Convolutional DAGMM
│   ├── compression_net.py
│   ├── estimation_net.py
│   ├── train.py
│   └── infer.py
├── requirements.txt
└── README.md

All training and inference logs, as well as evaluation outputs (scores, ROC curves), are dumped into the trials/ folder for easy inspection.

Results

Dataset	Architecture	Precision	Recall	AUROC
Forest vs Non-forest	Conv-DAGMM	0.75	0.70	0.87
Forest vs Non-forest	Residual-DAGMM	0.60	0.60	0.82
BrokenBottle vs GoodBottle	Conv-DAGMM	0.65	0.60	0.70
BrokenBottle vs GoodBottle	Residual-DAGMM	0.60	0.55	0.71

Datasets used: Intel Image Classification Dataset and MVTec AD

What’s Inside

Convolutional DAGMM (Framework 1): A straightforward CNN-based encoder + GMM estimation network.
Residual-Convolutional DAGMM (Framework 2): Adds skip connections in the compression network for richer feature extraction.
Loss & EM Updates: Follows the original DAGMM’s energy-based sample scoring and EM update rules.

Observations

The flattened-vector baseline (64×64 → 4096) yielded very poor AUROC and precision/recall.
Both convolutional variants significantly outperform the flat baseline—see the “Results” table for details.

Future Work

Extend to multimodal (audio + image) anomaly detection.
Experiment with alternative architectures (GAN-based compression, feature-discrepancy methods).
Tune hyperparameters and explore larger image resolutions.

Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
Appropriate_dagmm		Appropriate_dagmm
Arrhythmia		Arrhythmia
Audio		Audio
audio_dagmm		audio_dagmm
cnn_dagmm		cnn_dagmm
cnn_dagmm_residual		cnn_dagmm_residual
papers		papers
rough_dagmm		rough_dagmm
slides		slides
trials		trials
.gitignore		.gitignore
README.md		README.md
image_start_.png		image_start_.png
kddcup-replicate.ipynb		kddcup-replicate.ipynb
makingdataset.ipynb		makingdataset.ipynb
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Deep Autoencoding Gaussian Mixture Model for Image Anomaly Detection

🔧 Requirements & Setup

📂 Repository Structure

Results

What’s Inside

Observations

Future Work

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Deep Autoencoding Gaussian Mixture Model for Image Anomaly Detection

🔧 Requirements & Setup

📂 Repository Structure

Results

What’s Inside

Observations

Future Work

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages