O Depth Anything é treinado de forma conjunta em 1,5 milhões de imagens rotuladas e mais de 62 milhões de imagens não rotuladas, fornecendo os modelos fundamentais de Estimação de Profundidade Monocular (EPM) mais capazes, com as seguintes características:
- Estimação de profundidade relativa sem necessidade de ajustes, superior ao MiDaS v3.1 (BEiTL-512).
- Estimação de profundidade métrica sem necessidade de ajustes, superior ao ZoeDepth.
- Ajuste fino e avaliação ótimos no domínio em NYUv2 e KITTI.
Esse modelo também apresenta um aprimoramento no ControlNet condicionado à profundidade melhorado baseado em nosso Depth Anything.
- Link do Artigo: Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data.
@inproceedings{depthanything,
title={Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data},
author={Yang, Lihe and Kang, Bingyi and Huang, Zilong and Xu, Xiaogang and Feng, Jiashi and Zhao, Hengshuang},
booktitle={CVPR},
year={2024}
}





