你好,请问InternViT-6B能否作为纯视觉检测模型的backbone,自己加检测头去训练,跟多模态比有优势吗
你好,请问InternViT-6B能否作为纯视觉检测模型的backbone,自己加检测头去训练,跟多模态比有优势吗