[Open DMQA Seminar] DINOv2, DINOv3: Self-supervised Vision Foundation Model
Автор: 김성범[ 교수 / 산업경영공학부 ]
Загружено: 2025-11-22
Просмотров: 1351
Описание:
DINO 시리즈는 자가 지도 학습(self-supervised learning)에 기반한 대표적인 vision transformer 계열 모델로, 레이블 없이도 강력한 시각 표현 학습 능력을 보여주며 다양한 비전 과제에서 활용되고 있다.
이번 세미나에서는 최신 논문인 DINOv3를 중심으로, 그 학습 전략과 구조적 개선점, 그리고 기존 DINO 및 DINOv2 대비 성능 향상 요인을 살펴보고자 한다.
또한, DINOv3의 주요 아이디어가 vision foundation model의 효율적 학습에 어떻게 기여하는지도 함께 소개하고자 한다.
참고자료:
[1] Caron, M., Touvron, H., Misra, I., Jégou, H., Mairal, J., Bojanowski, P., & Joulin, A. (2021). Emerging Properties in Self-Supervised Vision Transformers. Proceedings of ICCV 2021.
[2] Oquab, M., Darcet, T., Moutakanni, T., Vo, H., Szafraniec, M., Khalidov, V., … & Bojanowski, P. (2023). DINOv2: Learning Robust Visual Features without Supervision. arXiv preprint arXiv:2304.07193.
[3] Siméoni, O., Vo, H. V., Seitzer, M., Baldassarre, F., Oquab, M., … & Bojanowski, P. (2025). DINOv3. arXiv preprint arXiv:2508.10104.
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: