[Open DMQA Seminar] DINOv2, DINOv3: Self-supervised Vision Foundation Model

Автор: ‍김성범[ 교수 / 산업경영공학부 ]

Загружено: 2025-11-22

Просмотров: 1351

Описание: DINO 시리즈는 자가 지도 학습(self-supervised learning)에 기반한 대표적인 vision transformer 계열 모델로, 레이블 없이도 강력한 시각 표현 학습 능력을 보여주며 다양한 비전 과제에서 활용되고 있다.
이번 세미나에서는 최신 논문인 DINOv3를 중심으로, 그 학습 전략과 구조적 개선점, 그리고 기존 DINO 및 DINOv2 대비 성능 향상 요인을 살펴보고자 한다.
또한, DINOv3의 주요 아이디어가 vision foundation model의 효율적 학습에 어떻게 기여하는지도 함께 소개하고자 한다.

참고자료:
[1] Caron, M., Touvron, H., Misra, I., Jégou, H., Mairal, J., Bojanowski, P., & Joulin, A. (2021). Emerging Properties in Self-Supervised Vision Transformers. Proceedings of ICCV 2021.
[2] Oquab, M., Darcet, T., Moutakanni, T., Vo, H., Szafraniec, M., Khalidov, V., … & Bojanowski, P. (2023). DINOv2: Learning Robust Visual Features without Supervision. arXiv preprint arXiv:2304.07193.
[3] Siméoni, O., Vo, H. V., Seitzer, M., Baldassarre, F., Oquab, M., … & Bojanowski, P. (2025). DINOv3. arXiv preprint arXiv:2508.10104.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

[Open DMQA Seminar] DINOv2, DINOv3: Self-supervised Vision Foundation Model

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

DINOv2 Explained: Visual Model Insights & Comprehensive Code Guide

DINOv2 Explained: Visual Model Insights & Comprehensive Code Guide

봐도 봐도 모르겠는 '양자컴퓨터'의 모든 것 l KBS 다큐 인사이트 - 퀀텀: 두 번째 불의 발견, 양자컴퓨터 25.06.12 방송

봐도 봐도 모르겠는 '양자컴퓨터'의 모든 것 l KBS 다큐 인사이트 - 퀀텀: 두 번째 불의 발견, 양자컴퓨터 25.06.12 방송

[DMQA Open Seminar] Autoregressive Models in Vision (From Next-Token to Next-Scale Prediction)

[DMQA Open Seminar] Autoregressive Models in Vision (From Next-Token to Next-Scale Prediction)

System Design Concepts Course and Interview Prep

System Design Concepts Course and Interview Prep

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

[Open DMQA Seminar] Sight Range Dilemma in Multi Agent Reinforcement Learning

[Open DMQA Seminar] Sight Range Dilemma in Multi Agent Reinforcement Learning

Лучший документальный фильм про создание ИИ

Лучший документальный фильм про создание ИИ

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

[DMQA Open Seminar] Weakly Supervised Semantic Segmentation

[DMQA Open Seminar] Weakly Supervised Semantic Segmentation

[Open DMQA Seminar] Unsupervised Domain Generalization

[Open DMQA Seminar] Unsupervised Domain Generalization

‘나는 왜 AI를 써도 좋은 보고서가 안 나올까?’ (김덕중 Firb AI연구소장)

‘나는 왜 AI를 써도 좋은 보고서가 안 나올까?’ (김덕중 Firb AI연구소장)

Представляем DINOv3: самообучение для обработки изображений в беспрецедентном масштабе.

Представляем DINOv3: самообучение для обработки изображений в беспрецедентном масштабе.

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Как создаются степени магистра права?

Как создаются степени магистра права?

Дарио Амодеи — «Мы близки к концу экспоненты»

Дарио Амодеи — «Мы близки к концу экспоненты»

Stanford CS229 I Machine Learning I Building Large Language Models (LLMs)

Stanford CS229 I Machine Learning I Building Large Language Models (LLMs)

Лекция от легенды ИИ в Стэнфорде

Лекция от легенды ИИ в Стэнфорде

[Open DMQA Seminar] Reinforcement Learning with Human Feedback-PbRL 4

[Open DMQA Seminar] Reinforcement Learning with Human Feedback-PbRL 4

Дорожная карта по изучению ИИ (начало)

Дорожная карта по изучению ИИ (начало)

Introductioin to PINN (Physics-Informed Neural Network)

Introductioin to PINN (Physics-Informed Neural Network)