ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Computer Vision Meetup: MARLIN: Masked Autoencoder for facial video Representation LearnINg

Автор: Voxel51

Загружено: 2023-07-20

Просмотров: 483

Описание: This talk proposes a self-supervised approach to learn universal facial representations from videos, that can transfer across a variety of facial analysis tasks such as Facial Attribute Recognition (FAR), Facial Expression Recognition (FER), DeepFake Detection (DFD), and Lip Synchronization (LS). Our proposed framework, named MARLIN, is a facial video masked autoencoder, that learns highly robust and generic facial embeddings from abundantly available non-annotated web crawled facial videos. As a challenging auxiliary task, MARLIN reconstructs the spatio-temporal details of the face from the densely masked facial regions which mainly include eyes, nose, mouth, lips, and skin to capture local and global aspects that in turn help in encoding generic and transferable features. Through a variety of experiments on diverse downstream tasks, we demonstrate MARLIN to be an excellent facial video encoder as well as feature extractor, that performs consistently well across a variety of downstream tasks including FAR (1.13% gain over supervised benchmark), FER (2.64% gain over unsupervised benchmark), DFD (1.86% gain over unsupervised benchmark), LS (29.36% gain for Frechet Inception Distance), and even in low data regime.

Speaker: Zhixi Cai, PhD Student Monash University

Scroll down on this page and join the Computer Vision Meetup friendliest to your timezone:

https://www.meetup.com/pro/computer-v...

Recorded on July 20, 2023 at the virtual Computer Vision Meetup.

#vectorsearch #computervision #machinelearning #datascience #ai

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Computer Vision Meetup: MARLIN: Masked Autoencoder for facial video Representation LearnINg

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Computer Vision Meetup: How to Build Scalable Image and Text Search Using Pinecone & Qdrant

Computer Vision Meetup: How to Build Scalable Image and Text Search Using Pinecone & Qdrant

Computer Vision Meetup: Retail Supply Chain Computer Vision Apps

Computer Vision Meetup: Retail Supply Chain Computer Vision Apps

Почему даже противники Путина критикуют этот фильм?

Почему даже противники Путина критикуют этот фильм?

SŁAWOMIR CENCKIEWICZ I JACEK PRUSINOWSKI: ŚLEDZTWO WS. CZUCHNOWSKIEGO, ANEKS DO RAPORTU WSI

SŁAWOMIR CENCKIEWICZ I JACEK PRUSINOWSKI: ŚLEDZTWO WS. CZUCHNOWSKIEGO, ANEKS DO RAPORTU WSI

Bridging Algorithms and Hardware: Towards Resource-Efficient Machine Learning (Part 2)

Bridging Algorithms and Hardware: Towards Resource-Efficient Machine Learning (Part 2)

Transforming Business with Agentic AI

Transforming Business with Agentic AI

Семинар по конвейерам компьютерного зрения на платформе Vibe Coding — 18 марта 2026 г.

Семинар по конвейерам компьютерного зрения на платформе Vibe Coding — 18 марта 2026 г.

Почему важно ботать ГЕОМЕТРИЮ для ЕГЭ 2026? Основная ТЕОРИЯ и решение задачи!

Почему важно ботать ГЕОМЕТРИЮ для ЕГЭ 2026? Основная ТЕОРИЯ и решение задачи!

Securing the Autonomous Future: The Intersection of Agentic AI, Connected Devices & Cyber Resilience

Securing the Autonomous Future: The Intersection of Agentic AI, Connected Devices & Cyber Resilience

Платошкин: Лукашенко одним из первых пригласил иранского посла! // Трамп готов остановиться?

Платошкин: Лукашенко одним из первых пригласил иранского посла! // Трамп готов остановиться?

Фермеров штрафуют за протесты. Z-блогер призвал судить Путина. Израиль убил министра спецслужб Ирана

Фермеров штрафуют за протесты. Z-блогер призвал судить Путина. Израиль убил министра спецслужб Ирана

Debugging the Future: Strategies Validating World Models and Action-Conditioned Video

Debugging the Future: Strategies Validating World Models and Action-Conditioned Video

Навыки как документация

Навыки как документация

Discovering & Analysing Systematic Weaknesses in DNNs on Data Subsets (Trustworthy AI Part 2)

Discovering & Analysing Systematic Weaknesses in DNNs on Data Subsets (Trustworthy AI Part 2)

Towards Deterministic Networking for Real Time Mission Critic - by Professor Tianyu Zhang

Towards Deterministic Networking for Real Time Mission Critic - by Professor Tianyu Zhang

VLA Models and the New Robotics

VLA Models and the New Robotics

Plugins as Products: Bringing Visual AI Research into Real-World Workflows with FiftyOne

Plugins as Products: Bringing Visual AI Research into Real-World Workflows with FiftyOne

Концерт органной музыки I Шедевры классической музыки

Концерт органной музыки I Шедевры классической музыки

From Volume to Value: Rethinking Data for AI in Health | Teresa Wu

From Volume to Value: Rethinking Data for AI in Health | Teresa Wu

Агенты создают агентов на платформе Hugging Face Hub.

Агенты создают агентов на платформе Hugging Face Hub.

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]