[Neuriton] Buổi 18: VQ-VAE & Finite Scalar Quantization
Автор: Neuriton
Загружено: 2026-03-09
Просмотров: 135
Описание:
Neuriton tổ chức seminar với chủ đề Discrete Representation Learning, tập trung giới thiệu hai paper quan trọng trong lĩnh vực biểu diễn rời rạc: VQ-VAE (Vector Quantized Variational Autoencoder) và FSQ (Finite Scalar Quantization). Buổi seminar đi từ nền tảng lý thuyết của VQ-VAE — nơi mô hình sử dụng lượng tử hoá vector để học biểu diễn rời rạc và tránh hiện tượng posterior collapse — cho đến cách FSQ đơn giản hoá toàn bộ cơ chế lượng tử hoá bằng cách thay thế codebook learnable bằng một lưới giá trị hữu hạn theo từng chiều.
Trong phần trình bày về VQ-VAE, seminar giải thích cơ chế lượng tử hoá dựa trên nearest-neighbor trong embedding space, vai trò của commitment loss trong việc ổn định encoder, cũng như cách mô hình kết hợp với PixelCNN/WaveNet để sinh ảnh, âm thanh và video chất lượng cao. Tiếp đó, seminar làm rõ những hạn chế của VQ — như codebook collapse và việc phải dùng nhiều trick huấn luyện.
Ở phần FSQ, seminar giới thiệu cách paper mới đề xuất mã hoá rời rạc bằng phân rã từng chiều đơn giản, chỉ sử dụng round + bounding function. Điều này cho phép mô hình đạt hiệu năng cạnh tranh với VQ-VAE nhưng không cần codebook learnable, không cần commitment loss, không bị collapse, và vẫn tương thích với các pipeline như MaskGIT hay UViM. Buổi seminar cũng phân tích sự khác biệt giữa hai phương pháp, đặc biệt ở khả năng sử dụng codebook, độ ổn định và độ phức tạp huấn luyện.
Seminar được host bởi Neuriton Team. Team sẽ để link YouTube dưới phần comment.
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: