Rayan Saab, Quantization for Compressing Neural Networks: Theory and (New) Algorithms, 2025.10.14

Автор: CodEx Seminar

Загружено: 2026-01-24

Просмотров: 27

Описание: Speaker: Rayan Saab (University of California San Diego)
Title: Quantization for Compressing Neural Networks: Theory and (New) Algorithms
Date: 2025.10.14

Abstract:
Quantization compresses neural networks by representing weights and activations with few bits, reducing memory, computation time, and energy while preserving inference accuracy. However, the underlying optimization problems are NP-hard in general. So, one must settle for computationally efficient approximate solutions, ideally ones with theoretical error guarantees.

We analyze OPTQ, a widely used quantization algorithm in the literature. We provide new theory: an error-evolution identity, layerwise error bounds, and theoretical justification for heuristics used in practice, including for feature ordering, regularization, and alphabet size. We further study a stochastic variant that yields entrywise control on the error. With these results in hand we introduce Qronos, a new related algorithm that first corrects errors resulting from previous layers, and thus attains stronger guarantees . We conclude with numerical results on modern language models.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Rayan Saab, Quantization for Compressing Neural Networks: Theory and (New) Algorithms, 2025.10.14

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Kathlén Kohn, Algebraic NN theory: neuromanifolds and how geometry effects learning, 2025.10.28

Kathlén Kohn, Algebraic NN theory: neuromanifolds and how geometry effects learning, 2025.10.28

Simone Brugiapaglia, From compression to depth: generative compressive sensing 2026.02.17

Simone Brugiapaglia, From compression to depth: generative compressive sensing 2026.02.17

Alex Cloninger, From Local to Global Embeddings: Methods in Bottom-up Manifold Learning, 2026.01.20

Alex Cloninger, From Local to Global Embeddings: Methods in Bottom-up Manifold Learning, 2026.01.20

Dune: Part Three | Official Teaser Trailer

Dune: Part Three | Official Teaser Trailer

Что скрывает дно океана? Существа, о которых мы НИЧЕГО не знаем. Александр Осадчиев

Что скрывает дно океана? Существа, о которых мы НИЧЕГО не знаем. Александр Осадчиев

Nested Learning: The Illusion of Deep Learning Architecture (Ali Behrouz)

Nested Learning: The Illusion of Deep Learning Architecture (Ali Behrouz)

Diuna: Część trzecia - Oficjalny zwiastun #1 PL

Diuna: Część trzecia - Oficjalny zwiastun #1 PL

Массовый забой скота. Протестам в России быть? Зачем Трампу Иран. Максим Шевченко: Особое мнение

Массовый забой скота. Протестам в России быть? Зачем Трампу Иран. Максим Шевченко: Особое мнение

Как заговорить на любом языке? Главная ошибка 99% людей в изучении. Полиглот Дмитрий Петров.

Как заговорить на любом языке? Главная ошибка 99% людей в изучении. Полиглот Дмитрий Петров.

Как война в Иране превращается в Мировой экономический кризис? Каринэ Геворгян

Как война в Иране превращается в Мировой экономический кризис? Каринэ Геворгян

"Иран готов выдержать года 2 МИНИМУМ!" // Война на Ближнем Востоке: Ормузский пролив, нефть и доллар

Czy to początek końca polskiego biznesu? Bartoszewicz I Gac

Czy to początek końca polskiego biznesu? Bartoszewicz I Gac

КВН 2026 Высшая лига Первая 1/8

КВН 2026 Высшая лига Первая 1/8

Janda wraca! Polexit czy Tuskexit? Sikorski - kłamać aż ludzie uwierzą | Codziennie Burza

Janda wraca! Polexit czy Tuskexit? Sikorski - kłamać aż ludzie uwierzą | Codziennie Burza

Ben Adcock, Deep learning for inverse problems: confident hallucinations and new theory 2026.02.03

Ben Adcock, Deep learning for inverse problems: confident hallucinations and new theory 2026.02.03

Jose Israel Rodriguez, Activation Degree Thresholds / Expressiveness of Polynomial NNs, 2025.10.07

Jose Israel Rodriguez, Activation Degree Thresholds / Expressiveness of Polynomial NNs, 2025.10.07

Турция. Россия из параллельной вселенной

Турция. Россия из параллельной вселенной

WINA POLAKÓW. NIEMCY WYMYŚLAJĄ HISTORIĘ NA NOWO

WINA POLAKÓW. NIEMCY WYMYŚLAJĄ HISTORIĘ NA NOWO

Nick Trefethen, Analytic Continuation and the One-Wavelength Principle, 2025.09.16

Nick Trefethen, Analytic Continuation and the One-Wavelength Principle, 2025.09.16

Konstytucjonalista UPOKORZYŁ ŻURKA. Minister pokazał całkowitą NIEUDOLNOŚĆ

Konstytucjonalista UPOKORZYŁ ŻURKA. Minister pokazał całkowitą NIEUDOLNOŚĆ