ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Monarch Mixer: Making Foundation Models More Efficient - Dan Fu | Stanford MLSys #86

Автор: Stanford MLSys Seminars

Загружено: 2023-12-04

Просмотров: 4827

Описание: Episode 86 of the Stanford MLSys Seminar Series!

Monarch Mixer: Making Foundation Models More Efficient
Speaker: Dan Fu

Abstract:
Machine learning models are increasingly being scaled in both sequence length and model dimension to reach longer contexts and better performance. However, existing architectures like Transformers scale quadratically along both these axes. In this talk I'll discuss Monarch Mixer (M2), a new architecture that uses the same sub-quadratic primitive along both sequence length and model dimension. M2 mixes information along the sequence and model dimensions using Monarch matrices, a simple class of expressive structured matrices that captures many linear transforms, achieves high hardware efficiency on GPUs, and scales sub-quadratically.

Bio:
Dan Fu is a PhD student in the Computer Science Department at Stanford University, where he is co-advised by Christopher Ré and Kayvon Fatahalian. His research is at the intersection of systems and machine learning and focuses on developing algorithms and architectures to make machine learning more efficient.

Monarch Mixer arXiv: https://arxiv.org/abs/2310.12109
FlashFFTConv arXiv: https://arxiv.org/abs/2311.05908

--

Stanford MLSys Seminar hosts: Simran Arora, Dan Fu

Twitter:
  / simran_s_arora  
  / realdanfu​  

--

Check out our website for the schedule: http://mlsys.stanford.edu
Join our mailing list to get weekly updates: https://groups.google.com/forum/#!for...

#machinelearning #ai #artificialintelligence #systems #mlsys #computerscience #stanford

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Monarch Mixer: Making Foundation Models More Efficient - Dan Fu | Stanford MLSys #86

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Hardware-aware Algorithms for Sequence Modeling - Tri Dao | Stanford MLSys #87

Hardware-aware Algorithms for Sequence Modeling - Tri Dao | Stanford MLSys #87

Новогодний разворот! Встречаем 2026 с Алексеем Венедиктовым*, Алексеем Ракшой* и Игорем Липсицем*

Новогодний разворот! Встречаем 2026 с Алексеем Венедиктовым*, Алексеем Ракшой* и Игорем Липсицем*

EVO: DNA Foundation Models - Eric Nguyen | Stanford MLSys #96

EVO: DNA Foundation Models - Eric Nguyen | Stanford MLSys #96

Что происходит с нейросетью во время обучения?

Что происходит с нейросетью во время обучения?

Notes on AI Hardware - Benjamin Spector | Stanford MLSys #88

Notes on AI Hardware - Benjamin Spector | Stanford MLSys #88

Следующий 100x — Гэвин Уберти | Stanford MLSys #92

Следующий 100x — Гэвин Уберти | Stanford MLSys #92

4 Hours Chopin for Studying, Concentration & Relaxation

4 Hours Chopin for Studying, Concentration & Relaxation

Democratizing Foundation Models via k-bit Quantization - Tim Dettmers | Stanford MLSys #82

Democratizing Foundation Models via k-bit Quantization - Tim Dettmers | Stanford MLSys #82

EI Seminar - Danny Driess  - Have Large Models Changed Robotics?

EI Seminar - Danny Driess - Have Large Models Changed Robotics?

Теорема Байеса, геометрия изменения убеждений

Теорема Байеса, геометрия изменения убеждений

Как тонкая настройка программ LLM с открытым исходным кодом решает проблему внедрения GenAI в про...

Как тонкая настройка программ LLM с открытым исходным кодом решает проблему внедрения GenAI в про...

Управление поведением LLM без тонкой настройки

Управление поведением LLM без тонкой настройки

Online A/B Testing of Real-Time Event Detection Systems - David Tagliamonti | Stanford MLSys #93

Online A/B Testing of Real-Time Event Detection Systems - David Tagliamonti | Stanford MLSys #93

Text2SQL: The Dream versus Reality - Laurel Orr | Stanford MLSys #89

Text2SQL: The Dream versus Reality - Laurel Orr | Stanford MLSys #89

Градиентный спуск, как обучаются нейросети | Глава 2, Глубинное обучение

Градиентный спуск, как обучаются нейросети | Глава 2, Глубинное обучение

Teaching LLMs to Use Tools at Scale - Shishir Patil | Stanford MLSys #98

Teaching LLMs to Use Tools at Scale - Shishir Patil | Stanford MLSys #98

Causal Mechanistic Interpretability (Stanford lecture 1) - Atticus Geiger

Causal Mechanistic Interpretability (Stanford lecture 1) - Atticus Geiger

Как ИИ открыл более быстрый алгоритм умножения матриц

Как ИИ открыл более быстрый алгоритм умножения матриц

Stanford CS230 | Autumn 2025 | Lecture 9: Career Advice in AI

Stanford CS230 | Autumn 2025 | Lecture 9: Career Advice in AI

Доступное Введение в Машинное Обучение

Доступное Введение в Машинное Обучение

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]