ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

PhD Defense (Public Session)

Автор: Steven Lyubomirsky

Загружено: 2022-04-20

Просмотров: 244

Описание: Video begins with an introduction by Prof. Zachary Tatlock. See https://homes.cs.washington.edu/~ssly... for the tablet that is referenced at several points.

Videos referenced in the intro:
DTR demo:    • ADA DTR Demo  
3LA demo:    • 3LA ADA Demo  

The presentation begins at 6:29.

Title: Compiler and Runtime Techniques for Optimizing Deep Learning Applications

Date: April 14, 2022

Adviser: Zachary Tatlock

Supervisory Committee: Zachary Tatlock (Chair), Duane Storti (GSR, Mechanical Engineering), Luis Ceze, Kevin Jamieson

Abstract: As the scaling and performance demands for deep learning systems have grown, system designers have struggled to incorporate innovations at opposite ends of the system stack: more varied and complex deep learning models and specialized hardware accelerators. New models that use data structures and dynamic control flow to address new learning problems cannot immediately benefit from previous system-level optimizations, which are defined over static dataflow graphs. Meanwhile, many novel hardware accelerators for accelerating common deep learning operations present unusual computing models and often require manual modification of applications to use, demanding expertise in both the deep learning domain and in hardware. The challenges in adding support for accelerators in existing compiler stacks slow development cycles and constrain deep learning systems' capabilities and efficiency.

Following earlier work on the Relay IR for the TVM framework, this dissertation demonstrates that system design problems in the deep learning domain can be approached by formalizing deep learning models as programs broadly (rather than assuming a more specific structure like a graph) and applying traditional compiler engineering techniques, simplifying various optimizations and transformations. In particular, this work addresses the use of runtime systems to support optimizations for dynamic deep learning models and on systematically supporting accelerators through the use of a formal software/hardware interface. Traditional deep learning model optimizations have been conceived as transformations on static dataflow graphs, but can be adapted to perform similar reasoning dynamically (and hence make no assumptions about control flow) by performing similar reasoning in a runtime system, guided by heuristics that depend on dynamically gathered information. This work details the specific example of Dynamic Tensor Rematerialization, which is an online approach to the problem of gradient checkpointing (recomputing intermediate activations instead of storing them to reduce the memory required for training) that achieves results comparable to optimal static techniques but generalizes to arbitrarily dynamic models. In addressing the problem of supporting accelerators in deep learning compiler stacks, this work demonstrates that a formal software/hardware interface enables traditional compiler techniques like instruction selection to be adapted for accelerators. Namely, this work presents a methodology for implementing a compiler stack with extensible support for accelerators that uses term rewriting to automatically discover opportunities to apply accelerator operations and lays the foundations for extending formal verification to entire compilation stacks with accelerator support.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
PhD Defense (Public Session)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

OpenClaw - полный разбор: Tools, Skills, Agents, Sub-agents

OpenClaw - полный разбор: Tools, Skills, Agents, Sub-agents

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Open Source Friday with Caracal - a runtime execution authority layer for AI agents in production

Open Source Friday with Caracal - a runtime execution authority layer for AI agents in production

Swiss tables в Go. Наиболее полный разбор внутреннего устройства новой мапы

Swiss tables в Go. Наиболее полный разбор внутреннего устройства новой мапы

Deep House Mix 2024 | Deep House, Vocal House, Nu Disco, Chillout Mix by Diamond #3

Deep House Mix 2024 | Deep House, Vocal House, Nu Disco, Chillout Mix by Diamond #3

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Успокаивающая музыка для нервов 🌿 лечебная музыка для сердца и сосудов, релакс, музыка для души #289

Успокаивающая музыка для нервов 🌿 лечебная музыка для сердца и сосудов, релакс, музыка для души #289

Cyber GEO: Трафик из Perplexity и ChatGPT в 2026 году

Cyber GEO: Трафик из Perplexity и ChatGPT в 2026 году

Музыка лечит сердце и сосуды🌸 Успокаивающая музыка восстанавливает нервную систему,расслабляющая

Музыка лечит сердце и сосуды🌸 Успокаивающая музыка восстанавливает нервную систему,расслабляющая

СЧЕТ ПОШЕЛ НА МЕСЯЦЫ: Хронология событий 2026–2030 для РФ и мира

СЧЕТ ПОШЕЛ НА МЕСЯЦЫ: Хронология событий 2026–2030 для РФ и мира

Вся IT-база в ОДНОМ видео: Память, Процессор, Код

Вся IT-база в ОДНОМ видео: Память, Процессор, Код

Лучший Гайд по Kafka для Начинающих За 1 Час

Лучший Гайд по Kafka для Начинающих За 1 Час

Как учить ребёнка математике – Алексей Савватеев | Лекции по математике

Как учить ребёнка математике – Алексей Савватеев | Лекции по математике

Что такое Rest API (http)? Soap? GraphQL? Websockets? RPC (gRPC, tRPC). Клиент - сервер. Вся теория

Что такое Rest API (http)? Soap? GraphQL? Websockets? RPC (gRPC, tRPC). Клиент - сервер. Вся теория

Музыка для работы - Deep Focus Mix для программирования, кодирования

Музыка для работы - Deep Focus Mix для программирования, кодирования

Лечебная Музыка для Снятия Стресса, Депресии, Усталости, Негатива, Детокс негативных эмоций

Лечебная Музыка для Снятия Стресса, Депресии, Усталости, Негатива, Детокс негативных эмоций

SHAZAM Top 50🏖️ Лучшая Музыка 2026 🏖️Зарубежные песни Хиты🏖️Популярные Песни Слушать Бесплатно #90

SHAZAM Top 50🏖️ Лучшая Музыка 2026 🏖️Зарубежные песни Хиты🏖️Популярные Песни Слушать Бесплатно #90

Feed Your OWN Documents to a Local Large Language Model!

Feed Your OWN Documents to a Local Large Language Model!

«Опять надули». Москва обижается, Telegram всё, Макрон против Трампа, цирк в ПАСЕ. Разбор новостей

«Опять надули». Москва обижается, Telegram всё, Макрон против Трампа, цирк в ПАСЕ. Разбор новостей

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]