MPI Meets Machine Learning: Unlocking PyTorch distributed for scaling AI workloads - DevConf.IN 2026

Автор: DevConf

Загружено: 2026-02-18

Просмотров: 27

Описание: Title: MPI Meets Machine Learning: Unlocking PyTorch distributed for scaling AI workloads

Speaker(s): Mansi Agarwal

---

The world of High-Performance Computing (HPC) and modern deep learning share a core DNA: the demand for near-linear scaling across hundreds of nodes. The core challenges remain the same—managing communication, balancing load, and coordinating resources but the abstractions and tooling are now defined by PyTorch Distributed.

This talk bridges the gap between traditional HPC paradigms and PyTorch's distributed computing ecosystem, designed specifically for deep learning workloads. We'll explore how familiar HPC concepts like collective operations, point-to-point communication, and process groups, manifest in PyTorch's distributed APIs. We'll discover how PyTorch builds upon battle-tested communication backends (NCCL, Gloo, MPI) while introducing novel primitives optimized for gradient synchronization and model parallelism. We then move beyond basic data parallelism to explore advanced memory-saving techniques like Fully Sharded Data Parallel (FSDP), PyTorch's native answer to memory scaling and touch upon the nascent Tensor and Pipeline Parallelism APIs, demonstrating how these techniques compose to train massive models.

This session equips you with a comprehensive understanding of PyTorch's distributed architecture and reveals the inner workings of one of the most actively developed areas in modern ML infrastructure. By mapping distributed systems concepts to PyTorch's implementation, you'll see how familiar patterns from parallel computing manifest in PyTorch's ecosystem and where there is still room for innovation and improvement.

---

Full schedule, including slides and other resources:
https://pretalx.devconf.info/devconf-...

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

MPI Meets Machine Learning: Unlocking PyTorch distributed for scaling AI workloads - DevConf.IN 2026

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Scaling ML Pipelines with Feast, Ray and Kubeflow - DevConf.IN 2026

Scaling ML Pipelines with Feast, Ray and Kubeflow - DevConf.IN 2026

Vectorless RAG - Локальный финансовый RAG без векторной базы данных | Древовидное индексирование ...

Vectorless RAG - Локальный финансовый RAG без векторной базы данных | Древовидное индексирование ...

Квантование на границе: запуск модели размером 4 ГБ на 1 ГБ оперативной памяти - DevConf.IN 2026

Квантование на границе: запуск модели размером 4 ГБ на 1 ГБ оперативной памяти - DevConf.IN 2026

The Compute Revolution You’re Ignoring: JavaScript in Science- DevConf.IN 2026

The Compute Revolution You’re Ignoring: JavaScript in Science- DevConf.IN 2026

Как атаковать системы ИИ (и как им защищаться)!!!! - DevConf.IN 2026

Как атаковать системы ИИ (и как им защищаться)!!!! - DevConf.IN 2026

AI в обучении: тупой и ещё тупее?

AI в обучении: тупой и ещё тупее?

NotebookLM: 5 КЕЙСОВ, которые заменят вам целую команду (БЕСПЛАТНО)

NotebookLM: 5 КЕЙСОВ, которые заменят вам целую команду (БЕСПЛАТНО)

15B Активный MoE превосходит OPUS 4.6 по логическому мышлению

15B Активный MoE превосходит OPUS 4.6 по логическому мышлению

СМОТР ДОСТИЖЕНИЙ: что показали российские вендоры на организованном OCS форуме IT-Ось

СМОТР ДОСТИЖЕНИЙ: что показали российские вендоры на организованном OCS форуме IT-Ось

Традиционное машинное обучение мертво — суровая правда 😔

Традиционное машинное обучение мертво — суровая правда 😔

Автоматизация взлома оборудования с помощью кода Клода

Автоматизация взлома оборудования с помощью кода Клода

Лекция от легенды ИИ в Стэнфорде

Лекция от легенды ИИ в Стэнфорде

Запуск нейросетей локально. Генерируем - ВСЁ

Запуск нейросетей локально. Генерируем - ВСЁ

Как ответить на вопросы про Kafka на интервью? Полный разбор

Как ответить на вопросы про Kafka на интервью? Полный разбор

Новое обновление Perplexity вызывает тревогу.

Новое обновление Perplexity вызывает тревогу.

Кто пишет код лучше всех? Сравнил GPT‑5.2, Opus 4.5, Sonnet 4.5, Gemini 3, Qwen 3 Max, Kimi, GLM

Кто пишет код лучше всех? Сравнил GPT‑5.2, Opus 4.5, Sonnet 4.5, Gemini 3, Qwen 3 Max, Kimi, GLM

Лучший документальный фильм про создание ИИ

Лучший документальный фильм про создание ИИ

Превратите ЛЮБОЙ файл в знания LLM за СЕКУНДЫ

Превратите ЛЮБОЙ файл в знания LLM за СЕКУНДЫ

Ты ПЛАТИШЬ Яндексу 449₽ каждый месяц. За ЧТО?

Ты ПЛАТИШЬ Яндексу 449₽ каждый месяц. За ЧТО?

400 часов вайб-кодинга: всё, что нужно знать | Claude, GPT, агенты

400 часов вайб-кодинга: всё, что нужно знать | Claude, GPT, агенты