ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

ZeroSum: User Space Utility for Monitoring Process, Thread, OS and HW Resources

Автор: POP HPC

Загружено: 2025-03-28

Просмотров: 112

Описание: High Performance Computing (HPC) systems are large, heterogeneous, sophisticated – and are therefore so complicated that they are difficult to use efficiently. HPC users are allocated finite compute time on systems and yet have no portable utility to confirm that they are effectively utilizing the allocation at their disposal.

To address these problems, ZeroSum is a user space library that is launched within the process space of the HPC application. For each application process, it will monitor the application threads, MPI communication, and the hardware resources assigned to them – including CPU cores and/or hardware threads, memory usage and GPU utilization. Supported systems include Linux based operating systems, as well as GPUs from NVIDIA (using the NVML library), AMD (using the ROCm-SMI library) and Intel (using the SYCL API).

Host side monitoring utilizes the virtual /proc filesystem and therefore is portable to all Linux systems. When integrated with the hwloc library, visualizations of utilization data can be generated from included Python post-processing scripts. Automatic deadlock detection is available, and ZeroSum will generate call stacks from all ranks, merge them, and visualize the resulting merged call stacks to help diagnose where expected behavior diverged (similar to STAT/Cray-STAT). Monitoring overhead is less than 0.5%

About the Presenter

Kevin Huck is a Senior Research Associate in the Oregon Advanced Computing Institute for Science and Society (OACISS) at the University of Oregon. He is investigating the challenges of performance analysis of large HPC applications as well as automated methods for diagnosing and treating performance problems both offline and with runtime controls.

His MS and PhD degrees in Computer and Information Science are from the University of Oregon, USA, and his BS in Computer Science is from the University of Cincinnati, Ohio, USA.

Slides: https://pop-coe.eu/sites/default/file...
POP CoE: https://pop-coe.eu

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
ZeroSum: User Space Utility for Monitoring Process, Thread, OS and HW Resources

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Benchmarking of I/O Activities in HPC Applications with STrace Inspector

Benchmarking of I/O Activities in HPC Applications with STrace Inspector

Asynchronous GPU Programming in OpenMP

Asynchronous GPU Programming in OpenMP

Firewall : 15 - Destination NAT

Firewall : 15 - Destination NAT

The CARM Tool: Cache-aware Roofline Model for HPC

The CARM Tool: Cache-aware Roofline Model for HPC

How to Improve the Performance of Parallel Codes

How to Improve the Performance of Parallel Codes

GPU Series: Hands-On Session with NSight Systems and Compute

GPU Series: Hands-On Session with NSight Systems and Compute

Performance Analysis of OpenMP Target Offloading in Score-P

Performance Analysis of OpenMP Target Offloading in Score-P

ВСЕ ЧТО НУЖНО ЗНАТЬ ПРО LINUX

ВСЕ ЧТО НУЖНО ЗНАТЬ ПРО LINUX

Шилка — почему СССР выбрал малый калибр и не пожалел об этом

Шилка — почему СССР выбрал малый калибр и не пожалел об этом

Я полностью перешел на Linux и больше НИКОГДА не установлю Windows

Я полностью перешел на Linux и больше НИКОГДА не установлю Windows

Конденсатор и частота среза

Конденсатор и частота среза

ШУЛЬМАН: новая мобилизация, уход Путина, смута. Чебурнет. Большое интервью / МОЖЕМ ОБЪЯСНИТЬ

ШУЛЬМАН: новая мобилизация, уход Путина, смута. Чебурнет. Большое интервью / МОЖЕМ ОБЪЯСНИТЬ

Учащимся об информатике и компьютерах, 1988

Учащимся об информатике и компьютерах, 1988

Электричество НЕ течёт по проводам — тревожное открытие Ричарда Фейнмана

Электричество НЕ течёт по проводам — тревожное открытие Ричарда Фейнмана

.kkrieger - Инженерное Безумие Размером 96KB

.kkrieger - Инженерное Безумие Размером 96KB

КАК УСТРОЕН TCP/IP?

КАК УСТРОЕН TCP/IP?

Kubernetes — Простым Языком на Понятном Примере

Kubernetes — Простым Языком на Понятном Примере

Кто переживет войну в Иране?

Кто переживет войну в Иране?

Билл Гейтс В ЯРОСТИ: Lenovo заменяет Windows на Linux!

Билл Гейтс В ЯРОСТИ: Lenovo заменяет Windows на Linux!

Вся IT-база в ОДНОМ видео: Память, Процессор, Код

Вся IT-база в ОДНОМ видео: Память, Процессор, Код

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]