ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Mathieu Lobet - Feedback and Results for Porting Smilei on the Fujitsu A64FX Processor - AHUG SC21

Автор: ARM HPC User Group

Загружено: 2021-11-17

Просмотров: 105

Описание: Title: Feedback and Results for Porting the Particle-In-Cell code Smilei on the Fujitsu A64FX processor

Abstract: In this presentation, we would like to present the porting and optimization work done in the scientific code Smilei to improve the performance on the Fujitsu A64FX processor. Smilei is a parallel and open-source particle-in-cell code dedicated to the study of laser-matter interaction, particle acceleration, strong-field physics and astrophysical plasma scientific domains. The code is written in classical C++ (inheritance and basic templating) and does not use modern feature or advanced abstracted programming model.

A few years ago, we obtained an efficient vectorization by rewriting and optimizing the main time-consuming operators to take advantage of the AVX512 instruction set on Intel processors. Although most of our vectorized algorithms should similarly work with the ARM SVE vector instructions, first performance studies without code adaptation have shown many vectorization issues and poor performance on A64FX. This presentation aims at presenting in pedagogic way the different issues we had and the simple adaptations made in Smilei focusing on vectorized algorithm efficiency including branching, unrolling, inlining, loop fission and more. The performance on A64FX has been studied using 3 different compilers: Fujitsu, GNU and ARM. The comparison has been made with an Intel Skylake, an Intel Cascade Lake and an AMD Rome processor using the Intel compiler. Currently, the ARM compiler provides the best vectorization efficiency with runtimes comparable to Skylake.

Speaker Bio: Dr. Lobet received his PhD in 2015 at CEA and Bordeaux University in France on the numerical study of extreme-intensity laser-matter interaction. After his PhD, he moved to HPC by joining the NERSC team at LBNL as a postdoc. During this period, he mainly worked on various optimization, parallelization and vectorization methods for particle-in-cell codes. In 2017, he joined the Maison de la Simulation team as a CEA research engineer. Since then, he has participated in various HPC research projects including the Energy Oriented Center of Excellence European project. His research topics are CPU and GPU programming, task-based programming methods and core-level optimization.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Mathieu Lobet - Feedback and Results for Porting Smilei on the Fujitsu A64FX Processor - AHUG SC21

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

RuQing Xu  - BLIS & TBLIS on SVE and Apple AMX - AHUG SC21

RuQing Xu - BLIS & TBLIS on SVE and Apple AMX - AHUG SC21

Как происходит модернизация остаточных соединений [mHC]

Как происходит модернизация остаточных соединений [mHC]

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

SprintML Tech Talk about CoDeC: Detecting Data Contamination in LLMs via In-Context Learning

SprintML Tech Talk about CoDeC: Detecting Data Contamination in LLMs via In-Context Learning

Почему работает теория шести рукопожатий? [Veritasium]

Почему работает теория шести рукопожатий? [Veritasium]

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

What we learned from the 3-body problem

What we learned from the 3-body problem

Как работала машина

Как работала машина "Энигма"?

Пожалуй, главное заблуждение об электричестве [Veritasium]

Пожалуй, главное заблуждение об электричестве [Veritasium]

Понимание GD&T

Понимание GD&T

Интервью С.Лаврова турецким СМИ (телеканалу «ТГРТ» и газете «Тюркие»), Москва, 29 января 2026 года

Интервью С.Лаврова турецким СМИ (телеканалу «ТГРТ» и газете «Тюркие»), Москва, 29 января 2026 года

Краткое объяснение больших языковых моделей

Краткое объяснение больших языковых моделей

Как сжимаются изображения? [46 МБ ↘↘ 4,07 МБ] JPEG в деталях

Как сжимаются изображения? [46 МБ ↘↘ 4,07 МБ] JPEG в деталях

The Hairy Ball Theorem

The Hairy Ball Theorem

Возможно ли создать компьютеры с техпроцессом меньше 1 нм

Возможно ли создать компьютеры с техпроцессом меньше 1 нм

Что происходит с нейросетью во время обучения?

Что происходит с нейросетью во время обучения?

То, что они только что построили, — нереально

То, что они только что построили, — нереально

Hatem Ltaief - Leveraging Low-Rank Matrix Approximations for HPC on Fujitsu A64FX - AHUG SC21

Hatem Ltaief - Leveraging Low-Rank Matrix Approximations for HPC on Fujitsu A64FX - AHUG SC21

Теорема Байеса, геометрия изменения убеждений

Теорема Байеса, геометрия изменения убеждений

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]