Вычисления на GPU 02 | Архитектура GPU, модель массового параллелизма | CS Space

Автор: Николай Полярный

Загружено: 2026-01-01

Просмотров: 325

Описание: 00:00 План лекции
02:26 Сравнение GPU и CPU
07:10 Как уместить много ядер в GPU, warp, 32 лилипута
08:20 Streaming Multiprocessor (SM)
09:37 У потоков warp единый Instruction Pointer
13:33 Проблема Code Divergence
16:42 CPU: Hyper Threading и SMT
18:55 GPU: SM клоун жонглирует warp-ами с лилипутами, скрывает Latency
26:05 Метрика Occupancy, Registers Pressure/Spilling
33:47 Количество warp-ов - на этапе компиляции, прекомпиляция шейдеров
36:02 Отбраковка чипов и сегментация рынка
37:40 GPU память: Coalesced Memory Access pattern
50:12 SIMT vs SIMD
51:53 Архитектура ЭВМ: CPU-RAM-PCIE-VRAM-GPU
55:26 Local/Shared Memory (L1 cache)
56:32 Итоги архитектуры GPU
58:34 Threadripper 7980X как пример проблемы масштабируемости
1:01:34 Вычисления массового параллелизма: WorkRange/Grid, WorkItem/Block, WorkGroup/Thread
1:06:53 Local Memory Barrier, Registers Shuffle, dFdx, dFdy
1:09:58 2D WorkRange/Grid
1:11:40 Профилирование и оптимизация, compute bound, memory bound, NVIDIA Nsight
1:20:00 CPU код на OpenMP
1:24:50 GPU код кернелов на OpenCL, CUDA, Vulkan (GLSL)
1:32:57 Сложение матриц, Coalesced Memory Access
1:36:26 Вопрос: нужно ли дожидаться завершения работы кернела чтобы получить результаты
1:37:07 Вопрос: что если рабочая задача сильно больше чем число потоков
1:38:23 Вопрос: параллельный запуск кернелов на одной видеокарте

Темы лекции:
Архитектура GPU (на контрасте с CPU)
Модель массового параллелизма
code divergence, coalesced memory access
latency hiding, occupancy, registers pressure/spilling
Speed of Light (SoL) анализ, профилировщики
Синтаксис кернелов на OpenCL, CUDA, Vulkan

Слайды - https://storage.yandexcloud.net/csspa...
Практические задания (задания можно выполнять на любом из трех API - CUDA, OpenCL или Vulkan) - https://github.com/GPGPUCourse/
Лектор - Полярный Николай Вадимович
Telegram канал - https://t.me/UnicornGlade
По вопросам сотрудничества/консультирования/проектной разработки/помощи с оптимизацией вашего кода/разработки алгоритмов (GPU, GPGPU, Computer Vision, Machine Learning) - [email protected] и TG@PolarNick239

Изначально лекция была записана и выложена на канале CS Space - • Лекция 2 | Архитектура GPU, модель массово...

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Вычисления на GPU 02 | Архитектура GPU, модель массового параллелизма | CS Space

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Вычисления на GPU 03 | Локальная память, суммирование массива | CS Space

Вычисления на GPU 03 | Локальная память, суммирование массива | CS Space

UC3842, косой мост и расширение прямого такта более 50%.

UC3842, косой мост и расширение прямого такта более 50%.

Denon DCD-1600NE: скрытые возможности DSD . обзор

Denon DCD-1600NE: скрытые возможности DSD . обзор

Производители ухудшают процессоры

Производители ухудшают процессоры

Вычисления на GPU 01 | Архитектура CPU, история GPU и GPGPU, введение в OpenCL API | CS Space

Вычисления на GPU 01 | Архитектура CPU, история GPU и GPGPU, введение в OpenCL API | CS Space

Вычисления на GPU 04 | Транспонирование и умножение матриц | CS Space

Вычисления на GPU 04 | Транспонирование и умножение матриц | CS Space

Как устроен PHP 🐘: фундаментальное знание для инженеров

Как устроен PHP 🐘: фундаментальное знание для инженеров

⚠️8 ОШИБОК ПРИ ВЫБОРЕ ВИДЕОКАРТЫ⚠️

⚠️8 ОШИБОК ПРИ ВЫБОРЕ ВИДЕОКАРТЫ⚠️

Дешёвый HEDT | Ryzen Threadripper 1920X в 2024 году

Дешёвый HEDT | Ryzen Threadripper 1920X в 2024 году

Боитесь программировать? Бойтесь. Но программируйте. Показываю, где и что • Offtopic • Live Stream

Боитесь программировать? Бойтесь. Но программируйте. Показываю, где и что • Offtopic • Live Stream

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Вычисления на GPU 06 | Bitonic sort, radix sort | CS Space

Вычисления на GPU 06 | Bitonic sort, radix sort | CS Space

САМАЯ ВЫГОДНАЯ ВИДЕОКАРТА 2025-2026

САМАЯ ВЫГОДНАЯ ВИДЕОКАРТА 2025-2026

Вычисления на GPU 05 | Префиксные суммы, scan, битовая арифметика | CS Space

Вычисления на GPU 05 | Префиксные суммы, scan, битовая арифметика | CS Space

Эти задачи не так просты! | LAPLAS

Эти задачи не так просты! | LAPLAS

Почему Азовское море — самое опасное в мире

Почему Азовское море — самое опасное в мире

UPGRADE RTX 2070 16GB!!!! Первая и Единственная ИГРОВАЯ карта Nvidia с 16gb видеопамяти

UPGRADE RTX 2070 16GB!!!! Первая и Единственная ИГРОВАЯ карта Nvidia с 16gb видеопамяти

Какие видеокарты покупать в конце 2025?

Какие видеокарты покупать в конце 2025?

Как применять нейронки в 2026. Андрей Себрант, Яндекс | подкаст

Как применять нейронки в 2026. Андрей Себрант, Яндекс | подкаст

Дефицит оперативной памяти! Почему наступил и как собрать ПК и не разориться?

Дефицит оперативной памяти! Почему наступил и как собрать ПК и не разориться?