ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Вычисления на GPU 02 | Архитектура GPU, модель массового параллелизма | CS Space

Автор: Николай Полярный

Загружено: 2026-01-01

Просмотров: 325

Описание: 00:00 План лекции
02:26 Сравнение GPU и CPU
07:10 Как уместить много ядер в GPU, warp, 32 лилипута
08:20 Streaming Multiprocessor (SM)
09:37 У потоков warp единый Instruction Pointer
13:33 Проблема Code Divergence
16:42 CPU: Hyper Threading и SMT
18:55 GPU: SM клоун жонглирует warp-ами с лилипутами, скрывает Latency
26:05 Метрика Occupancy, Registers Pressure/Spilling
33:47 Количество warp-ов - на этапе компиляции, прекомпиляция шейдеров
36:02 Отбраковка чипов и сегментация рынка
37:40 GPU память: Coalesced Memory Access pattern
50:12 SIMT vs SIMD
51:53 Архитектура ЭВМ: CPU-RAM-PCIE-VRAM-GPU
55:26 Local/Shared Memory (L1 cache)
56:32 Итоги архитектуры GPU
58:34 Threadripper 7980X как пример проблемы масштабируемости
1:01:34 Вычисления массового параллелизма: WorkRange/Grid, WorkItem/Block, WorkGroup/Thread
1:06:53 Local Memory Barrier, Registers Shuffle, dFdx, dFdy
1:09:58 2D WorkRange/Grid
1:11:40 Профилирование и оптимизация, compute bound, memory bound, NVIDIA Nsight
1:20:00 CPU код на OpenMP
1:24:50 GPU код кернелов на OpenCL, CUDA, Vulkan (GLSL)
1:32:57 Сложение матриц, Coalesced Memory Access
1:36:26 Вопрос: нужно ли дожидаться завершения работы кернела чтобы получить результаты
1:37:07 Вопрос: что если рабочая задача сильно больше чем число потоков
1:38:23 Вопрос: параллельный запуск кернелов на одной видеокарте

Темы лекции:
Архитектура GPU (на контрасте с CPU)
Модель массового параллелизма
code divergence, coalesced memory access
latency hiding, occupancy, registers pressure/spilling
Speed of Light (SoL) анализ, профилировщики
Синтаксис кернелов на OpenCL, CUDA, Vulkan

Слайды - https://storage.yandexcloud.net/csspa...
Практические задания (задания можно выполнять на любом из трех API - CUDA, OpenCL или Vulkan) - https://github.com/GPGPUCourse/
Лектор - Полярный Николай Вадимович
Telegram канал - https://t.me/UnicornGlade
По вопросам сотрудничества/консультирования/проектной разработки/помощи с оптимизацией вашего кода/разработки алгоритмов (GPU, GPGPU, Computer Vision, Machine Learning) - [email protected] и TG@PolarNick239

Изначально лекция была записана и выложена на канале CS Space -    • Лекция 2 | Архитектура GPU, модель массово...  

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Вычисления на GPU 02 | Архитектура GPU, модель массового параллелизма | CS Space

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Вычисления на GPU 03 | Локальная память, суммирование массива | CS Space

Вычисления на GPU 03 | Локальная память, суммирование массива | CS Space

UC3842, косой мост и расширение прямого такта более 50%.

UC3842, косой мост и расширение прямого такта более 50%.

Denon DCD-1600NE: скрытые возможности DSD . обзор

Denon DCD-1600NE: скрытые возможности DSD . обзор

Производители ухудшают процессоры

Производители ухудшают процессоры

Вычисления на GPU 01 | Архитектура CPU, история GPU и GPGPU, введение в OpenCL API | CS Space

Вычисления на GPU 01 | Архитектура CPU, история GPU и GPGPU, введение в OpenCL API | CS Space

Вычисления на GPU 04 | Транспонирование и умножение матриц | CS Space

Вычисления на GPU 04 | Транспонирование и умножение матриц | CS Space

Как устроен PHP 🐘: фундаментальное знание для инженеров

Как устроен PHP 🐘: фундаментальное знание для инженеров

⚠️8 ОШИБОК ПРИ ВЫБОРЕ ВИДЕОКАРТЫ⚠️

⚠️8 ОШИБОК ПРИ ВЫБОРЕ ВИДЕОКАРТЫ⚠️

Дешёвый HEDT | Ryzen Threadripper 1920X в 2024 году

Дешёвый HEDT | Ryzen Threadripper 1920X в 2024 году

Боитесь программировать? Бойтесь. Но программируйте. Показываю, где и что • Offtopic • Live Stream

Боитесь программировать? Бойтесь. Но программируйте. Показываю, где и что • Offtopic • Live Stream

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Вычисления на GPU 06 | Bitonic sort, radix sort | CS Space

Вычисления на GPU 06 | Bitonic sort, radix sort | CS Space

САМАЯ ВЫГОДНАЯ ВИДЕОКАРТА 2025-2026

САМАЯ ВЫГОДНАЯ ВИДЕОКАРТА 2025-2026

Вычисления на GPU 05 | Префиксные суммы, scan, битовая арифметика | CS Space

Вычисления на GPU 05 | Префиксные суммы, scan, битовая арифметика | CS Space

Эти задачи не так просты! | LAPLAS

Эти задачи не так просты! | LAPLAS

Почему Азовское море — самое опасное в мире

Почему Азовское море — самое опасное в мире

UPGRADE RTX 2070 16GB!!!! Первая и Единственная ИГРОВАЯ карта Nvidia с 16gb видеопамяти

UPGRADE RTX 2070 16GB!!!! Первая и Единственная ИГРОВАЯ карта Nvidia с 16gb видеопамяти

Какие видеокарты покупать в конце 2025?

Какие видеокарты покупать в конце 2025?

Как применять нейронки в 2026. Андрей Себрант, Яндекс | подкаст

Как применять нейронки в 2026. Андрей Себрант, Яндекс | подкаст

Дефицит оперативной памяти! Почему наступил и как собрать ПК и не разориться?

Дефицит оперативной памяти! Почему наступил и как собрать ПК и не разориться?

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]