ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

GPU Programming for Beginners | ROCm + AMD Setup to Edge Detection

Автор: DigitalOcean

Загружено: 2026-02-23

Просмотров: 329

Описание: In this hands-on tutorial, we demystify how GPUs compute and show you how to write your own GPU programs from scratch. Understanding GPU programming is essential for anyone looking to grasp why AI models depend on this specialized hardware.

We'll use ROCm and HIP (AMD's version of CUDA) to take you from zero to running real GPU code, culminating in a computer vision edge detector that processes images in parallel.

You can find the code in the project repository:
https://github.com/oconnoob/intro_to_...

👇 WHAT YOU'LL LEARN IN THIS VIDEO 👇

🔧 Getting Set Up with ROCm Two ways to get started: spin up a GPU Droplet on DigitalOcean with ROCm pre-installed, or install ROCm yourself on an Ubuntu system with an AMD GPU. We cover both methods step-by-step.

➕ Example 1: Vector Addition (The Basics) Learn the fundamental structure of GPU programs—kernels, threads, blocks, and memory management. We'll add one million elements in parallel and verify our results.

⚡ Example 2: Matrix Multiplication (Why Libraries Matter) Discover why optimized libraries like rocBLAS dramatically outperform naive implementations. This is the operation powering most AI models you use daily.

👁️ Example 3: Edge Detection with Sobel Filter (The Cool Stuff) Apply your GPU programming skills to a real computer vision problem—detecting edges in images using a classic Sobel filter, all running massively parallel on the GPU.

Whether you're an AI enthusiast wanting to understand the hardware layer or a developer looking to harness GPU compute power, this tutorial gives you the foundation to start writing efficient parallel programs.

🚀 Join DigitalOcean:
https://cloud.digitalocean.com/regist...

// STAY CONNECTED
🌏 Follow our blog for the latest updates: https://www.digitalocean.com/blog
🦈 Join our Developer Community on Discord:   / discord  
🐥 Follow us on X/Twitter: https://x.com/digitalocean
👩‍💻 We're Hiring! See open roles: http://grnh.se/aicoph1

------------------

TIMESTAMPS
0:00 Introduction
0:33 Setting up your GPU
0:54 Method 1: GPU Droplet
2:32 Method 2: Installing ROCm from scratch
3:50 Writing your first GPU program
4:24 Understanding GPU kernels
4:52 Writing the main program
5:40 How to allocate and fill GPU memory
6:30 Kernel launch and synchronization
7:47 Compiling and running the GPU Program
8:13 Example 2: Matrix multiplication
12:52 Final example: Image convolution and edge detection
14:04 Understanding the Sobel filter
15:43 Results

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
GPU Programming for Beginners | ROCm + AMD Setup to Edge Detection

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Building the PERFECT Linux PC with Linus Torvalds

Building the PERFECT Linux PC with Linus Torvalds

Надоели файлы? Вот, пожалуйста, сокеты • C • Live coding

Надоели файлы? Вот, пожалуйста, сокеты • C • Live coding

Batch Computing: Working with the Linux Scheduler

Batch Computing: Working with the Linux Scheduler

Same 128GB but cheaper

Same 128GB but cheaper

The World's Most Important Machine

The World's Most Important Machine

TerraMaster F4-425 Plus. Гибридный NAS (HDD+NVMe) на Intel N150

TerraMaster F4-425 Plus. Гибридный NAS (HDD+NVMe) на Intel N150

Я создал свою первую мини-лабораторию! Docker Swarm | Dell 7070 | Ubuntu Server

Я создал свою первую мини-лабораторию! Docker Swarm | Dell 7070 | Ubuntu Server

How Modern Game Engines Degraded — And Who’s to Blame?

How Modern Game Engines Degraded — And Who’s to Blame?

Автоматизация взлома оборудования с помощью кода Клода

Автоматизация взлома оборудования с помощью кода Клода

Дорогая RTX 5090 для LLM? НЕТ. Используйте это вместо неё. (SXM2 + Z8 G4, #RACERRRZ)

Дорогая RTX 5090 для LLM? НЕТ. Используйте это вместо неё. (SXM2 + Z8 G4, #RACERRRZ)

Идём из кода прямо в Интернет • C • Live coding

Идём из кода прямо в Интернет • C • Live coding

NanoPI R3S обзор и настройка - OpenWRT: Zapret, Zapret2, YoutubeUnblock, Podkop

NanoPI R3S обзор и настройка - OpenWRT: Zapret, Zapret2, YoutubeUnblock, Podkop

Что НАСА обнаружило на Ио

Что НАСА обнаружило на Ио

История C# и TypeScript с Андерсом Хейлсбергом | GitHub

История C# и TypeScript с Андерсом Хейлсбергом | GitHub

Навыки антигравитации дают вам несправедливое преимущество.

Навыки антигравитации дают вам несправедливое преимущество.

NVIDIA didn't want me to do this

NVIDIA didn't want me to do this

Получайте доступ к своим файлам, где бы вы ни находились — идеальная конфигурация Raspberry Pi 5.

Получайте доступ к своим файлам, где бы вы ни находились — идеальная конфигурация Raspberry Pi 5.

32-битная запись с плавающей запятой (технически) — ложь: объяснение видеотехнологий

32-битная запись с плавающей запятой (технически) — ложь: объяснение видеотехнологий

Как загружается Linux

Как загружается Linux

Your Local LLM Is 3x Slower Than It Should Be

Your Local LLM Is 3x Slower Than It Should Be

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]