ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

FASTER Inference with Torch TensorRT Deep Learning for Beginners - CPU vs CUDA

Автор: Python Simplified

Загружено: 2022-02-20

Просмотров: 45439

Описание: Hi everyone! 😀 In the last video we've seen how to accelerate the speed of our programs with Pytorch and CUDA - today we will take it another step further with Torch-TensorRT!
We will focus on a Machine Learning process called Inference (which is when the model is trained, perfected and ready to make a prediction).
For this we will load a state-of-the-art artificial neural network and we will use it to classify a picture of my cat! 🙀🙀🙀
Specifically - we will borrow ResNet50 for our little Pytorch experiment! 😉
We will also run a speed test comparing Pytorch models running on CPU, on CUDA and on Torch-TensorRT - which of these do you think is faster??

⏲️ TIMESTAMPS ⏲️
-----------------------------------
00:00 - intro
01:05 - clone Torch-TensorRT
01:40 - install and setup Docker
03:52 - install Nvidia Container Toolkit & Nvidia Docker 2
05:02 - Torch-TensorRT container (option #1)
07:22 - Torch-TensorRT Nvidia NGC container (option #2)
09:00 - import Pytorch
09:16 - load ResNet50
10:25 - load sample image
11:45 - sample image transforms
14:48 - batch size
16:19 - prediction with ResNet50
17:12 - softmax function
18:07 - ImageNet class number to name mapping
20:10 - predict top 5 classes of sample image (topk)
23:33 - speed test benchmark function
27:33 - CPU benchmarks
28:13 - CUDA benchmarks
30:09 - trace model
31:20 - convert traced model into a Torch-TensorRT model
33:02 - TensorRT benchmarks
34:32 - download Jupyter Notebook
34:50 - HOW DID I MISS THIS???
35:31 - thanks for watching!

🛑 REFERENCED TUTORIALS 🛑
----------------------------------------------------------------------
⭐ CUDA Parallel Computing for beginners:
   • CUDA Simply Explained - GPU vs CPU Paralle...  
⭐ Neural Networks for beginners:
   • Neural Network Simply Explained - Deep Lea...  
⭐ Machine Learning Databases:
   • ML Datasets and How to Access them with Py...  
⭐ Gradient Descent:
   • Gradient Descent - Simply Explained! ML fo...  

⭐ INSTALLATION LINKS AND BASH COMMANDS ⭐
--------------------------------------------------------------------------------------
1. Clone Torch-TensorRT and change directory:
$ git clone https://github.com/NVIDIA/Torch-TensorRT
$ cd Torch-TensorRT

2. Docker installation guide:
https://docs.nvidia.com/datacenter/cl...

$ curl https://get.docker.com | sh \ && sudo systemctl --now enable docker
$ sudo groupadd docker
$ sudo usermod -aG docker $USER
$ newgrp docker
$ docker run hello-world

3. Nvidia Docker 2 installation:

$ distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \ && curl -s -L https://nvidia.github.io/nvidia-docke... | sudo apt-key add - \ && curl -s -L https://nvidia.github.io/nvidia-docke... er.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
$ sudo apt-get update
$ sudo apt-get install -y nvidia-docker2
$ sudo systemctl restart docker
$ sudo docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi

4. Official Torch TensorRT Container:

$ docker build -t torch_tensorrt -f ./docker/Dockerfile .
$ docker run --gpus=all --rm -it -v $PWD:/Torch-TensorRT --net=host --ipc=host --ulimit memlock=-1 --ulimit stack=67108864 torch_tensorrt:latest bash
$ cd /Torch-TensorRT/notebooks
$ jupyter notebook --allow-root --ip 0.0.0.0 --port 8888

5. Nvidia NGC Container (alternative to 4):
https://catalog.ngc.nvidia.com/orgs/n...

$ docker pull nvcr.io/nvidia/pytorch:21.12-py3
$ docker run --net=host --gpus all -it --rm -v local_dir:/container_dir nvcr.io/nvidia/pytorch:21.12-py3
$ jupyter notebook --allow-root --ip 0.0.0.0 --port 8888

6. My cats picture:
https://github.com/MariyaSha/Inferenc...

7. Transforms Normalize - Pytorch Documentation:
https://pytorch.org/vision/stable/tra...

8. ImageNet class to name mapping:
https://github.com/pytorch/hub/blob/m...

9. Complete Notebook on Github:
https://github.com/MariyaSha/Inferenc...

---------------------------------------------------------------------------
💗 THANK YOU SO MUCH FOR WATCHING! 💗

Sound effect by: https://www.zapsplat.com
Icons by: https://www.flaticon.com/
Resnet50 image by: https://commons.wikimedia.org/wiki/Fi...

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
FASTER Inference with Torch TensorRT Deep Learning for Beginners - CPU vs CUDA

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Much Faster Pandas with cuDF GPU Processing - CPU vs GPU Speed Benchmarks

Much Faster Pandas with cuDF GPU Processing - CPU vs GPU Speed Benchmarks

Нейронные сети: быстрый инференс на GPU с помощью TensorRT / Дмитрий Коробченко (NVIDIA)

Нейронные сети: быстрый инференс на GPU с помощью TensorRT / Дмитрий Коробченко (NVIDIA)

CUDA Simply Explained - GPU vs CPU Parallel Computing for Beginners

CUDA Simply Explained - GPU vs CPU Parallel Computing for Beginners

Ultimate Guide to Datetime! Python date and time objects for beginners

Ultimate Guide to Datetime! Python date and time objects for beginners

From model weights to API endpoint with TensorRT LLM: Philip Kiely and Pankaj Gupta

From model weights to API endpoint with TensorRT LLM: Philip Kiely and Pankaj Gupta

Шестопалов Егор - Как мы сервинг на Triton переводили

Шестопалов Егор - Как мы сервинг на Triton переводили

Создайте настоящую модель машинного обучения, которая предсказывает чаевые таксистам с помощью XG...

Создайте настоящую модель машинного обучения, которая предсказывает чаевые таксистам с помощью XG...

If __name__ ==

If __name__ == "__main__" for Python Developers

Understanding LLM Inference | NVIDIA Experts Deconstruct How AI Works

Understanding LLM Inference | NVIDIA Experts Deconstruct How AI Works

NumPy Operations - Ultimate Guide to Methods and Functions for Beginners!

NumPy Operations - Ultimate Guide to Methods and Functions for Beginners!

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Docker: простое объяснение с помощью проекта машинного обучения для начинающих

Docker: простое объяснение с помощью проекта машинного обучения для начинающих

Музыка для работы - Deep Focus Mix для программирования, кодирования

Музыка для работы - Deep Focus Mix для программирования, кодирования

Inference Optimization with NVIDIA TensorRT

Inference Optimization with NVIDIA TensorRT

Boost Deep Learning Inference Performance with TensorRT | Step-by-Step

Boost Deep Learning Inference Performance with TensorRT | Step-by-Step

Roadmap Вайбкодера 2026 - с Нуля до Релиза

Roadmap Вайбкодера 2026 - с Нуля до Релиза

Прекратите делиться ключами API с магистрами права — используйте вместо этого каталог Docker MCP! 🤖💡

Прекратите делиться ключами API с магистрами права — используйте вместо этого каталог Docker MCP! 🤖💡

Let's build GPT: from scratch, in code, spelled out.

Let's build GPT: from scratch, in code, spelled out.

SHAZAM Top 50🏖️ Лучшая Музыка 2026 🏖️Зарубежные песни Хиты🏖️Популярные Песни Слушать Бесплатно #90

SHAZAM Top 50🏖️ Лучшая Музыка 2026 🏖️Зарубежные песни Хиты🏖️Популярные Песни Слушать Бесплатно #90

Learn PyTorch for deep learning in a day. Literally.

Learn PyTorch for deep learning in a day. Literally.

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]