ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Interview with NVIDIA Dynamo Architect Kyle Kranen

Автор: NVIDIA Developer

Загружено: 2025-03-18

Просмотров: 8387

Описание: In this episode, Nader and Carter interview NVIDIA Dynamo architect Kyle Kranen to learn about what Dynamo is and how it can make models like DeepSeek-R1 increase throughput by up to 30x!

You have 3 levers when running inference on AI models: quality, cost, speed.

For example: reasoning models like DeepSeek-R1 do test-time scaling, where asking the model to think improves quality but reduces speed and increases costs.

We dive into how NVIDIA Dynamo gives you the ability to tweak all 3 levers through techniques like disaggregation, kv offloading, and kv routing.

Read: https://developer.nvidia.com/blog/int...

Follow Kyle ➡️   / kyle-kranen  
Follow Carter ➡️   / carter-abdallah-958666140  
Follow Nader ➡️   / naderlikeladder  

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Interview with NVIDIA Dynamo Architect Kyle Kranen

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Inference Office Hours with SGLang: Performance Optimizations for LLM Serving

Inference Office Hours with SGLang: Performance Optimizations for LLM Serving

Beyond the Algorithm with NVIDIA:  Introducing NVIDIA Dynamo

Beyond the Algorithm with NVIDIA: Introducing NVIDIA Dynamo

AI WORKSHOP FOR TJIBARIA AND TEAM

AI WORKSHOP FOR TJIBARIA AND TEAM

A New Era for Generalist Robotics: The Rise of Humanoids | NVIDIA GTC 2025

A New Era for Generalist Robotics: The Rise of Humanoids | NVIDIA GTC 2025

Interview with NVIDIA CUDA Architect Stephen Jones

Interview with NVIDIA CUDA Architect Stephen Jones

NVIDIA Dynamo: High performance Open Source Interface | William Arnold | AER Labs

NVIDIA Dynamo: High performance Open Source Interface | William Arnold | AER Labs

Alexandr Wang: Building Scale AI, Transforming Work With Agents & Competing With China

Alexandr Wang: Building Scale AI, Transforming Work With Agents & Competing With China

NVIDIA CEO Jensen Huang's Vision for the Future

NVIDIA CEO Jensen Huang's Vision for the Future

CUDA: New Features and Beyond | NVIDIA GTC 2024

CUDA: New Features and Beyond | NVIDIA GTC 2024

NVIDIA Dynamo Developer Office Hours

NVIDIA Dynamo Developer Office Hours

Дороничев: ИИ — пузырь, который скоро ЛОПНЕТ. Какие перемены ждут мир?

Дороничев: ИИ — пузырь, который скоро ЛОПНЕТ. Какие перемены ждут мир?

American Conversations: Education Policy with Josh Cowen

American Conversations: Education Policy with Josh Cowen

Frontiers of AI and Computing: A Conversation With Yann LeCun and Bill Dally | NVIDIA GTC 2025

Frontiers of AI and Computing: A Conversation With Yann LeCun and Bill Dally | NVIDIA GTC 2025

Освоение оптимизации вывода LLM: от теории до экономически эффективного внедрения: Марк Мойу

Освоение оптимизации вывода LLM: от теории до экономически эффективного внедрения: Марк Мойу

Andrej Karpathy: Software Is Changing (Again)

Andrej Karpathy: Software Is Changing (Again)

Multi-GPU Communication Libraries for Scaling HPC and AI Workloads | NVIDIA GTC 2025

Multi-GPU Communication Libraries for Scaling HPC and AI Workloads | NVIDIA GTC 2025

DGX Spark Live: Powering Higher Education and Research

DGX Spark Live: Powering Higher Education and Research

CUDA: New Features and Beyond | NVIDIA GTC 2025

CUDA: New Features and Beyond | NVIDIA GTC 2025

IRAN MINUJE ORMUZ, STATKI SIĘ PALĄ, SENATOR USA “ROZWAŻAMY INWAZJĘ LĄDOWĄ”, ROPA PO 200 USD/BARYŁKĘ

IRAN MINUJE ORMUZ, STATKI SIĘ PALĄ, SENATOR USA “ROZWAŻAMY INWAZJĘ LĄDOWĄ”, ROPA PO 200 USD/BARYŁKĘ

Getting Started with CUDA and Parallel Programming | NVIDIA GTC 2025 Session

Getting Started with CUDA and Parallel Programming | NVIDIA GTC 2025 Session

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]