Why and how to run NVIDIA NIM on Amazon EKS

Автор: AWS Events

Загружено: 2024-10-15

Просмотров: 1496

Описание: Discover how to efficiently deploy and scale large language models like Llama3/Mistral7b on Kubernetes using NVIDIA Inference Microservices (NIM) on Amazon EKS. This video guides you through:

• Setting up GPU-ready EKS clusters
• Scaling with Kubernetes
• Leveraging NVIDIA's NIM Helm chart
• Real-time benchmarking with GenAIPerf
• Monitoring costs and performance

Perfect for ML engineers and cloud architects looking to optimize their AI infrastructure on AWS. Watch our live demo and gain practical insights for cost-effective LLM deployment in production!

Follow AWS OnAir:
LinkedIn: https://bit.ly/AWSOnAir-LinkedIn
Twitch: https://bit.ly/Twitch-AWS-OnAir

ABOUT AWS
Amazon Web Services (AWS) hosts events, both online and in-person, bringing the cloud computing community together to connect, collaborate, and learn from AWS experts. AWS is the world’s most comprehensive and broadly adopted cloud platform, offering over 200 fully featured services from data centers globally. Millions of customers—including the fastest-growing startups, largest enterprises, and leading government agencies—are using AWS to lower costs, become more agile, and innovate faster.

#AWS #AWSpartner #nvidia #AI #NIM

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Why and how to run NVIDIA NIM on Amazon EKS

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

The Internet Was Weeks Away From Disaster and No One Knew

The Internet Was Weeks Away From Disaster and No One Knew

Kubernetes — Простым Языком на Понятном Примере

Kubernetes — Простым Языком на Понятном Примере

NVIDIA AI Enterprise и NIM

NVIDIA AI Enterprise и NIM

Optimize drug discovery with Rescale with AWS and NVIDIA | AWS OnAir S05

Optimize drug discovery with Rescale with AWS and NVIDIA | AWS OnAir S05

Сбой в работе AWS вызван ошибкой ИИ.

Сбой в работе AWS вызван ошибкой ИИ.

Explain How Kubernetes Works With GPU Like I’m 5 - Carlos Santana, AWS

Explain How Kubernetes Works With GPU Like I’m 5 - Carlos Santana, AWS

Control Agent-to-Tool Interactions with Policy in Amazon Bedrock AgentCore | AWS Show and Tell

Control Agent-to-Tool Interactions with Policy in Amazon Bedrock AgentCore | AWS Show and Tell

Intro to NVIDIA NIM for AI Builders

Intro to NVIDIA NIM for AI Builders

Прекратите использовать S3. Вместо этого используйте программное обеспечение с открытым исходным ...

Прекратите использовать S3. Вместо этого используйте программное обеспечение с открытым исходным ...

A conversation with NVIDIA’s Jensen Huang

A conversation with NVIDIA’s Jensen Huang

Deploying and Scaling AI Applications with the NVIDIA TensorRT Inference Server on Kubernetes

Deploying and Scaling AI Applications with the NVIDIA TensorRT Inference Server on Kubernetes

Идентификация Pod EKS против IRSA | Безопасное подключение Pod Kubernetes к сервисам AWS

Идентификация Pod EKS против IRSA | Безопасное подключение Pod Kubernetes к сервисам AWS

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

AWS On Air ft. NVIDIA Omniverse Replicator

AWS On Air ft. NVIDIA Omniverse Replicator

Что такое Rest API (http)? Soap? GraphQL? Websockets? RPC (gRPC, tRPC). Клиент - сервер. Вся теория

Что такое Rest API (http)? Soap? GraphQL? Websockets? RPC (gRPC, tRPC). Клиент - сервер. Вся теория

Как ответить на вопросы про Kafka на интервью? Полный разбор

Как ответить на вопросы про Kafka на интервью? Полный разбор

Fine-Tune Llama 3.1 and Deploy Using NVIDIA NIM Directly From Your Laptop

Fine-Tune Llama 3.1 and Deploy Using NVIDIA NIM Directly From Your Laptop

Масштабирование рабочих нагрузок ИИ с помощью Kubernetes: совместное использование ресурсов графи...

Масштабирование рабочих нагрузок ИИ с помощью Kubernetes: совместное использование ресурсов графи...

Kubernetes Karpenter Vs AWS EKS Auto

Kubernetes Karpenter Vs AWS EKS Auto

GPUs in Kubernetes for AI Workloads

GPUs in Kubernetes for AI Workloads