LLM Inference Explained: Costs and ROI | Shamsher Ansari * Malthi

Автор: Product Talk with Malthi

Загружено: 2025-09-26

Просмотров: 178

Описание: LLM inference is where AI products truly come alive — but also where costs can spiral. This talk breaks down the essentials for Product Managers:

What drives inference costs,

how to think about ROI, and

practical ways to ensure your AI product remains scalable and profitable.

About Speaker

Shamsher Ansari is a Group Product Manager at NeevCloud, leading product strategy for India’s GPU-Powered AI Supercloud. He drives initiatives in AI infrastructure, making large-scale GPU compute accessible, efficient, and developer-friendly. With over a decade of experience in cloud, AI infra, and edge computing, he has built products that balance performance with cost efficiency.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

LLM Inference Explained: Costs and ROI | Shamsher Ansari * Malthi

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Understanding the LLM Inference Workload - Mark Moyou, NVIDIA

Understanding the LLM Inference Workload - Mark Moyou, NVIDIA

ROZBRAJANIE POLSKI ZA EURO? Miliardy z SAFE nie dla wojska, a dla wybranych firm. To sabotaż?

ROZBRAJANIE POLSKI ZA EURO? Miliardy z SAFE nie dla wojska, a dla wybranych firm. To sabotaż?

ВВЕДЕНИЕ В IOT- ЧАСТЬ I

ВВЕДЕНИЕ В IOT- ЧАСТЬ I

Understanding LLM Inference | NVIDIA Experts Deconstruct How AI Works

Understanding LLM Inference | NVIDIA Experts Deconstruct How AI Works

Не создавайте агентов, а развивайте навыки – Барри Чжан и Махеш Мураг, Anthropic

Не создавайте агентов, а развивайте навыки – Барри Чжан и Махеш Мураг, Anthropic

LLM inference optimization: Architecture, KV cache and Flash attention

LLM inference optimization: Architecture, KV cache and Flash attention

Разбор различий между управлением ИИ и управлением данными | Джин Арнольд

Разбор различий между управлением ИИ и управлением данными | Джин Арнольд

OpenClaw Creator: Почему 80% приложений исчезнут

OpenClaw Creator: Почему 80% приложений исчезнут

Современные проблемы системного администратора | MFA, облака, обновления и умные устройства

Современные проблемы системного администратора | MFA, облака, обновления и умные устройства

Unpacking AI Voice Agents

Unpacking AI Voice Agents

How to Build AI Products by Microsoft Group Product Manager

How to Build AI Products by Microsoft Group Product Manager

Чад и Конрад | Встроенная онтология

Чад и Конрад | Встроенная онтология

Сверхпроводимость — горячая тема. Физик Сергей Мухин. Три Сигмы #14

Сверхпроводимость — горячая тема. Физик Сергей Мухин. Три Сигмы #14

Новые функции NotebookLM просто невероятны.

Новые функции NotebookLM просто невероятны.

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Claude Code: полный гайд по AI-кодингу (хаки, техники и секреты)

Claude Code: полный гайд по AI-кодингу (хаки, техники и секреты)

Создайте ИИ-агента, который поможет ВАМ найти работу.

Создайте ИИ-агента, который поможет ВАМ найти работу.

Локальная установка и тестирование DeepSeek OCR 2

Локальная установка и тестирование DeepSeek OCR 2

Something big is happening...

Something big is happening...

Правда об ИИ в SOC: от усталости от оповещения до технологий обнаружения

Правда об ИИ в SOC: от усталости от оповещения до технологий обнаружения