ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

AI Capacity Planning at Scale: Meta's Strategy | WEKA

Автор: WEKA

Загружено: 2026-02-09

Просмотров: 89

Описание: How does Meta balance rapid AI innovation with long hardware procurement cycles?
Elisa Chen, Data Scientist on Meta's AI Infrastructure team, sits down with WEKA's Chief AI Officer Val Bercovici to discuss the critical challenges of AI capacity planning at hyperscale.
In this fireside chat from AI Infra Summit 2025, Elisa reveals the gap between AI model iteration cycles—which can happen monthly or even weekly—and hardware procurement timelines that can take months to complete. Meta's approach focuses on three key levers: elastic resource allocation through GPU-as-a-service, efficiency optimization by matching specific hardware to workloads (H100s for foundation model training vs. A100s for fine-tuning), and dynamic quota allocation across teams to maximize utilization.

Chapters:
00:00 - What is the gap between AI innovation and hardware procurement?
01:17 - How do you predict future AI capacity needs?
03:02 - What are the levers you can use for immediate capacity needs?
05:07 - How does GPU elasticity differ from CPU cloud elasticity?
06:43 - How does user metadata inform capacity planning, including in specific regions?
08:43 - What alternative energy sources are emerging for data centers?

👉 Learn how the global memory shortage exacerbates already lengthy hardware procurement timelines: https://www.weka.io/blog/ai-ml/the-me...

What is the biggest challenge in AI capacity planning?
Organizations struggle without proper data foundations, telemetry, and instrumentation to measure capacity ROI. Elisa and Val explore hardware-workload matching, disaggregated prefill and decode architectures, and why 95% GPU utilization remains an aspirational target for most companies.

👉 Learn why storage architecture is the new bottleneck impacting scale and capacity: https://www.weka.io/blog/ai-ml/why-st...

Why does regional capacity planning matter?
Elisa explains how data privacy regulations like GDPR, regional usage patterns (for example, peak WhatsApp usage in India during business hours), and jurisdiction-specific policies make capacity planning highly localized rather than globally homogeneous. The discussion also covers energy as the ultimate bottleneck, with token-per-watt efficiency becoming the critical benchmark for AI infrastructure at gigawatt scale.

Key topics covered:
• GPU capacity planning strategies
• Elastic resource allocation
• Hardware procurement cycles
• Workload-specific GPU selection
• Dynamic quota management
• Regional compliance requirements
• Energy efficiency optimization
• Disaggregated inference architectures
• Observability for AI workloads
• Capacity ROI measurement frameworks.

Whether you're managing AI infrastructure at enterprise scale or planning your organization's GPU strategy, this conversation provides actionable insights from one of the world's largest AI deployments.

👉 Hear more from Elisa during a panel discussion with other AI leaders hosted by WEKA CMO Lauren Vaccarello: https://www.weka.io/resources/video/w...

About the Speaker: Elisa Chen is a data scientist on Meta’s Ads AI infrastructure team, focusing on the intersection of AI resource management and large-scale recommendation systems to optimize infrastructure to serve high-performing ads models efficiently.

👉 Connect with WEKA:
Website: https://www.weka.io?utm_source=youtub...
LinkedIn: https://www.linkedin.com/company/weka...
X: https://x.com/weka?utm_source=youtube...

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
AI Capacity Planning at Scale: Meta's Strategy | WEKA

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

PostgreSQL сможет заменить Oracle? Ушел ли Oracle из России? — Подкаст «Слон в IT-лавке»

PostgreSQL сможет заменить Oracle? Ушел ли Oracle из России? — Подкаст «Слон в IT-лавке»

The Agentic AI Infrastructure Playbook | VentureBeat AI Impact Tour

The Agentic AI Infrastructure Playbook | VentureBeat AI Impact Tour

AI Token Economics and Prompt Caching Optimization | SemiAnalysis x WEKA

AI Token Economics and Prompt Caching Optimization | SemiAnalysis x WEKA

Я создал два стартапа-единорога. Вот единственный стартап в сфере искусственного интеллекта, кото...

Я создал два стартапа-единорога. Вот единственный стартап в сфере искусственного интеллекта, кото...

How One Rock (Almost) Poisoned The Entire Planet

How One Rock (Almost) Poisoned The Entire Planet

Kryptokłopoty Karola Nawrockiego. Komentują Wieliński i Czuchnowski | Gazeta wyborcza

Kryptokłopoty Karola Nawrockiego. Komentują Wieliński i Czuchnowski | Gazeta wyborcza

⚡Рублю КОНЕЦ! Бизнес РФ БАНКРОТИТЬСЯ ОДИН за ДРУГИМ. В Путіна БЕДА: жуткое БЕДСТВИЕ. БЛАНТ

⚡Рублю КОНЕЦ! Бизнес РФ БАНКРОТИТЬСЯ ОДИН за ДРУГИМ. В Путіна БЕДА: жуткое БЕДСТВИЕ. БЛАНТ

Лекция от легенды ИИ в Стэнфорде

Лекция от легенды ИИ в Стэнфорде

Solving AI Inference Memory Limits | Token Warehouses | Shimon Ben-David, WEKA at AI Infra Summit

Solving AI Inference Memory Limits | Token Warehouses | Shimon Ben-David, WEKA at AI Infra Summit

Google увольняет, Нейросеть для умерших, Суверенный европейский процессор | Как Там АйТи #86

Google увольняет, Нейросеть для умерших, Суверенный европейский процессор | Как Там АйТи #86

🔴 NOCNA ZMIANA | KAMILA BIEDRZYCKA & DR MIROSŁAW OCZKOŚ

🔴 NOCNA ZMIANA | KAMILA BIEDRZYCKA & DR MIROSŁAW OCZKOŚ

Новые функции NotebookLM просто невероятны.

Новые функции NotebookLM просто невероятны.

Marek Meissner - Strefa zamknięta pod kontrolą Chin.

Marek Meissner - Strefa zamknięta pod kontrolą Chin. "Dla Rosjan zostanie tylko gnój"

AI Token Economics: Real Costs of Running Models in 2026

AI Token Economics: Real Costs of Running Models in 2026

Обзор Microsoft IQ (Work IQ, Foundry IQ и Fabric IQ)

Обзор Microsoft IQ (Work IQ, Foundry IQ и Fabric IQ)

Учебное пособие по Amazon Bedrock AgentCore | Создание, развертывание и эксплуатация ИИ-агентов с...

Учебное пособие по Amazon Bedrock AgentCore | Создание, развертывание и эксплуатация ИИ-агентов с...

Почему решения о ценообразовании заходят в тупик, и никто не объясняет почему | Джеймс Уилтон из ...

Почему решения о ценообразовании заходят в тупик, и никто не объясняет почему | Джеймс Уилтон из ...

NVIDIA x WEKA | Intelligence Unlocked: The Data Foundation Fueling AI Factories

NVIDIA x WEKA | Intelligence Unlocked: The Data Foundation Fueling AI Factories

Изучите основы Microsoft Fabric за 38 минут

Изучите основы Microsoft Fabric за 38 минут

Enterprise AI at Scale: Performance, Cost, and Orchestration from the CEO’s Seat

Enterprise AI at Scale: Performance, Cost, and Orchestration from the CEO’s Seat

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]