ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Ray Agent Engine: Deploying AI Agents with Ray Serve | Ray Summit 2025

Автор: Anyscale

Загружено: 2025-12-01

Просмотров: 369

Описание: At Ray Summit 2025, Juncheng Ma, Deepak Chandramouli, and Bhumik Thakkar from Apple share how Ray Serve can be used as a powerful, framework-agnostic foundation for deploying the next generation of AI agents at scale.

They begin by outlining the growing complexity of modern AI agents—spanning multi-step reasoning, tool use, memory, planning, and dynamic interaction patterns—and the corresponding challenges in deploying these systems reliably in production. Traditional serving frameworks often assume static inference graphs, making them ill-suited for agentic workloads that require flexible orchestration and adaptive execution.

The speakers then walk through how Apple leverages Ray as an Agent Engine, combining Ray Serve’s distributed execution model with its built-in autoscaling, request routing, and traffic management capabilities. This approach enables:

Framework-agnostic agent deployment, allowing teams to integrate agents built using any architecture or library

Dynamic, scalable execution for agents that require multi-step reasoning and complex control flows

High robustness and resiliency, even under unpredictable load patterns

Simplified operational workflows, reducing the burden of managing complex agent pipelines

They share practical lessons learned from deploying agentic systems internally at Apple, highlighting patterns that generalize to a wide variety of agent frameworks and application domains.

Attendees will leave with actionable insights on how to build scalable, resilient, and production-ready agent applications using Ray Serve—regardless of the underlying agent design or development workflow.


Liked this video? Check out other Ray Summit breakout session recordings    • Ray Summit 2025 - Breakout Sessions  

Subscribe to our YouTube channel to stay up-to-date on the future of AI!    / anyscale  

🔗 Connect with us:
LinkedIn:   / joinanyscale  
X: https://x.com/anyscalecompute
Website: https://www.anyscale.com/

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Ray Agent Engine: Deploying AI Agents with Ray Serve | Ray Summit 2025

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

How Runhouse Orchestrates Multi-Cluster Ray Workloads | Ray Summit 2025

How Runhouse Orchestrates Multi-Cluster Ray Workloads | Ray Summit 2025

Prompt Learning: A Reinforcement Learning-Inspired Approach to AI Optimization | Ray Summit 2025

Prompt Learning: A Reinforcement Learning-Inspired Approach to AI Optimization | Ray Summit 2025

Expo + Clerk Full Authentication Setup 2026  (Email + Google Login) | Protected Routes

Expo + Clerk Full Authentication Setup 2026 (Email + Google Login) | Protected Routes

Scaling AI the Snowflake Way: ML Workloads on Ray | Ray Summit 2025

Scaling AI the Snowflake Way: ML Workloads on Ray | Ray Summit 2025

Webinar: Getting Started with Distributed Training at Scale

Webinar: Getting Started with Distributed Training at Scale

🔍 AI Serving Frameworks Explained: vLLM vs TensorRT-LLM vs Ray Serve | Which One Should You Use?

🔍 AI Serving Frameworks Explained: vLLM vs TensorRT-LLM vs Ray Serve | Which One Should You Use?

Cursor AI: Полный гайд по вайбкодингу с нуля. Subagents, Hooks, Skills, Rules, Commands, MCP

Cursor AI: Полный гайд по вайбкодингу с нуля. Subagents, Hooks, Skills, Rules, Commands, MCP

Как работает Search Engine под капотом: ранжирование и релевантность

Как работает Search Engine под капотом: ранжирование и релевантность

Claude Code с КОМАНДОЙ агентов - автономная машина разработки

Claude Code с КОМАНДОЙ агентов - автономная машина разработки

How Coinbase Uses Ray, vLLM & LiteLLM to Power Secure LLM Services | Ray Summit 2025

How Coinbase Uses Ray, vLLM & LiteLLM to Power Secure LLM Services | Ray Summit 2025

Distributed Embeddings at Scale: Processing 10M+ Rows/ Day with Ray, GPUs & Qdrant | Ray Summit 2025

Distributed Embeddings at Scale: Processing 10M+ Rows/ Day with Ray, GPUs & Qdrant | Ray Summit 2025

Deep House Mix 2024 | Deep House, Vocal House, Nu Disco, Chillout Mix by Diamond #3

Deep House Mix 2024 | Deep House, Vocal House, Nu Disco, Chillout Mix by Diamond #3

Benchmarking GPU Scheduling for Massive-Scale Ray Workloads at Minimal Cost - MSFT | Ray Summit 2025

Benchmarking GPU Scheduling for Massive-Scale Ray Workloads at Minimal Cost - MSFT | Ray Summit 2025

Вы не готовы к следующему этапу анализа данных.

Вы не готовы к следующему этапу анализа данных.

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

НЕ СТРОЙТЕ автоматизации n8n — стройте Аджентик Воркфлоу! (Claude Code)

НЕ СТРОЙТЕ автоматизации n8n — стройте Аджентик Воркфлоу! (Claude Code)

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Fixing S3 Bottlenecks: Scalable I/O for Ray with Alluxio | Ray Summit 2025

Fixing S3 Bottlenecks: Scalable I/O for Ray with Alluxio | Ray Summit 2025

Sasha Rush on Building Cursor Composer and the Future of Agentic Coding

Sasha Rush on Building Cursor Composer and the Future of Agentic Coding

Claude, Claude Code и Claude CoWork: Мощный обзор экосистемы Claude (+ плагины, расширения и скиллы)

Claude, Claude Code и Claude CoWork: Мощный обзор экосистемы Claude (+ плагины, расширения и скиллы)

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]