Inside the Voyage AI Platform | MongoDB.local San Francisco 2026

Автор: MongoDB

Загружено: 2026-02-04

Просмотров: 327

Описание: Watch more from .local San Francisco → • MongoDB.local San Francisco 2026
Subscribe to MongoDB YouTube→ https://mdb.link/subscribe

This talk takes you inside the Voyage Serving Platform, exploring how routing, indexing, and query optimizations deliver low-latency, high-reliability inference for embeddings and reranking models at scale. You’ll learn the key design principles behind these systems, see real examples of performance optimization, and walk away with insights to apply similar techniques in your own production environments.

00:00:00 - Introduction to the Voyage AI Platform
00:00:26 - Key Differences: Embeddings vs. Rerankers
00:01:43 - Solving the Latency vs. Throughput Tension
00:04:19 - Dynamic Query Batching for GPU Efficiency
00:07:04 - Request Unbatching & Parallel Execution
00:09:55 - Autoscaling for Bursty Traffic Patterns
00:11:14 - Building Warm GPU Pools for Faster Scaling
00:14:05 - Solving the "Cold Start" Problem
00:15:31 - Multi-Tier Model Weight Caching
00:17:53 - GPU Performance: Sequence Packing & Padding
00:18:59 - Kernel Fusion & Roofline Analysis
00:20:23 - Reducing Kernel Launch & Python Overhead

Visit Mongodb.com → https://mdb.link/MongoDB
Read the MongoDB Blog → https://mdb.link/Blog
Read the Developer Blog → https://mdb.link/developerblog

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Inside the Voyage AI Platform | MongoDB.local San Francisco 2026

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Accelerating AI Innovation at Rippling Personal boosts to Org-Level Leverage

Accelerating AI Innovation at Rippling Personal boosts to Org-Level Leverage

The Next Era of Semantic Search: Auto Embedding in Vector Search

The Next Era of Semantic Search: Auto Embedding in Vector Search

Mastering GenAI Development with MLflow: AI Observability, Evaluation, Debugging, and Deployment

Mastering GenAI Development with MLflow: AI Observability, Evaluation, Debugging, and Deployment

Как ответить на вопросы про Kafka на интервью? Полный разбор

Как ответить на вопросы про Kafka на интервью? Полный разбор

MongoDB.local San Francisco 2026

MongoDB.local San Francisco 2026

Claude Code: Настройка, которая делает его в 10 раз полезнее

Claude Code: Настройка, которая делает его в 10 раз полезнее

Почему MCP действительно важен | Модель контекстного протокола с Тимом Берглундом

Почему MCP действительно важен | Модель контекстного протокола с Тимом Берглундом

Введение в MCP | Протокол MCP - 01

Введение в MCP | Протокол MCP - 01

Автоматизация взлома оборудования с помощью кода Клода

Автоматизация взлома оборудования с помощью кода Клода

Building Agentic Generative AI Applications with MongoDB Atlas on AWS

Building Agentic Generative AI Applications with MongoDB Atlas on AWS

НЕНОРМА: то, к чему нельзя привыкать

НЕНОРМА: то, к чему нельзя привыкать

Многоагентные системы: объяснение за 17 минут

Многоагентные системы: объяснение за 17 минут

Проблема нержавеющей стали

Проблема нержавеющей стали

Что НАСА обнаружило на Ио

Что НАСА обнаружило на Ио

Революционная разработка, которая никому не интересна — Mazda Skyactiv-X SPCCI: как она работает ...

Революционная разработка, которая никому не интересна — Mazda Skyactiv-X SPCCI: как она работает ...

Economist warns about mass unemployment due to AI

Economist warns about mass unemployment due to AI

Scaling the Builder’s Journey: From MVP to Global Reach With MongoDB

Scaling the Builder’s Journey: From MVP to Global Reach With MongoDB

Как так быстро развились диффузионные LLM-технологии?

Как так быстро развились диффузионные LLM-технологии?

The Builder’s Journey: Building AI Apps With MongoDB

The Builder’s Journey: Building AI Apps With MongoDB

6 бесплатных инструментов для работы со спутниковыми снимками, которые должен знать каждый следов...

6 бесплатных инструментов для работы со спутниковыми снимками, которые должен знать каждый следов...