Семантическое кэширование с использованием Valkey и Redis: снижение затрат и задержки LLM — Марти...

Автор: Percona

Загружено: 2026-01-23

Просмотров: 599

Описание: В этой презентации объясняется, как семантическое кэширование может значительно снизить стоимость и задержку приложений, использующих большие языковые модели (LLM), за счет повторного использования значимых похожих ответов вместо точных совпадений. Используя Valkey и Redis в качестве векторных баз данных, в ней рассматривается, как встраивания, пороговые значения сходства и TTL работают вместе для эффективного кэширования ответов LLM. Доклад включает в себя практические архитектурные решения, компромиссы в конфигурации, сравнение затрат и реальную демонстрацию того, как семантическое кэширование может сократить использование LLM до 60% при одновременном улучшении времени отклика.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Семантическое кэширование с использованием Valkey и Redis: снижение затрат и задержки LLM — Марти...

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Отсортированные множества: таблицы лидеров и не только, Мартин Виссер

Отсортированные множества: таблицы лидеров и не только, Мартин Виссер

#3 Понимание LLM | LLM: От понимания к продукту Прямой эфир через restream.su

#3 Понимание LLM | LLM: От понимания к продукту Прямой эфир через restream.su

BCA II semester practical || Write a program in C++ for addition of two numbers using float data typ

BCA II semester practical || Write a program in C++ for addition of two numbers using float data typ

Взлет Valkey — взгляд в будущее кэширования с открытым исходным кодом

Взлет Valkey — взгляд в будущее кэширования с открытым исходным кодом

Как защитить API: Уязвимости и решения

Как защитить API: Уязвимости и решения

KNoWS Query Research - Progress Update (2026-02-24)

KNoWS Query Research - Progress Update (2026-02-24)

Как ответить на вопросы про Kafka на интервью? Полный разбор

Как ответить на вопросы про Kafka на интервью? Полный разбор

Better Databases, Bigger Savings

Better Databases, Bigger Savings

Полный гайд Claude Code: С Нуля до SaaS | MCP, Sub-Агенты, Custom Commands

Полный гайд Claude Code: С Нуля до SaaS | MCP, Sub-Агенты, Custom Commands

Как PostgreSQL может сделать больно, когда не ожидаешь — Михаил Жилин

Как PostgreSQL может сделать больно, когда не ожидаешь — Михаил Жилин

Устойчивость PostgreSQL в OpenShift: реальные примеры аварийного восстановления

Устойчивость PostgreSQL в OpenShift: реальные примеры аварийного восстановления

Дороничев: ИИ — пузырь, который скоро ЛОПНЕТ. Какие перемены ждут мир?

Дороничев: ИИ — пузырь, который скоро ЛОПНЕТ. Какие перемены ждут мир?

Как заставить ИИ писать нормальный код. Оркестрация мультиагентной системы.

Как заставить ИИ писать нормальный код. Оркестрация мультиагентной системы.

Почему PostgreSQL отвоевал первенство у MySQL и что нас ждет в будущем (автор: Питер Зайцев)

Почему PostgreSQL отвоевал первенство у MySQL и что нас ждет в будущем (автор: Питер Зайцев)

Фильм Алексея Семихатова «ГРАВИТАЦИЯ»

Фильм Алексея Семихатова «ГРАВИТАЦИЯ»

OAuth 2.0 на пальцах, котиках и зайчиках • Плюс POST, как и обещано • C • Live coding

OAuth 2.0 на пальцах, котиках и зайчиках • Плюс POST, как и обещано • C • Live coding

Rate limiting strategieswith Valkey/Redis

Rate limiting strategieswith Valkey/Redis

Комментарий к текущим событиям от 3 марта 2026 года. Михаил Хазин

Комментарий к текущим событиям от 3 марта 2026 года. Михаил Хазин

Разработка, кибербезопасность и парадокс интеллекта — Ивар ft. Григорий Сапунов | Мыслить как ученый

Разработка, кибербезопасность и парадокс интеллекта — Ивар ft. Григорий Сапунов | Мыслить как ученый

Лучший Гайд по Kafka для Начинающих За 1 Час

Лучший Гайд по Kafka для Начинающих За 1 Час