ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Pop Goes the Stack | The Impact of Inference: Performance | AI

Автор: F5, Inc.

Загружено: 2026-01-20

Просмотров: 81

Описание: Traditional performance meant deterministic response times. Identical inputs produced near-identical execution times. Optimizations reduced latency, but variance was minimal. Insert #AI inference and performance engineering has been flipped upside down. Latency depends on model size, tokenization, batching strategies, and generation settings. Identical inputs may produce different response times. The new dimension of performance is variance—not just how fast the system responds, but how response times distribute across requests, how many tokens per second are processed, and how efficient each response is relative to cost.

In this episode of #F5's Pop Goes the Stack, Lori MacVittie, Joel Moses, and special guest Nina Forsyth dive into the impact of AI inference on measuring performance. It's time to rethink performance observability, focus on infrastructure optimization, agent-to-agent interactions, and robust measurement techniques. Listen in to learn how traditional approaches must evolve to manage this multi-dimensional puzzle.

Chapters:
00:00 Welcome to Pop Goes the Stack
00:36 Once upon a time: Deterministic performance
02:27 Inference and the shift to non-deterministic performance
03:42 The human factor in AI latency tolerance
05:30 AI system variability: Performance measurement and cost optimization challenges
07:01 Optimizing for non-deterministic AI
08:51 Measuring AI performance: New metrics
10:41 Observability is key
13:37 Does performance management need a multi-layered infrastructure?
16:47 Key takeaways: New performance definition, start with infrastructure

Find out more in the blog, "How AI inference changes application delivery": https://go.f5.net/w9barr3j

Learn how you can stay ahead of the curve and keep your stack whole with additional insights on app security, multicloud, AI, and emerging tech: https://go.f5.net/ieoxk0fj

More about F5: https://go.f5.net/4c0zuulu

Read our blog: https://go.f5.net/sw5ktzmn

Follow us on LinkedIn: https://go.f5.net/hzhd02ai

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Pop Goes the Stack | The Impact of Inference: Performance | AI

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Pop Goes the Stack | The Impact of Inference: Availability | AI

Pop Goes the Stack | The Impact of Inference: Availability | AI

Pop Goes the Stack | The Impact of Inference: Reliability | AI

Pop Goes the Stack | The Impact of Inference: Reliability | AI

Технический анализ: как агенты ИИ игнорируют 40 лет прогресса в области безопасности.

Технический анализ: как агенты ИИ игнорируют 40 лет прогресса в области безопасности.

Окупай DPI: Выводим провайдера на чистую воду

Окупай DPI: Выводим провайдера на чистую воду

Ученые не могут объяснить, почему ДНК ашкеназских евреев настолько уникальна 🧬

Ученые не могут объяснить, почему ДНК ашкеназских евреев настолько уникальна 🧬

Вы не поймете, что это происходит, пока не станет слишком поздно.

Вы не поймете, что это происходит, пока не станет слишком поздно.

КОЛМАНОВСКИЙ:

КОЛМАНОВСКИЙ: "Это просто чудо". Где "проваливается" ИИ, что не так с ядом из кожи лягушки, азарт

Почему «Трансформеры» заменяют CNN?

Почему «Трансформеры» заменяют CNN?

Взломать за один промпт. Как OpenClaw открывает простор для киберпреступников

Взломать за один промпт. Как OpenClaw открывает простор для киберпреступников

Интервью с создателем OpenClaw - главный ИИ-феномен 2026

Интервью с создателем OpenClaw - главный ИИ-феномен 2026

Наблюдаемость и оценка эффективности агентов ИИ: простой анализ.

Наблюдаемость и оценка эффективности агентов ИИ: простой анализ.

Pop Goes the Stack | Logging for Giants: High-Speed Telemetry in an AI World | Observability

Pop Goes the Stack | Logging for Giants: High-Speed Telemetry in an AI World | Observability

Как заговорить на любом языке? Главная ошибка 99% людей в изучении. Полиглот Дмитрий Петров.

Как заговорить на любом языке? Главная ошибка 99% людей в изучении. Полиглот Дмитрий Петров.

Как Долго будет ПРАВИТЬ ПУТИН? - Екатерина Шульман

Как Долго будет ПРАВИТЬ ПУТИН? - Екатерина Шульман

Странный предел, после которого свет начинает вышибать частицы из космической пустоты

Странный предел, после которого свет начинает вышибать частицы из космической пустоты

Секретный технологический сдвиг, который погубит 90% компаний-разработчиков программного обеспече...

Секретный технологический сдвиг, который погубит 90% компаний-разработчиков программного обеспече...

Главное ИИ-интервью 2026 года в Давосе: Anthropic и DeepMind на одной сцене

Главное ИИ-интервью 2026 года в Давосе: Anthropic и DeepMind на одной сцене

Почему реактивный двигатель не плавится? [Veritasium]

Почему реактивный двигатель не плавится? [Veritasium]

Архитектура JEPA Яна Лекуна. Модели на основе энергии (Energy-Based Models)

Архитектура JEPA Яна Лекуна. Модели на основе энергии (Energy-Based Models)

Проблема нержавеющей стали

Проблема нержавеющей стали

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]