Новый GPU NVIDIA Rubin и софт Dynamo: Инновации в AI инфраструктуре
Автор: SwarowskyTech
Загружено: 2025-10-03
Просмотров: 189
Описание:
В этом ключевом выступлении NVIDIA на AI Infra Summit 2025 Иэн Бак, вице-президент по гипермасштабируемым и высокопроизводительным вычислениям, рассказывает о самых передовых методах построения AI инфраструктуры. Подробно рассматривается сложность инференса — от выбора размера модели и скорости отклика до стоимости и энергоэффективности, с акцентом на оптимизацию на всех уровнях.
Основные темы видео:
Проблемы и возможности AI инференса
Аппаратные инновации: новый GPU Rubin и стойка Vera Rubin
Программные решения: Dynamo и масштабируемый инференс
Управление миллионами токенов и будущее AI ЦОД
Практические примеры: AI для программирования и генерации видео
Это видео будет полезно всем, кто интересуется становлением следующей эры AI — от исследователей до инженеров и лидеров индустрии.
Подписывайтесь, ставьте лайки и делитесь своими мыслями в комментариях!
00:00 — Введение
10:41 — Тестирование и производительность NVIDIA
11:38 — Оптимизация программного обеспечения
12:35 — Экономическая эффективность
13:30 — Инференс и его фазы
16:13 — Программное обеспечение NVIDIA Dynamo
17:09 — Пример использования
21:49 — Новый графический процессор Rubin
22:48 — Интеграция в стойку Vera Rubin
23:48 — Ресурсы и архитектура стойки
24:43 — Увеличение производительности с Cpx
25:38 — Новая стойка VR CPS
26:35 — Партнёры и применение
30:24 — Партнёры и перспективы
27:38 — Дорожная карта чипов
29:07 — Будущее центров обработки данных
Telegram https://t.me/SwarowskyTech
Boosty https://boosty.to/swarowskytech
Rutube https://rutube.ru/channel/44646817
Dzen https://dzen.ru/swarowskytech
VK play https://vk.com/video/@club227441425
По вопросам авторских прав обращайтесь
For copyright issues, please contact
[email protected]
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: