Кластер Strix Halo с низкой задержкой, поддержкой RDMA (RoCE/Intel E810) и vLLM, настольные платы...

Автор: Donato Capitella

Загружено: 2026-02-08

Просмотров: 1847

Описание: В этом видео я выхожу за рамки Ethernet и llama.cpp и демонстрирую кластер Strix Halo из 2 узлов, использующий RDMA и тензорный параллелизм vLLM. В конфигурации используются две материнские платы Framework Desktop с 128 ГБ унифицированной памяти каждая, напрямую подключенные через карты Intel E810, настроенные для RoCE.

Я рассматриваю важные для этой сборки аппаратные детали: прямое подключение RDMA, кастомное охлаждение для E810 и почему использование сетевой карты x16 в слоте PCIe x4 не является реальной проблемой для инференса. Я также сравниваю задержку RDMA со стандартным Ethernet и объясняю, почему низкая задержка является ключевым фактором для тензорного параллелизма в данном случае.

Что касается программного обеспечения, я рассматриваю vLLM вместе с Рэем и основную проблему, с которой я столкнулся: отсутствие поддержки RCCL для gfx1151 в исходном коде ROCm. Я объясняю, что сломалось, как я внес изменения в RCCL, чтобы обеспечить работу многоузлового параллелизма тензоров на Strix Halo, и как воспроизвести эту конфигурацию с помощью моих инструментальных пакетов.

Временные метки
00:00 – Введение
01:14 – Аппаратное обеспечение
02:09 – Сетевая карта RDMA / RoCE
03:28 – Пользовательское охлаждение для Intel E810
06:22 – Особенности линий PCIe (с x16 на x4)
08:32 – Поддержка ROCm / RCCL для gfx1151
10:31 – Руководство по настройке
13:06 – Бенчмарки
14:03 – Заключение

Ссылки и ресурсы
Инструменты и руководства Strix Halo: https://strix-halo-toolboxes
Инструменты vLLM Strix Halo (с исправленным RCCL): https://github.com/kyuz0/amd-strix-ha...
Бенчмарки vLLM: https://kyuz0.github.io/amd-strix-hal...
Параллелизм тензоров vLLM: https://developers.redhat.com/article...

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Кластер Strix Halo с низкой задержкой, поддержкой RDMA (RoCE/Intel E810) и vLLM, настольные платы...

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

TerraMaster F4-425 Plus — честный обзор NAS для homelab, Docker и Plex

TerraMaster F4-425 Plus — честный обзор NAS для homelab, Docker и Plex

⚠️ Google Sheets, Airtable или Postgres? ПРАВДА ДЛЯ n8n

⚠️ Google Sheets, Airtable или Postgres? ПРАВДА ДЛЯ n8n

Сказ о том, как мы в офис ленточную библиотеку купили.

Сказ о том, как мы в офис ленточную библиотеку купили.

Почему Ядерная война уже началась (А вы не заметили)

Почему Ядерная война уже началась (А вы не заметили)

Интернет подключён, но сайты не открываются — 5 рабочих способов (Windows)

Интернет подключён, но сайты не открываются — 5 рабочих способов (Windows)

Я протестировал Snapdragon X2 Elite на ранней стадии — предварительный обзор производительности.

Я протестировал Snapdragon X2 Elite на ранней стадии — предварительный обзор производительности.

КАК Япония Незаметно СТАЛА Мировой Станкостроительной ДЕРЖАВОЙ!

КАК Япония Незаметно СТАЛА Мировой Станкостроительной ДЕРЖАВОЙ!

Создание двухузлового кластера AMD Strix Halo для LLM с RPC llama.cpp (MiniMax-M2 и GLM 4.6)

Создание двухузлового кластера AMD Strix Halo для LLM с RPC llama.cpp (MiniMax-M2 и GLM 4.6)

Параллельное соединение импульсных блоков питания, эксперимент

Параллельное соединение импульсных блоков питания, эксперимент

КРЕМЛЬ ВСЁ ПОНЯЛ? Липсиц: Начались продажи валюты. Деньги «хоронят» заживо.

КРЕМЛЬ ВСЁ ПОНЯЛ? Липсиц: Начались продажи валюты. Деньги «хоронят» заживо.

Лучшие (не) дорогие SSD из DNS | Проверили 10 популярных NVMe дисков по низу рынка

Лучшие (не) дорогие SSD из DNS | Проверили 10 популярных NVMe дисков по низу рынка

🔥 DDR5 СВОИМИ РУКАМИ | Выживаем в кризис памяти 2026 года 💪| SODIMM - UDIMM без переходников

🔥 DDR5 СВОИМИ РУКАМИ | Выживаем в кризис памяти 2026 года 💪| SODIMM - UDIMM без переходников

KDE без хаоса: Dolphin и тайлинг для комфортной работы

KDE без хаоса: Dolphin и тайлинг для комфортной работы

Делаем роутер своими руками. Базовая настройка сети. Самохостинг (HomeLab) №3.1

Делаем роутер своими руками. Базовая настройка сети. Самохостинг (HomeLab) №3.1

Запуск vLLM на Strix Halo (AMD Ryzen AI MAX) + обновления производительности ROCm.

Запуск vLLM на Strix Halo (AMD Ryzen AI MAX) + обновления производительности ROCm.

Unbelievable Smart Worker & Hilarious Fails | Construction Compilation #19 #fail #construction

Unbelievable Smart Worker & Hilarious Fails | Construction Compilation #19 #fail #construction

КОНЕЦ АПГРЕЙДА: Почему твой следующий ПК будет последним?

КОНЕЦ АПГРЕЙДА: Почему твой следующий ПК будет последним?

I Take My First Spectra with the PDP-11/73 and Bomem FTIR!

I Take My First Spectra with the PDP-11/73 and Bomem FTIR!

Почему тебе нужен свой домашний сервер? Показываю реальный опыт HOMELAB

Почему тебе нужен свой домашний сервер? Показываю реальный опыт HOMELAB