ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Кластер Strix Halo с низкой задержкой, поддержкой RDMA (RoCE/Intel E810) и vLLM, настольные платы...

Автор: Donato Capitella

Загружено: 2026-02-08

Просмотров: 1847

Описание: В этом видео я выхожу за рамки Ethernet и llama.cpp и демонстрирую кластер Strix Halo из 2 узлов, использующий RDMA и тензорный параллелизм vLLM. В конфигурации используются две материнские платы Framework Desktop с 128 ГБ унифицированной памяти каждая, напрямую подключенные через карты Intel E810, настроенные для RoCE.

Я рассматриваю важные для этой сборки аппаратные детали: прямое подключение RDMA, кастомное охлаждение для E810 и почему использование сетевой карты x16 в слоте PCIe x4 не является реальной проблемой для инференса. Я также сравниваю задержку RDMA со стандартным Ethernet и объясняю, почему низкая задержка является ключевым фактором для тензорного параллелизма в данном случае.

Что касается программного обеспечения, я рассматриваю vLLM вместе с Рэем и основную проблему, с которой я столкнулся: отсутствие поддержки RCCL для gfx1151 в исходном коде ROCm. Я объясняю, что сломалось, как я внес изменения в RCCL, чтобы обеспечить работу многоузлового параллелизма тензоров на Strix Halo, и как воспроизвести эту конфигурацию с помощью моих инструментальных пакетов.

Временные метки
00:00 – Введение
01:14 – Аппаратное обеспечение
02:09 – Сетевая карта RDMA / RoCE
03:28 – Пользовательское охлаждение для Intel E810
06:22 – Особенности линий PCIe (с x16 на x4)
08:32 – Поддержка ROCm / RCCL для gfx1151
10:31 – Руководство по настройке
13:06 – Бенчмарки
14:03 – Заключение

Ссылки и ресурсы
Инструменты и руководства Strix Halo: https://strix-halo-toolboxes
Инструменты vLLM Strix Halo (с исправленным RCCL): https://github.com/kyuz0/amd-strix-ha...
Бенчмарки vLLM: https://kyuz0.github.io/amd-strix-hal...
Параллелизм тензоров vLLM: https://developers.redhat.com/article...

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Кластер Strix Halo с низкой задержкой, поддержкой RDMA (RoCE/Intel E810) и vLLM, настольные платы...

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

TerraMaster F4-425 Plus — честный обзор NAS для homelab, Docker и Plex

TerraMaster F4-425 Plus — честный обзор NAS для homelab, Docker и Plex

⚠️ Google Sheets, Airtable или Postgres? ПРАВДА ДЛЯ n8n

⚠️ Google Sheets, Airtable или Postgres? ПРАВДА ДЛЯ n8n

Сказ о том, как мы в офис ленточную библиотеку купили.

Сказ о том, как мы в офис ленточную библиотеку купили.

Почему Ядерная война уже началась (А вы не заметили)

Почему Ядерная война уже началась (А вы не заметили)

Интернет подключён, но сайты не открываются — 5 рабочих способов (Windows)

Интернет подключён, но сайты не открываются — 5 рабочих способов (Windows)

Я протестировал Snapdragon X2 Elite на ранней стадии — предварительный обзор производительности.

Я протестировал Snapdragon X2 Elite на ранней стадии — предварительный обзор производительности.

КАК Япония Незаметно СТАЛА Мировой Станкостроительной ДЕРЖАВОЙ!

КАК Япония Незаметно СТАЛА Мировой Станкостроительной ДЕРЖАВОЙ!

Создание двухузлового кластера AMD Strix Halo для LLM с RPC llama.cpp (MiniMax-M2 и GLM 4.6)

Создание двухузлового кластера AMD Strix Halo для LLM с RPC llama.cpp (MiniMax-M2 и GLM 4.6)

Параллельное соединение импульсных блоков питания, эксперимент

Параллельное соединение импульсных блоков питания, эксперимент

КРЕМЛЬ ВСЁ ПОНЯЛ? Липсиц: Начались продажи валюты. Деньги «хоронят» заживо.

КРЕМЛЬ ВСЁ ПОНЯЛ? Липсиц: Начались продажи валюты. Деньги «хоронят» заживо.

Лучшие (не) дорогие SSD из DNS | Проверили 10 популярных NVMe дисков по низу рынка

Лучшие (не) дорогие SSD из DNS | Проверили 10 популярных NVMe дисков по низу рынка

🔥 DDR5 СВОИМИ РУКАМИ | Выживаем в кризис памяти 2026 года 💪| SODIMM - UDIMM без переходников

🔥 DDR5 СВОИМИ РУКАМИ | Выживаем в кризис памяти 2026 года 💪| SODIMM - UDIMM без переходников

KDE без хаоса: Dolphin и тайлинг для комфортной работы

KDE без хаоса: Dolphin и тайлинг для комфортной работы

Делаем роутер своими руками. Базовая настройка сети. Самохостинг (HomeLab) №3.1

Делаем роутер своими руками. Базовая настройка сети. Самохостинг (HomeLab) №3.1

Запуск vLLM на Strix Halo (AMD Ryzen AI MAX) + обновления производительности ROCm.

Запуск vLLM на Strix Halo (AMD Ryzen AI MAX) + обновления производительности ROCm.

Unbelievable Smart Worker & Hilarious Fails | Construction Compilation #19 #fail #construction

Unbelievable Smart Worker & Hilarious Fails | Construction Compilation #19 #fail #construction

КОНЕЦ АПГРЕЙДА: Почему твой следующий ПК будет последним?

КОНЕЦ АПГРЕЙДА: Почему твой следующий ПК будет последним?

I Take My First Spectra with the PDP-11/73 and Bomem FTIR!

I Take My First Spectra with the PDP-11/73 and Bomem FTIR!

Почему тебе нужен свой домашний сервер? Показываю реальный опыт HOMELAB

Почему тебе нужен свой домашний сервер? Показываю реальный опыт HOMELAB

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]