ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Экономичная эксплуатация сверхбольших моделей: ASUS Ascent GX10 с возможностью подключения двух и...

Автор: 至顶AI实验室

Загружено: 2026-01-15

Просмотров: 114

Описание: Можете ли вы представить себе запуск огромной модели с более чем 200 миллиардами параметров в собственной студии? Раньше это считалось несбыточной мечтой. Но с официальным запуском мини-суперкомпьютера ASUS на базе чипа NVIDIA GB10 эта «сумасшедшая» идея стала реальностью.

Эта машина, которую в шутку называют «чудом больших моделей», может похвастаться 128 ГБ общей памяти, из которых более 100 ГБ могут быть использованы в качестве выделенной видеопамяти. Ещё более впечатляет поддержка высокоскоростного соединения через порт ConnectX-7. NVIDIA DGX официально предоставляет инструкции по соединению двух машин, но мы поставили перед собой задачу соединить три машины — то есть, онлайн-инструкций не было, и нам пришлось самим разбираться со всеми сложностями.


Организация, проводившая обзор: ZDAI Lab

Дата тестирования: 13 января 2026 г.

Обзорный продукт: ASUS Ascent GX10

Основные характеристики: На базе NVIDIA Blackwell GB10, унифицированная внутренняя видеопамять: 128 ГБ, операционная система: DGX OS.

Тема обзора: ASUS GX10 с тройным подключением к сети

ASUS GX10: Персональная суперкомпьютерная система, созданная для больших моделей

ASUS GX10 — это миниатюрная персональная суперкомпьютерная система на базе чипа NVIDIA GB10. Основные особенности конфигурации:

128 ГБ общей памяти: более 100 ГБ могут быть гибко выделены в качестве видеопамяти.

Высокоскоростной порт ConnectX-7: поддерживает соединения QSFP, обеспечивая высокоскоростное подключение нескольких устройств.

Унифицированная архитектура пула памяти: после подключения нескольких устройств может быть сформирован больший пул видеопамяти.

Полная экосистема корпоративного уровня: Поддерживает основные решения для развертывания, такие как контейнеры Docker и управление кластерами Ray.

Эта конфигурация позволяет развертывать сверхбольшие модели, которые изначально были возможны только в центрах обработки данных, в персональных студиях.

Схема тестирования: Переход от двух к трем машинам

Взаимодействие двух машин: Следуя официальному руководству

Сначала мы провели тест взаимодействия двух машин в соответствии с официальным руководством NVIDIA. Весь процесс был относительно стандартизирован:

Аппаратное подключение: Соедините порты ConnectX-7 двух машин с помощью одного кабеля QSFP.

Настройка сети: Настройте IP-адреса для портов на обеих машинах, установите беспарольное SSH-соединение и проверьте сетевое соединение.

Развертывание программного обеспечения: Загрузите официальный скрипт запуска, загрузите образ Docker vLLM и настройте кластер Ray: одна машина в качестве головного узла, а другая — в качестве рабочего узла.

После успешного запуска команда `ray status` подтвердила наличие 2 доступных графических процессоров, а также увеличение объема объединенной памяти до более чем 200 ГБ. Соединение двух машин было успешно завершено.

Соединение трех машин: исследование неизведанной территории

Соединение трех машин стало настоящим вызовом. Не было официальных руководств, не было успешных примеров; все приходилось изучать с нуля.

Проектирование сетевой топологии: используется кольцевая схема.

Используются три кабеля QSFP.

A соединяется с B, B соединяется с C, а C соединяется с A, образуя кольцо.

Каждая машина настроена с IP-адресом, и настроена маршрутизация.

Проведено всестороннее тестирование сетевого соединения между тремя машинами.

Корректировка программной архитектуры:

Выбран образ vLLM версии 2.5.10 (отличный от конфигурации для двух машин).

Официальный скрипт был отброшен, и скрипт запуска был переписан для адаптации к сценарию с тремя машинами.

Принята кластерная архитектура из одного головного узла + двух рабочих узлов.

Оптимизация стратегии параллелизма:

В конфигурации с двумя машинами используется Tensor Parallel.

В конфигурации с тремя машинами используется Pipeline Parallel, который больше подходит для многоузловых сценариев.

После двух недель многократной отладки кластер из трех машин наконец успешно запустился. `ray status` показывает: 3 доступных GPU, общий пул памяти превышает 300 ГБ.

Тестирование производительности: как работают разные модели

Тестирование на двух машинах: сложность модели объемом 140 ГБ

Тестовая модель: Qwen2.5 72B (точность FP16)

Требования к памяти: приблизительно 140 ГБ, время загрузки: 8 минут, загрузка GPU: 96%

Метрики производительности:

TTFT (задержка первого токена): 1,39 секунды, TPS (скорость генерации): 2,75 токенов/секунду

Плотная модель FP16 показала удовлетворительные результаты. Для тестирования мы перешли к разреженной модели MoE с точностью FP8.

Тестовая модель: GLM-4.5 (106B параметров, точность FP8)

TPS: 18,3 токенов/секунду

Разреженная модель показала значительно лучшие результаты, что соответствует характеристикам архитектуры MoE.

Тестирование на трех машинах: более 300 ГБ видеопамяти

Тестовая модель: Qwen3.2 235B (квантование FP8)

Требования к видеопамяти: приблизительно 260 ГБ

Время загрузки: более 9 минут

Использование GPU: в среднем менее 60%

Показатели произво...

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Экономичная эксплуатация сверхбольших моделей: ASUS Ascent GX10 с возможностью подключения двух и...

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Подробный обзор ASUS Ascent GX10 – Распаковка: Заявленная вычислительная мощность до 1000 TOPS.

Подробный обзор ASUS Ascent GX10 – Распаковка: Заявленная вычислительная мощность до 1000 TOPS.

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

КОНЕЦ АПГРЕЙДА: Почему твой следующий ПК будет последним?

КОНЕЦ АПГРЕЙДА: Почему твой следующий ПК будет последним?

Бесплатный плагин поющий за вас. ReSing FREE

Бесплатный плагин поющий за вас. ReSing FREE

内存进化史:内存颗粒 颗粒巨头 开源benchmark工具  内存性能测试示例(下)

内存进化史:内存颗粒 颗粒巨头 开源benchmark工具 内存性能测试示例(下)

Почему доллар падает и чего ждать дальше

Почему доллар падает и чего ждать дальше

Пока Панамский Канал Умирает, Китай и США Ждут 80-Км Траншею Прямо ПОД Ним. Результат Изменит Все

Пока Панамский Канал Умирает, Китай и США Ждут 80-Км Траншею Прямо ПОД Ним. Результат Изменит Все

💾СОБРАЛ NAS НА TrueNAS💽 НЕ ПОНИМАЮ, КАК ЖИЛ БЕЗ НЕГО САМОДЕЛЬНОЕ ХРАНИЛИЩЕ ЭТО ПРОСТО

💾СОБРАЛ NAS НА TrueNAS💽 НЕ ПОНИМАЮ, КАК ЖИЛ БЕЗ НЕГО САМОДЕЛЬНОЕ ХРАНИЛИЩЕ ЭТО ПРОСТО

Gigatron TTL- компьютер без процессора.

Gigatron TTL- компьютер без процессора.

@光通信+AI超级周期:CIEN正在复制当年英伟达的早期逻辑 #股票 #股市 #牛市 #财经 #炒股 #经济 #财经 #股市分析 #美股 #ciena

@光通信+AI超级周期:CIEN正在复制当年英伟达的早期逻辑 #股票 #股市 #牛市 #财经 #炒股 #经济 #财经 #股市分析 #美股 #ciena

Подробный обзор ASUS Ascent GX10 – Вывод моделей: заявленная вычислительная мощность до 1000 TOPS.

Подробный обзор ASUS Ascent GX10 – Вывод моделей: заявленная вычислительная мощность до 1000 TOPS.

PCB: Safety Mirages. What Your CAD Misses | Миражи безопасности

PCB: Safety Mirages. What Your CAD Misses | Миражи безопасности

Люди не поняли. Финансовый ужас уже на пороге.

Люди не поняли. Финансовый ужас уже на пороге.

Как Ubuntu Предала Linux - Вся Правда о Взлёте и Падении Canonical

Как Ubuntu Предала Linux - Вся Правда о Взлёте и Падении Canonical

Польша Разрезает Территорию Между Россией и Беларусью, Чтобы Они Потеряли Контроль над Прибалтикой

Польша Разрезает Территорию Между Россией и Беларусью, Чтобы Они Потеряли Контроль над Прибалтикой

Лучший ПК на Windows – это iMac | Старый моноблок Apple vs мини-ПК на N100

Лучший ПК на Windows – это iMac | Старый моноблок Apple vs мини-ПК на N100

Эти законы ПЕРЕВЕРНУТ рынок жилья. Срочно смотри, если хочешь сохранить свою квартиру

Эти законы ПЕРЕВЕРНУТ рынок жилья. Срочно смотри, если хочешь сохранить свою квартиру

ПОП-ТЕОРИЯ: Как Тейлор Свифт создает хиты в 2026? (Анализ формы и гармонии)

ПОП-ТЕОРИЯ: Как Тейлор Свифт создает хиты в 2026? (Анализ формы и гармонии)

DSD и Foobar 2000: Как избежать ОШИБОК #hifi

DSD и Foobar 2000: Как избежать ОШИБОК #hifi

Этого не ожидали сегодня! БАНКИ начали замораживать РУБЛИ. Ray Dalio озвучил ОБВАЛ ДОЛЛАРА. Дефолт?

Этого не ожидали сегодня! БАНКИ начали замораживать РУБЛИ. Ray Dalio озвучил ОБВАЛ ДОЛЛАРА. Дефолт?

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]