ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Fight fire with fire AI assisted test debug flow and log analysis for AI GPU systems

OCP 2025

Автор: Open Compute Project

Загружено: 2025-10-22

Просмотров: 54

Описание: Wenxi Yan Pri System Engineer - Microsoft, Anna Mary Mathew Director, Hardware Engineering - Microsoft

 This talk presents AI-powered test and debug workflows for modern AI GPU datacenters. We capture exhaustive logs during test cycles, decode mixed formats, and apply AI-driven pre-analysis (sanitization, deduplication, enrichment) to isolate error signatures. By integrating project docs, bug databases, and fleet-wide repositories via retrieval-augmented generation, we enable contextual matching, whitelisting, and deep post-analysis using domain specs, historical bugs, and occurrence metrics. Enriched signatures feed large language models for precise root cause analysis, while stop-on-fail triggers forward key alerts and diagnostics to team channels. Case studies—GPU link integrity failures, transient power inrush PGOOD anomalies, and driver reset issues—highlight new AI systems failure modes. Were planning to open source core log_analyze code too.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Fight fire with fire AI assisted test debug flow and log analysis for AI GPU systems

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]