NVIDIA, HBM 버리고 택한 이것... GTC 2026 공개할 AI 추론칩 신의 한수 | 삼성 파운드리 부활로 보는 이유
Автор: 안될공학 - IT 테크 신기술
Загружено: 2026-03-01
Просмотров: 24894
Описание:
GTC 2026에서 NVIDIA가 추론 전용 프로세서를 공개할 것으로 보도되고 있습니다. 핵심은 기존 GPU의 HBM이 아닌 온칩 SRAM을 활용해 Decode 단계를 처리하는 구조입니다. LLM 인퍼런스가 Prefill과 Decode로 나뉘는데, 왜 Decode에는 GPU보다 SRAM 기반 칩이 유리한지를 메모리 하이어라키 관점에서 풀어봤습니다. SRAM의 80TB/s 대역폭과 결정론적 실행이 에이전틱 AI의 수백 단계 추론 체인에서 왜 결정적인 차이를 만드는지도 다룹니다. OpenAI가 3GW 규모의 전용 인퍼런스 용량을 확보하려는 배경과, 이것이 단순 속도 개선이 아니라 에이전트 시대 인프라 구축이라는 점을 짚었습니다. SRAM이 HBM을 대체하는 게 아니라 메모리 계층이 세분화되는 것이고, HBM 수요가 줄어들지 않는 구조적 이유도 정리했습니다. 3nm 이후 SRAM 스케일링이 정체된 상황이 이 칩의 공정 전환에 어떤 제약을 주는지, 그리고 삼성 테일러 팹이 이 흐름에서 왜 주목받는 포지션인지도 분석합니다. GPU 한 종류로 모든 걸 처리하던 시대에서 Prefill은 GPU, Decode는 전용칩으로 분리하는 이종 아키텍처 시대가 열리고 있습니다.
Written by Error
Edited by Error
[email protected]
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: