Nvidia ha presentato la sua quinta generazione di NVLink durante il GTC 2024, gettando le basi per una nuova era di prestazioni e connettività nel mondo dei data center alimentati dall’IA. Guidata da Huang, l’azienda si è affermata come pioniere tecnologico completo, con competenze che vanno oltre la produzione di chip avanzati, estendendosi ai gemelli digitali, al metaverso, ai data center, alle auto a guida autonoma e al software.
Durante la convention, molte sono state le novità annunciate, tra cui la famiglia di architettura Blackwell, che include B100, B200 e GB200. Il chip B100 vanta un totale di 208 miliardi di transistor con due chip interconnessi a 10 TB/s. Tuttavia, il vero vincitore del GTC2024 è stato NVlink.
Il chip NVlink, con i suoi 50 miliardi di transistor, è stato la vera star del GTC2024. Si tratta di uno switch-chip prodotto su misura per Nvidia sul nodo TSMC 4NP modificato, che consente a tutte le GPU di comunicare contemporaneamente a piena velocità in tempo reale, come se l’intero sistema fosse una singola GPU.
Ogni GPU Blackwell offre 18 connessioni NVLink di quinta generazione. Lo switch chip NVLink di NVIDIA supporta cluster multi-server fino a 1,8 TB/s. Un dominio NVLink di 72 GPU consente una banda passante GPU di 130 TB/s e offre un’efficienza della banda 4x superiore con supporto FP8.
Il chip NVL72 GB200 è un sistema a rack di scala liquida multi-nodo progettato per carichi di lavoro computazionali intensivi. Combina superchip Grace Blackwell (GB), CPU Grace, e unità di elaborazione dati BlueField-3 (DPU) per abilitare l’accelerazione di rete cloud, lo storage componibile, la sicurezza zero trust e l’elasticità di calcolo GPU nelle nuvole AI di iperscala. La potenza di calcolo raggiunge fino a 0,72 exaflops utilizzando lo standard FP8 e fino a 1,44 exaflops con FP4.
Inoltre, il sistema GB200 NVL72 offre fino a 30 volte le prestazioni rispetto allo stesso numero di GPU Tensor Core H100 di NVIDIA per carichi di lavoro di inferenza LLM, riducendo costi e consumo energetico fino a 25 volte.
Il platform GB200 NVL72 è il fondamento del più recente DGX SuperPOD, ossia un data center per l’IA, e Nvidia commercializza anche sistemi DGX B200 equipaggiati con chip x86 per eseguire carichi di lavoro specifici.
________
Nvidia’s 5th-Generation NVLink: Bringing Internet-Scale Bandwidth to a Chip