AD102, AD103 e AD104: transistor, numero di core e altro sulle GPU delle prime GeForce RTX 4000

da Hardware Upgrade :

NVIDIA ha reso noto fin da subito che le prime tre schede video dell’era GeForce RTX 4000 sono basate su tre distinte GPU: AD102 per quanto riguarda la RTX 4090, AD103 nel caso della RTX 4080 16 GB e AD104 in quello della RTX 4080 12 GB.

La società non aveva però condiviso molti dettagli tecnici, soprattutto per quanto concerne AD103 e AD104, lasciandoci con un quadro tecnico poco definito. Ora, grazie alla condivisione di un whitepaper, abbiamo una visione completa delle caratteristiche delle GPU e della loro implementazione nelle nuove schede. Andiamo con ordine.

La GPU AD102 è il cuore della GeForce RTX 4090 e, come abbiamo appreso già nelle scorse ore, si tratta di un chip da 76,3 miliardi di transistor stipati in un’area di 608,5 mm2. La GPU ha 144 Streaming Multiprocessor, 18432 CUDA core, 144 RT core e 576 Tensor core. A bordo anche 192 ROPs e ben 96 MB di cache L2. L’interfaccia di memoria è a 192 bit.

La GeForce RTX 4090 non implementa però la GPU in forma completa, come abbiamo avuto modo di spiegare in una notizia in cui ipotizzavamo il futuro arrivo di una 4090 Ti. La RTX 4090 prevede 16384 CUDA core attivi per effetto di 128 SM funzionanti, 128 RT core e 512 Tensor core. Il dato delle ROPs è pari a 176 unità, mentre il bus rimane a 384 bit.

La GPU AD103 prevede invece 45,9 miliardi di transistor in un’area di 378,6 mm2. Il chip mette a disposizione 80 Streaming Multi processor per un totale di 10240 CUDA core, 80 RT core e 320 Tensor core. Il prevede 112 ROPs e offre 64 MB di cache L2. L’interfaccia di memoria è a 256 bit.

A bordo della GeForce RTX 4080 16 GB non c’è un AD103 totalmente attivo, infatti il numero degli SM scende a 76 portando alle seguenti specifiche: 9728 CUDA core, 76 RT core e 304 Tensor core. Le ROPs sono presenti in un numero pari a 112.

Infine, arriviamo ad AD104, GPU che stando a quanto apprendiamo è integrata nella GeForce RTX 4080 12 GB nella sua forma completa. Il chip ha un’area di 294,5 mm2 e integra 35,8 miliardi di transistor. A bordo ci sono 60 SM per 7680 CUDA core, 60 RT core e 240 Tensor core. La cache L2 è pari a 64 MB, mentre le ROPs sono 80. L’interfaccia di memoria è a 192 bit. Ricapitoliamo nella seguente tabella le specifiche delle GPU Ada Lovelace, insieme al GA102 per riferimento:













 AD102AD103AD104GA102
ArchitetturaAda LovelaceAda LovelaceAda LovelaceAmpere
Processo produttivoTSMC 4NTSMC 4NTSMC 4NSamsung 8N
Transistor76,3 miliardi45,9 miliardi35,8 miliardi 28,3 miliardi
Dimensione die608,5 mm²378,6 mm²294,5 mm²628,4 mm²
Streaming Multiprocessor144806084 
CUDA Core1843210240768010752 
Tensor Core576320240 336
RT Core144806084 
ROPs19211280112 
Cache L296 MB64 MB48 MB6 MB 
Bus384 bit256 bit192 bit384 bit 

Mettendo da parte il numero dei core, è evidente che NVIDIA ha deciso di seguire AMD in merito all’ampliamento della cache all’interno dei chip. AMD con RDNA 2 ha implementato una Infinity Cache fino a 128 MB, una memoria che le ha permesso di mantenere un’interfaccia di memoria ridotta ma garantire comunque una bandwidth complessiva elevata.

NVIDIA fa la stessa cosa con Ada Lovelace, anche se in modo diverso, con un massimo di 96 MB di cache L2 che svettano rispetto ai 6 MB di cache L2 presenti nella GPU top di gamma GA102 della serie RTX 3000. Per implementare più risorse e cache L2 NVIDIA ha deciso di sacrificare l’interconnessione NVLink.

In ultimo, è bene ricordare che tutte queste GPU sono prodotte presso TSMC con un processo chiamato 4N che non deve essere confuso con l’N4 della stessa TSMC. 4N è da vedersi come un’ottimizzazione per NVIDIA del processo N5 (5 nm) della società taiwanese.

Source link