venerdì, Set 23

AD102, AD103 e AD104: transistor, numero di core e altro sulle GPU delle prime GeForce RTX 4000

da Hardware Upgrade :

NVIDIA ha reso noto fin da subito che le prime tre schede video dell’era GeForce RTX 4000 sono basate su tre distinte GPU: AD102 per quanto riguarda la RTX 4090, AD103 nel caso della RTX 4080 16 GB e AD104 in quello della RTX 4080 12 GB.

La società non aveva però condiviso molti dettagli tecnici, soprattutto per quanto concerne AD103 e AD104, lasciandoci con un quadro tecnico poco definito. Ora, grazie alla condivisione di un whitepaper, abbiamo una visione completa delle caratteristiche delle GPU e della loro implementazione nelle nuove schede. Andiamo con ordine.

La GPU AD102 è il cuore della GeForce RTX 4090 e, come abbiamo appreso già nelle scorse ore, si tratta di un chip da 76,3 miliardi di transistor stipati in un’area di 608,5 mm2. La GPU ha 144 Streaming Multiprocessor, 18432 CUDA core, 144 RT core e 576 Tensor core. A bordo anche 192 ROPs e ben 96 MB di cache L2. L’interfaccia di memoria è a 192 bit.

La GeForce RTX 4090 non implementa però la GPU in forma completa, come abbiamo avuto modo di spiegare in una notizia in cui ipotizzavamo il futuro arrivo di una 4090 Ti. La RTX 4090 prevede 16384 CUDA core attivi per effetto di 128 SM funzionanti, 128 RT core e 512 Tensor core. Il dato delle ROPs è pari a 176 unità, mentre il bus rimane a 384 bit.

La GPU AD103 prevede invece 45,9 miliardi di transistor in un’area di 378,6 mm2. Il chip mette a disposizione 80 Streaming Multi processor per un totale di 10240 CUDA core, 80 RT core e 320 Tensor core. Il prevede 112 ROPs e offre 64 MB di cache L2. L’interfaccia di memoria è a 256 bit.

A bordo della GeForce RTX 4080 16 GB non c’è un AD103 totalmente attivo, infatti il numero degli SM scende a 76 portando alle seguenti specifiche: 9728 CUDA core, 76 RT core e 304 Tensor core. Le ROPs sono presenti in un numero pari a 112.

Infine, arriviamo ad AD104, GPU che stando a quanto apprendiamo è integrata nella GeForce RTX 4080 12 GB nella sua forma completa. Il chip ha un’area di 294,5 mm2 e integra 35,8 miliardi di transistor. A bordo ci sono 60 SM per 7680 CUDA core, 60 RT core e 240 Tensor core. La cache L2 è pari a 64 MB, mentre le ROPs sono 80. L’interfaccia di memoria è a 192 bit. Ricapitoliamo nella seguente tabella le specifiche delle GPU Ada Lovelace, insieme al GA102 per riferimento:

	AD102	AD103	AD104	GA102
Architettura	Ada Lovelace	Ada Lovelace	Ada Lovelace	Ampere
Processo produttivo	TSMC 4N	TSMC 4N	TSMC 4N	Samsung 8N
Transistor	76,3 miliardi	45,9 miliardi	35,8 miliardi	28,3 miliardi
Dimensione die	608,5 mm²	378,6 mm²	294,5 mm²	628,4 mm²
Streaming Multiprocessor	144	80	60	84
CUDA Core	18432	10240	7680	10752
Tensor Core	576	320	240	336
RT Core	144	80	60	84
ROPs	192	112	80	112
Cache L2	96 MB	64 MB	48 MB	6 MB
Bus	384 bit	256 bit	192 bit	384 bit

Mettendo da parte il numero dei core, è evidente che NVIDIA ha deciso di seguire AMD in merito all’ampliamento della cache all’interno dei chip. AMD con RDNA 2 ha implementato una Infinity Cache fino a 128 MB, una memoria che le ha permesso di mantenere un’interfaccia di memoria ridotta ma garantire comunque una bandwidth complessiva elevata.

NVIDIA fa la stessa cosa con Ada Lovelace, anche se in modo diverso, con un massimo di 96 MB di cache L2 che svettano rispetto ai 6 MB di cache L2 presenti nella GPU top di gamma GA102 della serie RTX 3000. Per implementare più risorse e cache L2 NVIDIA ha deciso di sacrificare l’interconnessione NVLink.

In ultimo, è bene ricordare che tutte queste GPU sono prodotte presso TSMC con un processo chiamato 4N che non deve essere confuso con l’N4 della stessa TSMC. 4N è da vedersi come un’ottimizzazione per NVIDIA del processo N5 (5 nm) della società taiwanese.

Source link