Seleziona una pagina
martedì, Set 27

Zen 4, i segreti dell’architettura dei processori Ryzen 7000

da Hardware Upgrade :

L’anno scorso definimmo il progetto Zen 3 alla base dei processori Ryzen 5000 desktop come “l’architettura della maturit“, perch andava a colmare il deficit che le CPU AMD avevano rispetto alle controparti Intel nelle prestazioni single-thread.

Con Zen 3, fondamentalmente, AMD chiuse un’annosa rincorsa a Intel iniziata nel 2017 con la prima architettura Zen. In questo articolo andremo ad approfondire le novit diZen 4, il cuore dei Ryzen 7000, ma senza dubbio possiamo anticipare il giudizio finale: Zen 4 “l’architettura della stabilit” perch cresce e si evolve su Zen 3. La stabilit sempre un elemento positivo? Non si pu dire a priori e, se avete letto il nostro test delle prime CPU Ryzen 7000, forse vi sarete fatti la vostra opinione, le nostre le trovate alla fine di questo articolo.

Prima di entrare nel merito, facciamo un breve excursus sulla roadmap di AMD per quanto concerne le architetture di calcolo x86. Dopo Zen 3, di cui abbiamo visto anche una variante con 3D V-Cache a bordo, a partire da Zen 4 la roadmap di AMD si articola su tre progetti.

Zen 4 l’architettura dei Ryzen 7000 annunciati oggi e di cui potete vedere i test dei modelli Ryzen 7 7700X e Ryzen 9 7950X. La vedremo anche a bordo delle CPU server con gli EPYC (Genoa). In futuro, inoltre, arriveranno CPU basate su core Zen 4 con 3D V-Cache e soluzioni basate su core Zen 4C per il mondo del cloud computing. Per questa generazione, AMD ha intenzione di avvalersi dei processi produttivi a 5 e 4 nanometri di TSMC.

La strategia basata su tre varianti di Zen verr riproposta anche in futuro con Zen 5, Zen 5 con V-cache e Zen 5C. Le informazioni sono ancora limitate, ma Zen 5 stata declamata da AMD come un’architettura totalmente nuova, un progetto che andr oltre il semplice miglioramento incrementale di Zen 4. Aspettiamoci quindi una maggiore scalabilit, con passi avanti per quanto riguarda le prestazioni e l’efficienza energetica.

L’azienda parla di aumento delle issue width – il numero massimo di istruzioni di cui l’architettura pu iniziare l’esecuzione nello stesso ciclo – e un rinnovato front-end. Parallelamente, AMD continuer a espandere le capacit dell’architettura sul fronte dell’IA e del machine learning, probabilmente aggiungendo il supporto a nuovi formati di dati.

Per quanto riguarda i processi produttivi, AMD punter su 4 e 3 nanometri per realizzare il Compute Die delle CPU in arrivo (i nomi in codice per ogni segmento li vedete nelle slide).

Architettura Zen, le principali novit da Zen 1 a Zen 4

L’architettura Zen introdotta nel 2017 stata il punto di svolta per AMD nel settore desktop e non solo. Da l la rincorsa a Intel si fatta sempre pi efficace fino ad arrivare al punto in cui oggi, per certi versi, Intel a dover riassestarsi e inseguire. Con Zen 1 e Zen+, prodotti a 14 e 12 nanometri, AMD portava sul mercato delle CPU desktop consumer fino a 8 core dal rapporto prezzo-prestazioni competitivo, figlio di un incremento dell’IPC del 52% rispetto all’architettura Excavator di precedente generazione.

Il passaggio a Zen 2 vide cambiamenti decisamente pi marcati nel progetto dei Ryzen, perch a fronte di un progresso dell’IPC del 15%, AMD pass al progetto basato su chiplet che tutt’oggi ritroviamo nei Ryzen 7000. Zen 2 portava per la prima volta la famiglia Ryzen a toccare i 16 core, anche per effetto del salto al processo produttivo a 7 nanometri. Parallelamente saliva anche la frequenza di boost, arrivando a un massimo di 4,7 GHz.

Con Zen 3 AMD face il passo avanti che le serviva sul fronte dell’IPC (+19% su Zen 2) e, mantenendo il progetto a chiplet, pass a un core complex a 8 core con 32 MB di cache L3 condivisi. Mantenendo il processo produttivo a 7 nm, l’azienda riusc a spingere la massima frequenza di boost a 4,9 GHz, avvicinandosi ai 5 GHz.

Arriviamo ai giorni nostri conZen 4, i cui tratti distintivi sono ben riassunti dalla slide che vedete sopra. L’IPC compie un passo avanti del 13% di media rispetto a Zen 3, la cache L2 per core sale a 1 MB e c’ il passaggio ai 5 nanometri, processo che permette al top di gamma della serie di arrivare a 5,7 GHz come massima frequenza di boost, ben 800 MHz in pi rispetto al portabandiera della serie 5000.

Da sottolineare che le CPU Zen 4 sono le prime soluzioni Ryzen progettate esclusivamente per il mondo desktop (non contiamo le APU riadattate dal segmento mobile) a prevedere una GPU integrata. Basata su architettura RDNA 2, questa GPU integrata non si trova nel Compute Die del processore bens nell’I/O Die a 6 nanometri. Ne parleremo pi avanti, ora bando alle ciance: cosa permette all’IPC di salire? Cosa ha cambiato AMD all’interno dell’architettura rispetto a Zen 3? Entriamo nei dettagli.

Zen 4: prestazioni ed efficienza in cima ai pensieri di AMD

Il team di ingegneri di AMD che ha disegnato all’architettura Zen 4 ha lavorato seguendo tre direttrici volte a garantire un rapporto prestazioni-consumi migliore rispetto a Zen 3. Incremento dell’IPC su valori “a doppia cifra”, insieme all’incremento delle frequenze operative, sono stati i principali veicoli del miglioramento prestazionale. Non solo, particolare focus andato verso la latenza, ed per questo che AMD ha raddoppiato la cache L2 per core e lavorato per migliorare l’efficacia della stessa.

Infine, per migliorare il profilo dei consumi, AMD non si solo affidata a processi produttivi pi avanzati, ma ha anche lavorato per ridurre il consumo dinamico delle CPU. Passando all’analisi del core Zen 4, AMD intervenuta anzitutto sul front end, migliorando la branch prediction.

L’unit di branch prediction un po’ un “indovino”: si occupa infatti di prevedere l’esito di un’operazione su cui si basa l’accettazione di una istruzione di salto condizionato. Ci significa che il processore fa “un atto di fede” sulla direzione che prender una diramazione prima di conoscere il percorso corretto e la calcola in modo speculativo, anticipatamente. Se ci prende, la CPU non spreca cicli di clock e quindi svolge le operazioni con efficienza; se invece l’ipotesi si rivela errata, le istruzioni eseguite vengono scartate e si “rimbocca” il ramo (branch) corretto, il che porta a un ritardo e quindi a minori prestazioni.

Il front-end della CPU ha il compito di recuperare le istruzioni dalla memoria, decodificarle e metterle a disposizione delle unit di calcolo. Il suo compito quindi quello di fornire un numero di OP tale da tenere impegnato il back-end. Assicurarsi che quest’ultimo sia costantemente indaffarato cruciale per permettere all’unit di calcolo di offrire le massime prestazioni.

Nel caso di Zen 4, il miglioramento stato ottenuto mediante l’espansione delle cache L1 e L2 legate al branch target buffer (BTB): nel primo caso del 50% (da 1K a 1,5K entry), nel secondo da 6,5K a 7K entry. AMD afferma che l’unit ora in grado di predire due “taken branches” per ciclo di clock.

Un salto condizionato pu essere infatti “taken” o “not taken”. Nel caso di un salto “taken” si salta in una parte differente nella memoria del programma, mentre un salto “not taken” prosegue nell’esecuzione subito dopo il salto condizionale. Predire due taken branches rende il processo di esecuzione pi rapido. AMD ha inoltre incrementato la capacit della Op cache del 68% e fatto s che possa gestire 9 macro-ops per ciclo. Per il resto stata mantenuta la base di Zen 3.

Per quanto concerne gli engine di calcolo (Execution Engine), ovvero la parte integer e floating point della CPU, Zen 4 presenta una coda di ritiro istruzioni pi ampia del 25%, un file di registro integer / floating point maggiore e buffer pi profondi lungo tutto il core. Anche questo caso molti aspetti sono del tutto identici a Zen 3.

La parte di load/store stata migliorata con una coda del 22% pi ampia per le istruzioni load, si lavorato per eliminare conflitti nelle porte della cache dati, ed stato implementata una cache L2 il 50% pi ampia del DTLB (Data Translation-Lookaside Buffer). Il resto identico a Zen 3.

A cambiare senza dubbio la gerarchia della cache, con una cache L2 da 1 MB per core che raddoppia quella in aiuto dei core Zen 3. AMD ha ampliato la capacit di gestire outstanding misses (cosa utile in caso di cache miss) sia dalla cache L2 alla cache L3 per core sia dalla L3 alla memoria.

L’altra novit riguarda il supporto alle istruzioni AVX-512 che serve a implementare le istruzioni VNNI e BFloat16 e accelerare i carichi di intelligenza artificiale. AMD ha implementato le istruzioni AVX-512 su data path a 256 bit, una soluzione che elimina i compromessi termici e di frequenza di altre implementazioni, seppur impatti sulle performance di picco. A ogni modo, secondo AMD, le nuove istruzioni consentono di gestire carichi di inferenza molto pi velocemente che con l’architettura Zen 3: si parla di prestazioni multi-core FP32 superiori del 30% e multi-core int8 fino a 2,5 volte pi veloci.

Infine, da segnalare un aggiornamento dell’ISA per un miglior supporto della virtualizzazione (X2AVIC eTSC_AUX) e un occhio alla sicurezza con Indirect Branch Restricted Speculation (IBRS) sempre attiva per CLP0 (Current Privilege Level 0).

La GPU integrata nell’I/O die

Tutte le CPU Ryzen 7000 desktop presentate offrono per la prima volta (APU derivate dal settore mobile a parte) la grafica integrata, spesso abbreviata in iGPU. Per la precisione una GPU RDNA 2 con 2 Compute Unit in grado di lavorare fino a 2,2 GHz. Si tratta di una mossa che non guarda al gaming, anche perch questi processori si rivolgono notoriamente a chi acquista una scheda video dedicata. E allora a cosa serve?

Lo scopo di questa GPU principalmente quello di assicurare la prima accensione del sistema ed eventuale diagnostica in caso di problemi, ma non solo: AMD punta a soddisfare le necessit dei settori business, CAD e CAM, ambiti che prevedono una CPU potente ma necessitano di elevate prestazioni grafiche.

La iGPU RDNA 2 interessante perch supporta la decodifica AV1 10bpc/8bpc, VP9 10bpc/8bpc, H.265 10bpc/8bpc e H.264 10bpc/8bpc. Per quanto riguarda la codifica, il chip pu gestire H.264 10bpc/8bpc e H.265 10bpc/8bpc.

Quanto alle uscite video, troviamo la compatibilit con HDMI 2.1 con HFR, FRL a 48 Gbps, DSC, HDR10+ e VRR. persino DisplayPort 2.0 ready con Adaptive Sync, DSC, UHBR10 ed estensioni HDR. Completano il quadro il supporto a USB Type C con DisplayPort Alt Mode, a display fino al 4K a 60 Hz e persino alla grafica ibrida, ovvero al funzionamento insieme alla GPU dedicata.

I/O die a 6 nanometri, fondamentale per DDR5 e PCIe 5.0

Non solo la GPU integrata, che pur l’aspetto pi importante, l’architettura Zen 4 prevede un I/O Die totalmente rinnovato in cui il controller di memoria DDR5 supporta fino a 5200 MT/s con ECC, anche se tramite EXPO le memorie possono funzionare con data transfer ben superiori.

Il processore supporta un totale di 28 linee PCI Express 5.0 (24 accessibili, di cui 16 per la grafica e 8 per gli SSD NVMe), offre la tecnologia di BIOS Flashback via USB per il ripristino del firmware in caso di problemi e integra un’interconnessione Infinity Fabric ottimizzata, che serve per parlare con i Compute Die in modo efficiente e veloce. Al fine di consumare meno, l’I/O Die si affida a metodologie di gestione energetica che AMD ha applicato per la prima volta a bordo dei processori Ryzen 6000 mobile.

Una forte evoluzione in attesa della rivoluzione

Tirando le somme, Zen 4 rappresenta un’importante evoluzione rispetto a quanto offerta da Zen 3, ma allo stesso tempo non ci troviamo davanti a una rivoluzione drastica: questo ci porta a parlare “architettura della stabilit” proprio perch AMD ha cercato di preservare quanto conquistato e migliorarlo ulteriormente.

L’evoluzione degna di nota perch Zen 4 fa da apripista a una nuova piattaforma (AM5), supporta i nuovi standard PCI Express 5.0 e DDR5, integra una GPU nell’I/O die e le istruzioni AVX-512. Inoltre, riesce a migliorare prestazioni single e multi-core in modo marcato, incrementando l’efficienza.

Le CPU Zen 4 portano quindi sul mercato molta carne al fuoco, e se prestazionalmente parlando evidenziano indubbie qualit, allo stesso tempo mostrano un aumento di consumi e temperature, frutto anche della dell’impennata dei clock decisa da AMD, che sicuramente non fa gioire nessuno.

Certo, le cose vanno sempre messe in prospettiva con la concorrenza, quindi con le soluzioni di Intel. In tal senso possiamo pronunciarci solo rispetto ai Core di 12a generazione, che di certo non brillano per consumi e temperature.

[HWUVIDEO=”3290″]Ryzen 9 7950X e Ryzen 7 7700X, scopriamo le prestazioni delle nuove CPU AMD[/HWUVIDEO]

Non c’ uno strapotere di un’architettura sull’altra, e non va dimenticato che a breve Intel introdurr i Core di 13a generazione. La battaglia quindi serrata, e si pu certo dire che AMD, a fronte di un cambiamento totale di piattaforma totale, ha creato una base solida su cui dovr provare necessariamente a migliorare nei prossimi anni, risolvendo i problemi indicati.

Source link