Seleziona una pagina
martedì, Set 20

NVIDIA GeForce RTX 4090 e RTX 4080 ufficiali: Ada Lovelace e DLSS 3 per prestazioni da urlo

da Hardware Upgrade :

NVIDIA ha annunciato le prime schede video della serieGeForce RTX 4000. Nel corso dell’evento GeForce Beyond il CEO della societ, Jensen Huang, ha presentato la nuova architettura Ada Lovelace e introdotto i modelli di prossimo arrivo sul mercato: GeForce RTX 4090 il 12 ottobre e due GeForce RTX 4080 che accoglieremo a novembre.

Nessuna parola per quanto riguarda la GeForce RTX 4070 o soluzioni di fascia inferiore, mentre alcune GeForce RTX 3000 continueranno a restare sul mercato: GeForce RTX 3060, 3070 e 3080, con le altre proposte che usciranno gradualmente di scena, lasciando poi spazio alle future GeForce RTX 4000 che NVIDIA ha in cantiere.

L’architettura Ada Lovelace rappresenta un netto passo avanti rispetto al progetto Ampere che spinge le schede video della famiglia GeForce RTX 3000. Secondo NVIDIA, infatti, grado di restituire prestazioni dalle 2 alle 4 volte superiori a seconda del tipo di carico.

La GPU di punta della serie, nome in codice AD102, integra 76 miliardi di transistor ed realizzata con processo 4N di TSMC. All’interno c’ un rinnovato Streaming Multiprocessor in grado di offrire una potenza di calcolo nella gestione degli shader fino a 90 TFLOPs (83 TFLOPs nel caso della RTX 4090, leggermente castrata in termini di risorse rispetto alla GPU completa), con un miglioramento di 2 volte sul fronte dell’efficienza energetica rispetto ad Ampere.

Accanto ai CUDA core troviamo le unit RT core di 3a generazione, capaci non solo di prestazioni fino a 200 RT TFLOPs (191 sulla RTX 4090) ma anche digestire 2 volte le intersezioni raggio-triangolo rispetto alla precedente architettura. Questo si deve alle nuove unit hardware chiamate Opacity Micro-Maps eDisplaced Micro-Meshes (DMM).

La primaottimizza il ray-tracing “codificando anticipatamente i dati sui dettagli del gioco direttamente sugli oggetti nel motore di gioco“. Gli oggetti complessi, come il fogliame, sono particolarmente difficili da tracciare a causa dei molti modi in cui i raggi possono influenzare il loro aspetto in base all’illuminazione della scena e le innumerevoli direzioni che i raggi possono prendere rimbalzando tra foglie e rami. Le unit RT Core di 3a generazione presenti nelle GPU Ada Lovelace usano maschere di opacit per assegnare lo stato di opacit di questi elementi, che pu essere opaco, trasparente o sconosciuto.

Inserendo le caratteristiche di ray tracing degli oggetti di forma irregolare e traslucidi in una maschera di opacit, gli RT core di 3a generazione renderizzano questi oggetti complessi pi velocemente, migliorando le prestazioni.

Le Displaced Micro-Meshes (DMM)sono generate dagli RT core di 3a generazione, i quali creano le BVH (Bounding Volume Hierarchies) del ray tracing fino a 10 volte pi velocemente, usando 20 volte meno VRAM. Le DMM sono nuove primitive che rappresentano una rete strutturata di microtriangoli che gli RT di 3a generazione processano nativamente, riducendo i requisiti di storage ed elaborazione rispetto alle generazioni precedenti, durante il rendering di geometrie complesse usano solo triangoli di base.

“Le DMM”, spiega NVIDIA, “sono particolarmente vantaggiose in giochi e scene con ray-tracing altamente dettagliate e offrono agli sviluppatori le prestazioni per creare giochi ed esperienze fotorealistiche che sfruttano la fotogrammetria e oggetti e superfici super dettagliati”. Queste novit erano assolutamente necessarie tenendo conto che da Battlefield V in cui venivano gestite 39 operazioni ray tracing per pixel si arrivati a Cyberpunk 2077 che ne presenta 635. Un incremento di 16 volte in quattro anni.

Infine, Ada Lovelace introduce i Tensor core di 4a generazione per la gestione dei calcoli di IA, in grado di raggiungere fino a 1400 Tensor TFLOPs (1320 Tensor TLFLOPs sulla RTX 4090). Il nuovo Tensor Engine FP8 aumenta il throughput fino a 5 volte.

Alla base di queste prestazioni ci sono alcune innovazioni che il CEO di NVIDIA ha toccato durante il keynote, come Shader Execution Reordering (SER). Come fa intendere il nome, si tratta di migliorare l’efficienza nell’esecuzione dei processi, rischedulando al volo i carichi legati allo shading per fare un uso migliore delle risorse della GPU.

Secondo NVIDIA, ci troviamo a che fare con un’innovazione cos rilevante da paragonarla all’introduzione dell’esecuzione “out of order” nelle CPU. Grazie a SER, Ada Lovelace pu offrire prestazioni in ray tracing fino a 2 volte superiori rispetto ad Ampere e garantire frame rate fino al 25% migliori.

La nuova architettura offre due NVIDIA Encoders (NVENC) per ridurre fino alla met i tempi di esportazione; presente inoltre il supporto alla codifica e decodificaAV1, implementati a breve supportata da OBS, Blackmagic Design DaVinci Resolve, Discord e altri.

DLSS 3, la tecnologia di upscaling si migliora enormemente

L’altra novit della serata si chiama DLSS 3, la nuova versione del Deep Learning Super Sampling che tanto migliorato nel corso di questi anni. Non paga dei progressi, NVIDIA ha deciso di fare un ulteriore passo avanti sia sul fronte della qualit dell’immagine che, soprattutto, su quello delle prestazioni. Al momento il DLSS 3 sembra sar supportato solo dalle nuove RTX 4000, non ci sono informazioni sulla compatibilit con le generazioni precedenti.

DLSS 3 punta a migliorare le prestazioni fino a 4 volte rispetto al rendering “a forza bruta”,ovvero quello fatto tramite shader e unit hardware dedicate, senza appoggiarsi alla tecnologia basata sull’intelligenza artificiale.

DLSS 3 aggiunge quello che NVIDIA chiama Optical Multi Frame Generation per generare immagini (frame) interamente nuovi, inoltre integra la tecnologia NVIDIA Reflex per la riduzione della latenza per garantire una reattivit ottimale: si parla di una riduzione della latenza rispetto a quella nativa fino a due volte.

DLSS 3 spinto dalla quarta generazione dei Tensor Core e da Optical Flow Accelerator. Quest’ultimo analizza due frame sequenziali in-game e calcola un campo di flusso ottico, il quale cattura la direzione e la velocit alla quale i pixel si spostano dal frame 1 al frame 2.

Optical Flow Accelerator in grado di catturare informazioni a livello pixel come particelle, riflessi, ombre e illuminazioni che non sono inclusi nei calcoli sui vettori di movimento del motore di gioco. E mentre Optical Flow Accelerator traccia gli effetti a livello pixel, DLSS 3 sfrutta i vettori di movimento dell’engine di gioco per tracciare il movimento della geometria nella scena. In questo modo si evita di riprodurre artefatti visivi come lo stuttering.

L’autoencoder convoluzionale DLSS Frame Generation di NVIDIA, ovvero la nuova rete di IA della societ, prende quindi 4 input in totale: il frame precedente e attuale del gioco, un campo di flusso ottico generato dall’Optical Flow Accelerator e i dati del motore di gioco come i vettori di movimento e la profondit.

La rete IA decide poi come usare le informazioni per creare le immagini intermedie e ricostruire geometria ed effetti. “Con DLSS 3 abilitato, l’IA sta ricostruendo tre quarti del primo frame con DLSS Super Resolution e l’intero secondo frame utilizzando DLSS Frame Generation. In totale, DLSS 3 ricostruisce sette ottavi dei pixel totali visualizzati, aumentando notevolmente le prestazioni“.

DLSS Frame Generation un carico post processing per la GPU, che permette alla rete IA di aumentare il frame rate quando il gioco frenato dalla CPU. In tali scenari, DLSS 3 permette alle GPU RTX 4000 di renderizzare fino al doppio del frame rate rispetto a quello che la CPU in grado di calcolare. In Microsoft Flight Simulator, ad esempio, DLSS 3 aumenta gli FPS fino a 2 volte.

DLSS 3 arriver in ottobre, insieme alla RTX 4090, nei seguenti titoli e motori di gioco:

  • A Plague Tale: Requiem
  • Atomic Heart
  • Black Myth: Wukong
  • Bright Memory: Infinite
  • Chernobylite
  • Conqueror’s Blade
  • Cyberpunk 2077
  • Dakar Rally
  • Deliver Us Mars
  • Destroy All Humans! 2 – Reprobed
  • Dying Light 2 Stay Human
  • F1 22
  • F.I.S.T.: Forged In Shadow Torch
  • Frostbite Engine
  • HITMAN 3
  • Hogwarts Legacy
  • ICARUS
  • Jurassic World Evolution 2
  • Justice
  • Loopmancer
  • Warhammer 40,000: Darktide
  • Marauders
  • Microsoft Flight Simulator
  • Midnight Ghost Hunt
  • Mount & Blade II: Bannerlord
  • Naraka Bladepoint
  • NVIDIA Omniverse
  • NVIDIA Racer RTX
  • PERISH
  • Portal With RTX
  • Ripout
  • S.T.A.L.K.E.R 2: Heart of Chornobyl
  • Scathe
  • Sword and Fairy 7
  • SYNCED
  • The Lord of the Rings: Gollum
  • The Witcher 3: Wild Hunt
  • THRONE AND LIBERTY
  • Tower of Fantasy
  • Unity
  • Unreal Engine 4 & 5

Particolare attenzione va al rifacimento di Portal con ray tracine e DLSS 3. Disponibile gratuitamente da novembre, in tempo per l’anniversario dei 15 anni, sar scaricabile da chi possiede il titolo Valve.

GeForce RTX 4090 e RTX 4080: le specifiche tecniche

Veniamo al pezzo forte, le schede video. La GeForce RTX 4090 basata su una GPU AD102 con 16384 CUDA core attivi, ed capace di prestazioni dalle due alle quattro volte maggiori a seconda delle scenario rispetto alla RTX 3090 Ti, nonostante lo stesso TGP di 450W. Accanto alla GPU troviamo 24 GB di memoria GDDR6X a 21 Gbps per una bandwidth pari a circa 1 TB/s per mezzo del bus a 384 bit. La scheda sar disponibile dal 12 ottobre a un prezzo di 1599 dollari esentasse, 1979 euro IVA inclusa in Italia.

La GeForce RTX 4080, invece, arriva in due versioni. Il modello pi potente basato su una GPU AD103 con 9728 CUDA core e 16 GB di memoria GDDR6X a 22,5 Gbps su bus a 256 bit, per una bandwidth di 720 GB/s. Il TGP, invece, pari a 320W. La scheda, secondo NVIDIA, offre due volte le prestazioni della 3080 Ti facendo leva su DLSS 3 ed pi potente della RTX 3090 Ti pur consumando meno. Disponibile da novembre al prezzo di partenza di 1199 dollari esentasse, 1479 euro IVA inclusa in Italia.

L’altra GeForce RTX 4080 ha invece una GPU AD104 con 7680 CUDA core e 12 GB di memoria GDDR6X a 21 Gbps, con un bus a 192 bit che porta la bandwidth a 504 GB/s. Quanto al TGP, il valore indicato 285W. La scheda, secondo NVIDIA, pi veloce di una RTX 3090 Ti. La scheda debutter a novembre a 899 dollari esentasse, 1109 euro IVA inclusa in Italia.














GeForce RTX 4090 GeForce RTX 4080 16 GB GeForce RTX 4080 12 GB
CUDA core 16384 9728 7680
Boost Clock (GHz) 2,52 2,51 2,61
Base Clock (GHz) 2,23 2,21 2,31
Memoria 24 GB GDDR6X
21 Gbps
16 GB GDDR6X
22,5 Gbps
12 GB GDDR6X
21 Gbps
Bus 384-bit 256-bit 192-bit
TGP 450W 320W 285W
Porte HDMI 2.1a, 3 DisplayPort 1.4a HDMI 2.1a, 3 DisplayPort 1.4a HDMI 2.1a, 3 DisplayPort 1.4a
Interfaccia PCI Express Gen 4.0 PCI Express Gen 4.0 PCI Express Gen 4.0
NVIDIA NVLink (SLI-Ready) No No No
Codifica e decodifica AV1 S S S
Alimentazione 3 cavi PCIe 8 pin o 1 cavo PCIe Gen 5 da 450 W o superiore 3 cavi PCIe 8 pin o 1 cavo PCIe Gen 5 da 450 W o superiore 2 cavi PCIe 8 pin o 1 cavo PCIe Gen 5 da 450 W o superiore
Prezzo 1599 dollari esentasse, 1979 euro IVA inclusa 1199 dollari esentasse, 1479 euro IVA inclusa 899 dollari esentasse, 1109 euro IVA inclusa

GeForce RTX 4090 e RTX 4080 16 GB saranno prodotte da NVIDIA in quantit limitate in versione Founders Edition. Queste schede, e il modello della RTX 4080 da 12GB, saranno disponibili anche in versione custom con frequenze stock e overcloccate dai partner come ASUS, Colorful, Gainward, Galaxy, GIGABYTE, Innovision 3D, MSI, Palit, PNY e Zotac (ahinoi, non pi EVGA). A proposito di overclock, Huang ha dichiarato che in laboratorio NVIDIA riuscita a portare un chip “oltre 3 GHz”. Inoltre, le schede arriveranno sui sistemi preassemblati di Acer, Alienware, ASUS, Dell, HP, Lenovo, MSI e molti altri.

Source link