da Hardware Upgrade :
L’AI generativa è sulla bocca di tutti e secondo NVIDIA rappresenta “uno dei trend più importanti nella storia dei personal computer“. Le sue capacità avanzano letteralmente di minuto in minuto e questa tecnologia diventa sempre più accessibile ai consumatori tramite strumenti facili da usare e interfacce semplificate.
NVIDIA è in prima linea per democratizzare l’IA generativa e vuole adattarla a ogni ambito, dalla produttività al gaming, dallo sviluppo alle arti creative. La società guidata da Jensen Huang è partita da lontano per arrivare a questo momento, ovvero cinque anni fa quando ha integrato nelle sue GPU i Tensor core, unità dedicate all’accelerazione e alla gestione efficiente dell’IA.
Ed è proprio sfruttando queste unità che NVIDIA conta di dare nuovo impulso allo sviluppo di applicazioni di IA generativa sempre più evolute. La prima notizia importante che ci ha comunicato la società è che TensorRT-LLM arriverà presto su Windows. Si tratta di una libreria open source che accelera le prestazioni di inferenza con i modelli linguistici di grandi dimensioni (LLM) – come Llama 2 e Code Llama – fino a 4 volte sui PC dotati di GPU NVIDIA RTX.
“L’accelerazione TensorRT-LLM è utile anche quando si integrano le funzionalità LLM con altre tecnologie, come nella generazione aumentata con recupero (RAG) in cui un LLM è abbinato a una libreria vettoriale o a un database vettoriale. RAG consente al LLM di fornire risposte basate su un set di dati specifico, come l’e-mail di un utente o articoli su un sito Web per fornire risposte più mirate“, spiega NVIDIA.
Per dimostrarlo in termini pratici, quando è stato chiesto al modello base di LLaMa 2 “quali sono le integrazioni della tecnologia NVIDIA in Alan Wake 2“, è stata restituita una risposta inutile che il gioco non era stato ancora annunciato.
Al contrario, utilizzando RAG con recenti articoli di notizie caricati in una libreria vettoriale e collegati allo stesso modello Llama 2 non solo ha restituito la risposta corretta – NVIDIA DLSS 3.5, NVIDIA Reflex e ray tracing completo – ma ha anche ottenuto risultati molto più rapidi con l’accelerazione TensorRT-LLM, mostrando come la combinazione di velocità e competenza offrirà agli utenti soluzioni più intelligenti.
TensorRT-LLM sarà presto disponibile per il download da NVIDIA Developer. I modelli open source ottimizzati per TensorRT e la demo RAG addestrata sulle novità GeForce come progetto di esempio sono disponibili su ngc.nvidia.com e GitHub.com/NVIDIA.
Un’altra novità è la disponibilità dell’accelerazione TensorRT su Stable Diffusion nella popolare interfaccia utente Web della distribuzione Automatic1111. Accelera il modello di diffusione dell’intelligenza artificiale generativa fino a 2 volte rispetto all’implementazione più veloce precedente.
Stable Diffusion con l’accelerazione TensorRT aiuta gli utenti a eseguire l’iterazione più velocemente e a trascorrere meno tempo in attesa davanti al computer, fornendo un’immagine finale in meno tempo. Su una GeForce RTX 4090, funziona 7 volte più velocemente rispetto all’implementazione principale sui Mac con Apple M2 Ultra. L’estensione è disponibile per il download oggi.
Infine, RTX Video Super Resolution (VSR) versione 1.5 è disponibile come parte dell’odierna versione di Game Ready Driver e sarà disponibile nel prossimo NVIDIA Studio Driver, in uscita all’inizio di novembre. Si tratta di una tecnologia votata al miglioramento in tempo reale dei video.
L’aggiornamento 1.5 di RTX VSR garantisce una maggiore fedeltà grafica complessiva e dettagli preservati, upscaling per video nativi e supporto per le GPU GeForce RTX serie 20.
Con questo update, le immagini migliorate con l’IA preservano i dettagli in modo più accurato durante il processo di upscaling – i dettagli più piccoli sono visibili e l’immagine complessiva risulta più nitida e chiara.
Per attivare RTX VSR non bisogna far altro che entrare nel Pannello di Controllo di NVIDIA e dal menu di sinistra cliccare “Regola le impostazioni dell’immagine video” e andare nel riquadro “Miglioramento video RTX”.