Per calcolare l’impronta ambientale dell’AI, Google ha sviluppato un metodo che tiene conto di diversi fattori, che includono tutti i consumi reali del sistema, come l’acqua e l’energia utilizzate. Tra gli elementi che vengono tenuti in considerazione ci sono le risorse inattive, macchine e chip pronti all’uso che consumano energia, Cpu e la Ram, l’infrastruttura che supporta i sistemi, come la distribuzione dell’energia, i sistemi di raffreddamento, l’overhead dei data center e il consumo idrico degli stessi.
L’impatto dell’intelligenza artificiale
Secondo il documento, i progressi in termini di efficienza di Gemini derivano dall’ecosistema integrato che Google ha sviluppato attorno ai propri modelli di intelligenza artificiale. Gemini sfrutta l’architettura Transformer, che è molto più efficiente rispetto alle soluzioni precedenti, e ha introdotto tecniche come i Mixture-of-Experts, che permettono di usare solo una parte del modello quando serve, riducendo così i calcoli e i consumi, o tecnologie come la decodifica speculativa o l’elaborazione batch di grandi quantità di richieste in maniera efficiente. Anche gli algoritmi vengono ottimizzati, ad esempio con la quantizzazione, che mantiene la qualità delle risposte ma consuma meno energia. Un elemento cruciale è l’hardware: da oltre dieci anni Google progetta Tpu dedicate all’AI, molto più efficienti delle Cpu generiche, e l’ultima generazione, chiamata Ironwood, offre miglioramenti enormi in termini di prestazioni per watt.
A questo si aggiunge un uso dinamico delle risorse, che riduce i tempi di inattività spostando i modelli tra Cpu e Tpu in base alla domanda quasi in tempo reale. L’efficienza è sostenuta anche dal software, con strumenti come il compilatore Xla e i sistemi Pathways, che permettono di eseguire in modo veloce ed efficiente i calcoli dei modelli scritti in linguaggi come Jax sull’hardware Tpu. Tutto questo ecosistema opera all’interno di data center tra i più efficienti al mondo, alimentati sempre più da energia pulita e progettati per restituire più acqua di quanta ne consumino, con sistemi di raffreddamento ottimizzati in base alle condizioni locali.