La disputa tra Nexperia BV e le sue entità cinesi continua a pesare sulla supply chain globale dei semiconduttori e incombe sull’automotive. Nonostante la sospensione dell’intervento statale olandese, il ramo europeo sostiene che persistono blocchi alle esportazioni e mancano risposte operative dalla Cina.
Articolo Originale
Google risolve il problema della memoria negli LLM: TurboQuant fa girare gli stessi modelli con cinque volte meno RAM
Google Research presenta TurboQuant, algoritmo training-free che comprime il KV cache degli LLM a 3 bit senza perdere accuratezza. Memoria ridotta di almeno cinque volte e calcolo degli attention logits fino a 8x più veloce su NVIDIA H100 Articolo Originale


