Non ha spiegazione ma si tratta di qualcosa che in molti gradiranno: Amazon abbassa ulteriormente il prezzo dei Macbook Air con chip M4, scendendo dove mai era arrivata prima, solo 849€, in tutti i colori. Per quanto? Non si sa.
Articolo Originale
Google risolve il problema della memoria negli LLM: TurboQuant fa girare gli stessi modelli con cinque volte meno RAM
Google Research presenta TurboQuant, algoritmo training-free che comprime il KV cache degli LLM a 3 bit senza perdere accuratezza. Memoria ridotta di almeno cinque volte e calcolo degli attention logits fino a 8x più veloce su NVIDIA H100 Articolo Originale


