In sintesi
[ad_1] AWS e Cerebras collaboreranno per portare nel cloud una nuova infrastruttura di inferenza AI basata su architettura disaggregata. Il sistema combinerà chip Trainium per l'elaborazione dei prompt e sistemi CS-3 per la generazione dei token. Obiettivo? Altissime prestazioni. [ad_2]…
AWS e Cerebras collaboreranno per portare nel cloud una nuova infrastruttura di inferenza AI basata su architettura disaggregata. Il sistema combinerà chip Trainium per l’elaborazione dei prompt e sistemi CS-3 per la generazione dei token. Obiettivo? Altissime prestazioni.
