La società tecnologica cinese Alibaba ha rilasciato mercoledì una nuova versione del suo modello di intelligenza artificiale Qwen 2.5 che, a suo dire, ha superato l’acclamato DeepSeek-V3. Il rilascio di Qwen 2.5-Max arriva nel primo giorno delle festività per il capodanno lunare, quando la maggior parte dei cinesi è in ferie e in famiglia. La tempistica insolita indica la pressione che l’ascesa fulminea della startup cinese nelle ultime tre settimane ha esercitato non solo sui rivali esteri, ma anche sulla concorrenza nazionale.
L’annuncio di Alibaba su Wechat
“Qwen 2.5-Max supera … quasi su tutta la linea GPT-4o, DeepSeek-V3 e Llama-3.1-405B”, ha affermato l’unità cloud di Alibaba in un annuncio pubblicato sul suo account WeChat ufficiale, riferendosi ai modelli di intelligenza artificiale open source più avanzati di OpenAI e Meta.
L’uscita del 10 gennaio dell’assistente AI di DeepSeek, basato sul modello DeepSeek-V3, così come l’uscita del 20 gennaio del suo modello R1, hanno scosso la Silicon Valley e causato un balzo in avanti delle azioni tecnologiche, con i presunti bassi costi di sviluppo e utilizzo della startup cinese che hanno spinto gli investitori a mettere in discussione gli enormi piani di spesa delle principali aziende di AI negli Stati Uniti.
La corsa tra i concorrenti cinesi
Ma il successo di DeepSeek ha anche portato a una corsa tra i suoi concorrenti nazionali per aggiornare i propri modelli di AI. Due giorni dopo l’uscita di DeepSeek-R1, il proprietario di TikTok ByteDance ha rilasciato un aggiornamento del suo modello di AI di punta, che ha affermato di aver superato l’o1 di OpenAI supportato da Microsoft in AIME, un test di riferimento che misura quanto bene i modelli di AI comprendono e rispondono a istruzioni complesse. Ciò ha riecheggiato l’affermazione di DeepSeek secondo cui il suo modello R1 rivaleggiava con l’o1 di OpenAI in diversi benchmark delle prestazioni.
Approfondimento
IA, perché il chatbot di DeepSeek ha scosso i colossi Usa e la Borsa