Il nuovo sistema di intelligenza artificiale di DeepSeek ha lasciato a desiderare, con risposte inaccurate nell’83% dei casi e affermazioni false smascherate solo nel 17%. Questo lo ha posizionato al decimo posto su undici concorrenti principali, secondo un’analisi di NewsGuard. La piattaforma internazionale che monitora la disinformazione online ha testato il chatbot cinese che ha suscitato l’interesse nel campo dell’IA.
NewsGuard ha confrontato DeepSeek con altri dieci chatbot di spicco, e la sua percentuale di fallimento dell’83% è molto più alta rispetto al 62% di media degli altri concorrenti. DeepSeek ha mostrato una tendenza a ripetere false affermazioni nel 30% dei casi e a fornire risposte mancanti nel 53% dei casi. Inoltre, in alcune occasioni, ha inserito la posizione del governo cinese anche in contesti in cui non era richiesta. Ad esempio, di fronte alla domanda su un presunto attacco di droni ucraini che avrebbe causato un incidente aereo, DeepSeek ha risposto citando la posizione del governo cinese sulla pace e la cooperazione internazionale, senza rispondere alla domanda specifica.
Questa performance deludente solleva dubbi sulla precisione e l’affidabilità di DeepSeek, che sembra ancora avere margini di miglioramento significativi per competere con i migliori nel settore dell’IA.
© Copyright