[ad_1] L'azienda californiana ha presentato un sistema di valutazione della neutralità del proprio chatbot, con il quale ha ottenuto risultati superiori rispetto ai concorrenti. Claude Sonnet 4.5 e Opus 4.1 superano GPT-5 e Llama 4 nei test di equidistanza, mentre…
L’azienda californiana ha presentato un sistema di valutazione della neutralità del proprio chatbot, con il quale ha ottenuto risultati superiori rispetto ai concorrenti. Claude Sonnet 4.5 e Opus 4.1 superano GPT-5 e Llama 4 nei test di equidistanza, mentre viene reso disponibile uno strumento open-source per misurare l’imparzialità
