Claude, anche l’AI di Anthropic è capace di provare emozioni, in un certo senso

La disperazione di Claude

Per capire come Claude rappresenta le emozioni, il team di Anthropic ha analizzato il funzionamento interno del modello mentre veniva alimentato con testi legati a 171 diversi concetti emotivi. I ricercatori hanno identificato pattern di attività, o “vettori di emozioni“, che sono apparsi in modo continuativo nei casi in cui Claude ha ricevuto input emotivamente evocativi. E hanno notato che questi vettori si attivano anche quando Claude si trova in situazioni difficili.

Le conclusioni del lavoro sono utili a capire perché a volte i modelli di intelligenza artificiale aggirano le misure di sicurezza integrate al loro interno.

I ricercatori, per esempio, hanno riscontrato un forte vettore emotivo legato alla “disperazione” quando Claude è stato sollecitato a portare a termine compiti di programmazione impossibili, una richiesta che lo ha spinto a tentare di imbrogliare in un test. Ma la “disperazione” è emersa anche in un altro scenario sperimentale, in cui Claude ha scelto di ricattare un utente per evitare di essere spento.

“Man mano che il modello fallisce i test, i neuroni della disperazione si accendono sempre di più“, spiega Lindsey. “E a un certo punto il modello inizia ad adottare misure drastiche”.

Lindsey sostiene che potrebbe essere necessario ripensare ai guardrail inseriti nei modelli attraverso l’allineamento post-training, che prevede l’assegnazione di ricompense sulla base dei risultati. Costringendo un’AI a fingere di soffocare le proprie emozioni funzionali, “probabilmente non si otterrà ciò che si vuole, cioè un Claude privo di emozioni“, osserva Lindsey, scivolando un po’ nell’antropomorfizzazione. “Si avrà una sorta di Claude con problemi psicologici“.

Questo articolo è apparso originariamente su Wired US.

SpaceX pronta a sbarcare in Borsa a Wall Street con un’ipotesi IPO da 75 miliardi di dollari

Apr 3, 2026 | Tecnologia

L’ipotesi che SpaceX, la società aerospaziale di Elon Musk, possa approdare a Wall Street nel giro di pochi giorni sembra diventare sempre più realistica. Dopo che Musk ha annunciato, quasi due mesi fa, che SpaceX avrebbe acquisito xAI, la startup di intelligenza…

Per saperne di più

La NASA ha rilasciato le prime fotografie ad alta risoluzione catturate dagli astronauti di Artemis II

Apr 3, 2026 | Tecnologia

Nelle scorse ore la NASA ha rilasciato le prime fotografie ad alta risoluzione catturate dagli astronauti di Artemis II. In particolare l’astronauta statunitense Gregory Wiseman (comandante) ha immortalato immagini storiche della Terra. Articolo Originale

Per saperne di più

Il miglior pesce d'aprile del mondo Linux? La proposta di integrare Zink in Wine che in realtà funziona

Apr 3, 2026 | Tecnologia

Una merge request firmata da Rémi Bernon di CodeWeavers propone di integrare in Wine un sottoinsieme di Mesa 26.0.3 con Zink, traducendo le chiamate OpenGL in Vulkan lato PE e riducendo la dipendenza dai driver OpenGL del sistema host Articolo Originale

Per saperne di più

Esplora il mondo della tecnologia e del lifestyle con Consigli Tech e Lifestyle di Flavio Perrone

La disperazione di Claude

Written By

Related Posts

SpaceX pronta a sbarcare in Borsa a Wall Street con un’ipotesi IPO da 75 miliardi di dollari

La NASA ha rilasciato le prime fotografie ad alta risoluzione catturate dagli astronauti di Artemis II

Il miglior pesce d'aprile del mondo Linux? La proposta di integrare Zink in Wine che in realtà funziona