OpenAI, la società dietro ChatGpt, ha concluso il suo “calendario dell’avvento” tecnologico con un’incredibile sorpresa: il lancio di o3, il nuovo modello di intelligenza artificiale specializzato in matematica e programmazione. Secondo i primi risultati, quest’IA supera test specifici utilizzati nel campo professionale, come l’Aime, o American Invitational Mathematics Examination, con un incredibile 96,7% di risposte corrette e un solo errore commesso. Inoltre, o3 si è distinto anche nella programmazione, ottenendo un punteggio di 2727 su Codeforces, dimostrando così una conoscenza avanzata dei principi di sviluppo e codifica informatica.
Nessun altro modello di intelligenza artificiale era mai riuscito a superare il 2% nel test Frontier Math di EpochAI, ma o3 ha sorpreso tutti risolvendo il 25,2% dei problemi. Consapevole dell’enorme potenziale di queste nuove tecnologie, OpenAI ha deciso di adottare un approccio attento, limitando l’accesso ai modelli o3 solo a ricercatori specializzati in sicurezza e protezione informatica.
I risultati eccezionali ottenuti da o3, soprattutto nel test Arc-Agi dove ha triplicato il punteggio del modello precedente raggiungendo un’accuratezza dell’85%, hanno alimentato le speculazioni riguardo alla vicinanza di OpenAI allo sviluppo dell’intelligenza artificiale generale, noto come Agi, che rappresenta l’ultimo passo verso la creazione di modelli in grado di ragionare come gli esseri umani, incluso il pensiero creativo.
“Vediamo questo come l’inizio di una nuova era dell’IA, in cui i modelli potranno affrontare compiti sempre più complessi che richiedono un alto livello di ragionamento”, ha dichiarato OpenAI.
Copyright .