Seleziona una pagina



Da Wired.it :

Un gruppo di informatici italiani ha cominciato a caricare i documenti della Gazzetta ufficiale su Hugging Face, la piattaforma open source dedicata allo sviluppo di strumenti basati sull’intelligenza artificiale. L’obiettivo è quello di creare un dataset per addestrare con testi giuridici complessi in lingua italiana i modelli linguistici di grandi dimensioni (Llm), che consentono il funzionamento dei chatbot a intelligenza artificiale come ChatGPTo Bard.

Il progetto è stato lanciato da Mii-llm, una community di Hugging Face formata da Nicola Landro, Mattia Ferraretto ed Edoardo Federici. I tre condividono un percorso accademico presso l’università dell’Insubria. Landro è attualmente head of engineering di Digitiamo, azienda specializzata in soluzione basate sull’intelligenza artificiale, mentre Federici è data scientist in Zulla, piattaforma di copywriting con intelligenza artificiale.

Come ha scritto Federici su Linkedin, il dataset è composto da circa 1 milione e 500 mila documenti, dal 1989 a oggi. Una volta completato sarà ripulito di tutte le normative aggiornate, modificate o non più in vigore per renderlo affidabile e potrà essere usato come fonte per comprendere la normativa vigente in Italia”.

Cos’è la Gazzetta ufficiale

La Gazzetta ufficiale della Repubblica italiana, o in breve Gazzetta ufficiale, è la fonte primaria di conoscenza delle norme in vigore in Italia e rappresenta il principale strumento di diffusione, informazione e ufficializzazione di testi legislativi, atti pubblici e privati di cui la cittadinanza deve essere messa a conoscenza. Contiene quindi tutte le norme legiferate dai vari governi ed è obbligatorio che una legge ordinaria sia pubblicata in Gazzetta perché entri in vigore.

La Gazzetta ufficiale è edita dall’Istituto poligrafico e zecca dello Stato, in collaborazione con il ministero della Giustizia, che si occupa di gestire la sua direzione e redazione. Si tratta insomma di uno strumento chiave per chi voglia addestrare al linguaggio giuridico italiano modelli linguistici di grandi dimensioni.



[Fonte Wired.it]