La ricerca biomedica sotto la lente: come i dati sintetici superano le sfide del GDPR

Negli ultimi anni, la ricerca biomedica si è trovata ad affrontare la crescente difficoltà di utilizzare adeguatamente i dati sanitari, nonostante la massa di informazioni disponibili. Le strutture sanitarie, infatti, producono quotidianamente enormi volumi di dati — dalle cartelle cliniche ai referti diagnostici e ai dati genomici — ma molte di queste informazioni restano inutilizzate. I motivi sono molteplici: le normative stringenti sulla privacy, l’eterogeneità delle strutture sanitarie e la mancanza di infrastrutture comuni rendono complesso mettere insieme i pezzi di questo puzzle. In questo contesto, l’emergere dei dati sintetici offre una possibile soluzione ai limiti imposti dal GDPR, rendendo i dati più utilizzabili per fini di ricerca senza compromettere la privacy dei pazienti.

Oncologia e malattie rare: due volti della stessa sfida

Le problematiche relative ai dati si manifestano in modo diverso, soprattutto quando si considera l’oncologia e le malattie rare. Nell’ambito oncologico, sebbene esista una buona quantità di dati attraverso registri e biobanche, le difficoltà si riferiscono alla loro aggregazione. La ricerca richiede serie di dati provenienti da più centri, ma le differenze nelle classificazioni e nei criteri diagnostici possono creare veri e propri ostacoli. Questo porta a una situazione in cui i modelli predittivi, che potrebbero contribuire a migliorare le cure, faticano a dare frutti. D’altro canto, nelle malattie rare ci troviamo di fronte all’opposto: la scarsità di pazienti rende difficile sviluppare modelli diagnostici validi, creando un circolo vizioso in cui è necessario un numero sufficiente di dati per generare soluzioni efficaci.

L’innovazione attraverso i dati sintetici

Un’alternativa promettente si presenta con la pseudonimizzazione e i dati sintetici. La pseudonimizzazione cerca di mascherare le identità, ma ciò comporta incertezze nel trattamento delle informazioni, specialmente in un contesto collaborativo dove diversi attori possono avere capacità diverse di re-identificazione. Questo può portare a confusione sulle normative da rispettare. D’altro canto, l’uso di dati sintetici, generati attraverso modelli di intelligenza artificiale, offre la possibilità di preservare correlazioni e pattern senza esporre dati personali reali. Questo approccio non solo mantiene l’utilità scientifica, ma riduce i rischi di violazione della privacy.

Nell’ambito oncologico, i dati sintetici possono essere generati a livello locale, consentendo a ciascun centro di sviluppare modelli validati e condivisi. Nelle malattie rare, invece, questi dati possono espandere considerevolmente i campioni disponibili, migliorando così la capacità di analisi statistiche e diagnosi.

Un quadro normativo europeo in evoluzione

A livello europeo, l’European Health Data Space (EHDS) cerca di stabilire un framework armonizzato per l’accesso ai dati sanitari, con scadenze che si estendono fino al 2029. Tuttavia, in Italia, l’applicazione di norme adeguate sembra arretrare rispetto a questo progresso. La Legge 132/2025, che prevede la creazione di sandbox regolatorie per l’uso dell’IA in sanità, non ha ancora visto la luce, creando incertezza giuridica e limitando gli investimenti nel settore. La mancanza di un ambiente sperimentale in Italia rallenta il progresso e mette in discussione la posizione del paese nella definizione di standard europei in continua evoluzione.

Conclusione pratica

Affrontare la sfida della ricerca biomedica richiede un cambiamento di paradigma, spostando l’attenzione dalla semplice protezione dei dati alla progettazione di informazioni utili e condivisibili. I dati sintetici rappresentano una via d’uscita significativa dalle restrizioni imposte dalle normative sulla privacy, non solo migliorando l’efficacia della ricerca, ma anche garantendo la protezione delle informazioni personali. L’importanza di un quadro normativo che faciliti l’adozione di queste tecniche è cruciale per il futuro della sanità digitale, specialmente in un contesto come quello italiano, dove la collaborazione tra diversi attori del settore si fa sempre più necessaria.