Dati sintetici: l'infrastruttura per lo Spazio Europeo dei Dati Sanitari

Perché i dati sintetici rappresentano una chiave tecnologica per abilitare l'uso secondario dei dati clinici nella sanità italiana e accelerare la ricerca medica già oggi.

Il Regolamento (UE) 2025/327 — che istituisce l’European Health Data Space (EHDS) — è in vigore dal 26 marzo 2025. In Italia, il 5 maggio 2026 si è insediata presso il Ministero della Salute la Cabina di regia nazionale EHDS, istituita con decreto del Ministro Schillaci del 20 febbraio 2026. L’organismo coordina Ministero della Salute, AGENAS, ISS, AIFA, ISTAT, AgID e le Regioni.

Lo Spazio Europeo dei Dati Sanitari: uso primario e uso secondario

L’EHDS distingue uso primario (cura del paziente) e uso secondario (ricerca, salute pubblica, policy, sviluppo AI). Per l’uso secondario, gli obblighi principali diventano applicabili in fasi: entro marzo 2027 gli Stati membri devono designare i Health Data Access Body (HDAB) nazionali; entro marzo 2029 entra in piena applicazione la disciplina sull’accesso secondario ai dati, insieme all’operatività di HealthData@EU — l’infrastruttura transfrontaliera europea. Le istituzioni che detengono dati — ospedali, IRCCS, ASL — diventano data holder con obblighi precisi di risposta alle richieste di accesso.

Il problema: dati clinici bloccati nel sistema

Il patrimonio di dati clinici del SSN — cartelle elettroniche, dati di laboratorio, immagini diagnostiche, outcome — è di fatto inutilizzabile per la ricerca nella maggior parte delle istituzioni italiane, per tre ragioni strutturali:

  • Barriere regolatorio-procedurali: ogni accesso richiede approvazione del Comitato Etico, DPIA, accordi di data sharing, eventuale parere del Garante;
  • Frammentazione regionale: i sistemi informativi sanitari italiani sono eterogenei e non interoperabili tra regioni;
  • Rischio re-identificazione: anche dataset “anonimizzati” con metodi tradizionali presentano rischi residui che bloccano la condivisione cross-istituzionale.

L’EHDS impone di risolvere questo problema — ma non dice come farlo tecnicamente. È qui che entrano i dati sintetici.

Dati sintetici: l’infrastruttura EHDS-ready

I dati sintetici generati da AI sono dati artificiali che replicano le proprietà statistiche e analitiche di un dataset reale senza contenere informazioni riferibili a pazienti specifici. Non sono dati anonimizzati: sono dati nuovi, generati da un modello addestrato sui dati originali.

La posizione regolatoria è chiara: l’European Data Protection Supervisor ha confermato che i principi di protezione dei dati non si applicano ai dati anonimi — e i dati sintetici correttamente generati rientrano in questa categoria. Nell’ecosistema EHDS, questo significa:

  • Non sono dati personali ai sensi del GDPR → condivisibili senza le stesse barriere procedurali dei dati reali
  • Standardizzabili nei formati richiesti da HealthData@EU per l’interoperabilità transfrontaliera
  • Analiticamente validi → preservano distribuzioni, correlazioni e pattern clinici del dataset originale
  • Audit-ready → accompagnati da report di validazione su utilità, privacy e bias

Perché agire adesso, non nel 2029

La scadenza del marzo 2029 per il pieno regime EHDS potrebbe sembrare lontana. Ma le organizzazioni che costruiscono infrastrutture di data sharing compliant oggi ottengono un vantaggio concreto nell’accesso ai finanziamenti europei per la ricerca: Horizon Europe e EU4Health richiedono già adesso capacità di data sharing conforme.

Passi pratici per ospedali e IRCCS:

  1. Mappare il patrimonio dati clinici disponibili e i sistemi EHR in uso
  2. Valutare la generazione sintetica per i dataset destinati alla ricerca collaborativa o ai bandi europei
  3. Aggiornare la governance dei dati: DPIA, consenso strutturato, allineamento ai formati EHR richiesti dall’EHDS
  4. Identificare il referente HDAB non appena il Health Data Access Body italiano sarà designato (entro marzo 2027).

Aindo per la sanità italiana

Aindo è la piattaforma italiana di generazione di dati sintetici certificata Europrivacy (Art. 42 GDPR), ISO 27001 e ISO 9001, progettata per operare nel contesto normativo EHDS/GDPR. È già utilizzata da ospedali, autorità sanitarie e centri di ricerca clinica per:

  • Generare coorti sintetiche per studi di Real-World Evidence e trial clinici
  • Condividere dati tra istituzioni senza trasferire dati personali
  • Accelerare l’accesso ai dati per studi osservazionali e analisi epidemiologiche.

Parla con un nostro esperto oppure esplora i casi d’uso in sanità.

Unisciti a noi

Vuoi saperne di più o lavorare con noi? Saremo felici di sentirti.