Eleonora Caronia – CEO di SPS – analizza una tensione decisiva, legata alla disponibilità dei dati. Per il futuro sarà una volta di più fondamentale l’equilibrio tra dato sintetico e realtà osservabile
Negli ultimi anni abbiamo assistito a un’accelerazione impressionante dell’intelligenza artificiale. Modelli sempre più sofisticati, applicazioni sempre più pervasive, risultati che fino a poco tempo fa sembravano fuori portata. Ma Eleonora Caronia, da osservatrice privilegiata – e nel suo ruolo di CEO di SPS – vede emergere con chiarezza una tensione meno visibile, ma decisiva: quella legata alla disponibilità dei dati.
Non si tratta di una carenza assoluta. I dati continuano a essere generati in quantità enormi ogni giorno. Il problema riguarda piuttosto la loro utilizzabilità: dati di qualità, accessibili, utilizzabili nel rispetto delle normative e della privacy. In molti ambiti, soprattutto quelli più sensibili, questi dati semplicemente non sono sufficienti. Ed è proprio qui che sta emergendo una delle trasformazioni più profonde – e ancora poco raccontate – del mondo dell’AI: l’uso dei dati sintetici. «I dati sintetici sono informazioni generate artificialmente da modelli di intelligenza artificiale. Non sono copie dei dati reali, ma rappresentazioni che ne replicano le caratteristiche statistiche. In altre parole, invece di osservare il mondo per raccogliere dati, iniziamo a costruire mondi plausibili in cui quei dati esistono» – spiega Eleonora Caronia.

Il ruolo dei dati sintetici
Questo passaggio introduce un paradosso affascinante. L’intelligenza artificiale, che finora ha imparato dalla realtà, inizia progressivamente a imparare da sé stessa. I modelli generano dati, che vengono utilizzati per addestrare nuovi modelli, che a loro volta producono altri dati. Si crea così un ciclo chiuso: potenzialmente molto efficiente, ma anche fragile. In SPS si osserva con attenzione questo fenomeno, perché se il legame con la realtà si indebolisce, il rischio è quello di una progressiva degradazione della qualità. Alcuni parlano già di “collasso del modello”.
Uno dei grandi vantaggi attribuiti ai dati sintetici è la possibilità di superare i limiti imposti dalla privacy. Se i dati non appartengono a persone reali, il problema sembrerebbe risolto. Tuttavia, la questione è più complessa. La capacità dei modelli di ricostruire pattern realistici solleva interrogativi su quanto questi dati siano davvero anonimi. Il rischio non è tanto una violazione diretta, quanto una zona grigia in cui la sicurezza è percepita più che garantita. Ed è proprio su questo terreno che realtà come SPS stanno lavorando: costruire metodologie che rendano i dati sintetici non solo utili, ma anche verificabili e affidabili.

Nuove sfide, nuovi modelli
Nel frattempo, si sta delineando una trasformazione economica profonda. Se i dati possono essere generati, il loro valore cambia natura. Non sarà più fondamentale possedere grandi quantità di dati reali, ma saper costruire dataset efficaci, coerenti e utili allo scopo. Il vantaggio competitivo si sposta dalla raccolta alla generazione. E questo apre la strada a nuovi attori, nuove competenze e nuovi modelli di business – un’evoluzione che SPS sta già vivendo in prima linea.
«Le applicazioni concrete sono numerose. In ambito sanitario, i dati sintetici permettono di addestrare modelli senza esporre informazioni sensibili. Nel settore finanziario, consentono di simulare scenari di frode difficilmente osservabili nella realtà. Nell’automotive, rendono possibile addestrare sistemi di guida autonoma su eventi rari o pericolosi» – sottolinea Eleonora Caronia – «In tutti questi casi, il dato sintetico non è un ripiego, ma una soluzione spesso più efficace del dato reale».
Eppure, proprio qui emerge il rischio più sottile. Se l’intelligenza artificiale si nutre sempre più di dati sintetici, la sua rappresentazione del mondo potrebbe diventare progressivamente una simulazione. Una simulazione coerente, credibile, perfino utile, ma non necessariamente aderente alla realtà. Il problema non sarebbe tanto l’errore evidente, quanto quello invisibile: decisioni prese su basi plausibili ma distorte. Per anni abbiamo detto che i dati erano il nuovo petrolio. Oggi questa affermazione è incompleta. Il vero valore non risiede più nella quantità di dati disponibili, ma nella capacità di generare dati che funzionano – anche quando quei dati non sono mai esistiti. E qui cambia anche la domanda fondamentale: non più se abbiamo abbastanza dati, ma se possiamo fidarci dei dati che creiamo.
La variabile decisiva sarà una sola: quanto resterà forte il collegamento tra dato sintetico e realtà osservabile. Più quel legame sarà misurato, verificato e governato, più i dati sintetici saranno una risorsa strategica. Se invece diventeranno autoreferenziali, il rischio è avere intelligenze artificiali sempre più sofisticate, ma sempre meno affidabili.


