Dai documenti agli Open Data

Oltre la digitalizzazione dei testi per amministrazioni e aziende

L’urgenza di applicare misure orientate a contenere la diffusione del Covid19, ha reso evidente la necessità di una comunicazione trasparente e immediata tra istituzioni e cittadini.

Tra i servizi interrotti durante la crisi sanitaria, però, c’è stato anche l’accesso documentale civico generalizzato, introdotto nel 2016 con il Freedom Of Information Act (FOIA). Diffuso in oltre 100 paesi nel mondo, il FOIA garantisce il diritto di accesso alle informazioni in possesso alle pubbliche amministrazioni.

Ma il decreto legge Cura Italia ha sospeso, tra la metà di aprile e la fine di maggio, le risposte a quelle richieste che non avevano carattere di “indifferibilità e urgenza”.

Oltre la digitalizzazione

Eppure negli ultimi anni sono molti gli strumenti nati per facilita- re l’accesso alle informazioni digitalizzate, non solo quelle strutturate all’interno di database, ma anche quelle non strutturate contenute all’interno di documenti, ovvero dati testuali.

SemplicePA è una piattaforma di analisi linguistica che nasce per individuare, estrarre e rendere disponibile l’enorme patrimonio di conoscenza presente nei documenti della pubblica amministrazione. La piattaforma, curata dall’azienda Eti3 in strettissima collaborazione con il dipartimento di Filologia, Letteratura e Linguistica dell’Università di Pisa, è già utilizzata da enti come il Comune di Milano, il Comune di Palermo e la Regione Umbria.

Lo scopo di SemplicePA è di rendere fruibili tutte le informazioni che sono formalmente in possesso degli enti locali, ma non sostanzialmente disponibili né ad utenti interni, come gli amministratori e i dipendenti pubblici, né a quelli esterni, ovvero i cittadini. Si tratta di informazioni presenti nei documenti detenuti dall’amministrazione come delibere, determine, bandi, relazioni, lettere, comunicati e rassegne stampa, testi che spesso possono essere ricercati solo nel caso in cui se ne conosca il contenuto o la data di pubblicazione: open data, dati pubblici, che però non sono realmente aperti a tutti i cittadini.

Uno strumento per amministrazioni e imprese

La piattaforma è utile anche alle piccole, grandi e medie imprese, perché può fornire loro un accesso facilitato e tempestivo a bandi di gara, ai nuovi regolamenti come quelli che hanno interessato le attività commerciali durante il lockdown, e a sussidi alle aziende, fondamentali per la ripresa economica.

Ma in che modo? Il core di SemplicePA è un motore di ricerca semantico che sfrutta algoritmi di intelligenza artificiale per il trattamento automatico del linguaggio. Questi algoritmi estraggono non solo metadati generici come nomi di persona, luoghi e indirizzi, ma anche informazioni più strettamente connesse al dominio amministrativo, come i riferimenti agli atti, partite iva, importi e nomi di azienda. In questo modo la piattaforma per- mette ad esempio di consultare gli atti collegandoli ai riferimenti normativi citati, o di accedere con facilità a tutti i documenti che citano una certa azienda.

I documenti sono organizzati all’interno della piattaforma anche in base all’argomento trattato. Ciò è possibile attraverso un approccio ibrido, basato sia su algoritmi statistici di topic modeling, sia grazie all’utilizzo di un’ontologia realizzata in maniera semiautomatica, specifica per l’ambito dei settori di competenza degli enti pubblici, che vanta al suo interno circa 5000 termini legati da relazioni semantiche di vario genere.

Trasparenza e Fake News

L’accesso diretto agli atti amministrativi, alle ordinanze e alle de- libere, infine, costituisce un’importante risorsa anche per il fact-checking, ovvero per attestare la veridicità delle notizie diffuse in rete. SemplicePA può quindi divenire un punto di riferimento per tanti cittadini, offrendo un valido contributo contro la diffusione di fake news.

Conclusione

Anche lontano dalle emergenze, l’istituzione di una fonte informativa ufficiale aggiornata in tempo reale assume una doppia valenza. Da un lato i cittadini e le imprese possono ricercare informazioni e accedere ai testi con facilità. Dall’altro, alle istituzioni viene messo a disposizione uno strumento in grado di monitorare l’attività amministrativa, anche nel rispetto delle norme di trasparenza e anticorruzione. Le tecniche di intelligenza artificiale, applicate al trattamento automatico del linguaggio, oggi possono fornire strumenti in grado di valorizzare il patrimonio documentale della pubblica amministrazione, semplicemente rendendolo accessibile.

Cos’è un motore di ricerca semantico

L’obiettivo principale di un motore di ricerca semantico è quello di superare le ambiguità del lessico. Questi motori di ricerca organizzano i termini all’interno di ontologie, raggruppando quei termini che sono in qualche maniera collegati in modo da poter distinguere, ad esempio nei casi di omonimia, a cosa un certo utente si stia realmente riferendo: nella frase “come iscrivo mio figlio all’asilo?”, la parola asilo non si riferirà certo ad asilo politico. Il contesto nel quale un termine è stato inserito in una query di ricerca, dunque, consente di associarlo alla corretta categoria e quindi fornire la risposta più rilevante.

Rimani sempre aggiornato

Iscriviti alla newsletter e non perderti nessun articolo in uscita

Iscrivimi

Tipiace la rivista?

Abbonati subito!

Scegli tra diversi tipi di abbonamento quello più adatto a te e ricevi tutte le uscite di Tecnologia&Innovazione.

Abbonati ora

Scopri di più

Potrebbe interessarti anche…

No Results Found

The page you requested could not be found. Try refining your search, or use the navigation above to locate the post.

No Results Found

The page you requested could not be found. Try refining your search, or use the navigation above to locate the post.

No Results Found

The page you requested could not be found. Try refining your search, or use the navigation above to locate the post.