La domanda di dati aperti parlamentari

Da dati.parlamento.

La domanda di dati aperti parlamentari

Questo capitolo evidenzia i principali aspetti legati alla domanda di dati parlamentari. Il capitolo raccoglie le impressioni e i suggerimenti di riutilizzattori di dati parlamentari, ricercatori, esperti e communities di open data raccolti nel corso di una serie di audizioni informali, tenute presso i Servizi Informatica di Camera e Senato.

Il riutilizzo di dati parlamentari: opportunità e aspetti critici

Metriche e confronti

Come è stato evidenziato da soggetti ri-utilizzatori di dati parlamentari in accordo con la loro esperienza diretta, un momento chiave nel processo di valorizzazione e riutilizzo è costituito dalla 'traduzione' della mole di dati disponibili attraverso metriche accessibili agli utenti e organi di informazione, aspetto determinante al fine di consentire confronti e comparazioni dotate di oggettività. Come nel caso dei dati relativi alla partecipazione dei parlamentari alle votazioni, veicolati ad esempio dal progetto Open Parlamento dell'associazione Open Polis – a partire da dati messi a disposizione Camera e Senato – ed illustrati nel dossier Indice di Produttività Parlamentare, esistono criticità nel passaggio dal dato pubblicamente accessibile al dato pubblicato a valle, le quali si sostanziano nella forma di un "trade-off". Infatti, la semplice esposizione di dati grezzi al fine, ad esempio, di permettere di valutare la produttività dei parlamentari assicura, da un lato, una certa oggettività, ma rischia di consentire valutazioni solo parziali, e/o, di influenzare il comportamento dei parlamentari al fine di migliorare il proprio "posizionamento" secondo uno specifico criterio. Al tempo stesso, la creazione di indici complessi di valutazione dell'attività parlamentare rischia di influenzare il giudizio "a monte".

Dati real time

La disponibilità di dati grezzi rappresenta un elemento prezioso per riequilibrare l'asimmetria informativa tra cittadini e istituzioni. A tal fine, pare necessaria l'attività di soggetti che elaborino tali dati - solitamente complessi - al fine da renderli comprensibili ad una fascia più larga di cittadini interessati. Dal momento poi che lo scopo di un riutilizzatore potrebbe essere quello di fornire servizi di aggiornamento in tempo reale, reperire dati tempestivamente (quando non - appunto - in tempo reale) diviene un prerequisito indispensabile per il funzionamento del servizio stesso. Ciononostante, le versioni ufficiali alcuni dei dati generati dal Parlamento non vengono messi a disposizione in tempo reale per questioni burocratico/formali. È il caso, ad esempio, del dettaglio delle votazioni parlamentari, immediatamente disponibili (in HTML), ma convalidati ufficialmente solo dopo il termine della seduta.

"Open Community Data"

L'apertura del dato, che di per sé costituisce il culmine di una serie di attività interne da parte del suo detentore, rappresenta per il potenziale riutilizzatore l'inizio di un processo fatto di condivisione e dialogo e non dovrebbe restare un evento una tantum di cui poi disinteressarsi: nel momento in cui soggetti terzi riutilizzano un dato, infatti, si apre una forma di interlocuzione tra chi lo ha messo a disposizione e chi ne fruisce a valle, potenzialmente in grado di determinare ricadute positive per la stessa amministrazione pubblica (come nel caso di rilevamento di errori o di raffinazione del dato; il quale, proprio perché messo in condizioni di circolare, può ritornare in tale nuova veste nella disponibilità della P.A.). In questo senso, allora, e dal momento che il dato 'perfetto' non esiste, il riutilizzo dei dati costituisce anche e soprattutto uno strumento distribuito per migliorarne la qualità e depurarlo da possibili errori.

Condivisione e dialogo: un processo stabile

Nella pratica, alcuni riutilizzatori di dati aperti hanno effettivamente allacciato un dialogo informale con le istituzioni parlamentari; questo, se da un lato agevola evidentemente l'auspicabile coinvolgimento tra i vari attori di open data, può dall'altro prestare il fianco a potenziali critiche da parte di altri riutilizzatori che non avessero a beneficiare dei medesimi canali comunicativi. Pertanto, per aumentare la trasparenza e garantire le medesime opportunità di interlocuzione a tutti i possibili riutilizzatori, pare auspicabile individuare modalità operative che istituiscano processi di coinvolgimento ampio tra chi pubblica i dati e chi li riutilizza; negli Stati Uniti, ad esempio, la House of Representatives del Congresso organizza specifici momenti di incontro tra stakeholders e soggetti di volta in volta interessati. Analoghi meccanismi virtuosi di collaborazione sarebbero opportuni al fine di espandere il patrimonio di asset relazionali (banalmente, ad esempio, abilitando uno spazio per la segnalazione di errori a fianco dei dataset scaricabili). Lo sforzo dovrebbe essere quindi volto a favorire processi culturali che innovino le modalità di partecipazione ai processi governativi, ragionando non solo in termini di Open Government Data, ma anche di Open Community Data: pensare cioè al pubblico come ad una comunità, promuovendo un processo dialettico tra soggetti pubblici e privati che conduca ad affiancare ai dati pubblici dati dati provenienti da altre fonti. In Italia stanno ad esempio emergendo forme di iniziativa privata, come Monithon, che divulgano i dati aperti presso scuole e cittadinanza in modo da 'vivificare' il dato, portandolo direttamente all'interno della comunità (ad esempio, per trovare riscontro su come siano state impiegate le risorse investite in un'opera pubblica e che effetto essa abbia prodotto secondo la percezione dei cittadini).


Le priorità per i riutilizzatori specializzati in dati parlamentari

Desiderata


Nelle preferenze di quanti già riutilizzano e diffondono i dati parlamentari attualmente disponibili, sarebbe auspicabile poi che si aprissero anche ulteriori tipologie di dati, in particolare:

  • Dati relativi ai lavori delle Commissioni. Di una parte rilevante del processo e delle attività delle Commissioni non si riescono a reperire dati (ad esempio sulle presenze e votazioni). La difficoltà maggiore consiste nel fatto che in Commissione non è previsto il voto elettronico: si procede al voto per alzata di mano e viene redatto un verbale rispetto al totale di voti favorevoli e contrari, senza che si registri chi abbia singolarmente votato a favore o contro. All'esterno pervengono soltanto delle ricostruzioni giornalistiche, con inevitabili ricadute in termini di trasparenza e accountability complessive. Spesso si giustifica la mancata disponibilità di questo tipo di dati in ragione del fatto che la Commissione rappresenta tipicamente il luogo della mediazione e che quindi ragioni di opportunità suggerirebbero una certa cautela nella diffusione di informazioni; del resto, non si intenderebbe ovviamente pervenire all'estremo opposto, prevedendo forme di documentazione pervicaci come un resoconto stenografico o una diretta streaming, ma piuttosto rendere conoscibile chi siano i presenti e come votino. Questo tipo di informazione non dovrebbe di per sé perturbare il normale andamento delle scelte e del dialogo politico. Anche per questa tipologia sarebbe auspicabile ottenere dati aperti tempestivi (ad esempio sugli ordini del giorno, sui lavori e sulla programmazione).
  • Dati sul funzionamento della 'macchina' istituzionale. In particolare, bilanci e risorse utilizzate nell'amministrazione: entrate, spese, rendicontazioni dei gruppi parlamentari, fino ad arrivare eventualmente alla dichiarazione patrimoniale dei parlamentari. Quest'ultimo dato è già disponibile online, ma esiste una barriera rappresentata dal formato in cui esso viene di solito raccolto e prodotto: tipicamente, la scansione in PDF. Dal momento che lo scopo della pubblicazione è quello di stimolare la trasparenza e la conoscenza mediante la circolazione dell'informazione, tale scopo rischia di vanificarsi se i dati diventano sostanzialmente improcessabili per via di un formato chiuso (il quale rende oltretutto costoso superare gli ostacoli tecnici inerenti alla sua più difficoltosa fruizione). Attualmente esistono dichiarazioni sullo stato patrimoniale che possono aiutare l'analisi; in questo senso, lo standard potrebbe essere quello previsto per la dichiarazione dei redditi e per il bollettino patrimoniale.
  • Dati informativi a disposizione di Camera e Senato. Ad esempio, i dati raccolti dai Servizi Studi e dall'Ufficio Parlamentare di Bilancio, che attua il controllo sul bilancio dello Stato. Sarebbe utile che i report e le analisi messe a disposizione dei parlamentari fossero accessibili anche ai cittadini; come pure che i dati su cui essi si basano fossero aperti e rielaborabili da soggetti terzi. Il materiale informativo a supporto delle audizioni è attualmente messo a disposizione in formato PDF (i dossier di documentazione sono disponibili sui siti della Camera e del Senato) e di recente è stata introdotta una modalità partecipativa, rispetto ai lavori in Commissione, nella forma di invio via mail di contributi e proposte da parte dei cittadini le quali, qualora ritenute meritevoli, sono pubblicate online ed entrano a far parte del materiale informativo. Esiste comunque, rispetto a questa tipologia di materiali informativi, una sorta di 'zona grigia' legata al fatto che alcuni di essi vengono realizzati anche mediante contributi esterni; in tali casi, se anche il prodotto del servizio studi risulta di per sé un dato pubblico, il grado di apertura effettivo rischia di essere ridimensionato (o quanto meno di risultare incerto, in assenza di un processo di right clearance reso esplicito da parte degli uffici parlamentari) per via dello status giuridico rispetto agli apporti di terzi esterni, sui quali potrebbero insistere alcune restrizioni previste dalla normativa del diritto d'autore.

Si ravvisa inoltre l'utilità di realizzare un sistema di monitoraggio dell'effettiva attuazione delle norme. Il Parlamento potrebbe assumere una funzione informativa rispetto a quanto accade dopo che le norme sono state pubblicate nella Gazzetta Ufficiale; l'organo istituzionale demandato alla produzione normativa verrebbe cioè a monitorare anche questo aspetto (esistono peraltro uffici della Camera, del Senato e del Governo che in parte già si occupano di rilevare lo stato di effettiva attuazione delle norme). Si tratta forse di un'attività di tipo più che altro amministrativo, riguardando normative secondarie (ad es., decreti attuativi), ma sarebbe comunque auspicabile un coinvolgimento del parlamento stesso all'interno di un tale sistema.

Dichiarazione sull'apertura parlamentare

Tra i soggetti che maggiormente promuovono l'apertura e il riutilizzo dei dati parlamentari, un ruolo di primo piano viene ricoperto dalle c.d. Parliamentary Monitoring Organizations (PMO). In particolare, tra le iniziative concrete di maggior rilievo da esse promosse a livello globale, è doveroso menzionare la Declaration on Parliamentary Openness: lanciata nel corso della World e-Parliament Conference - svoltasi a Roma nel 2012 - ad opera di OpeningParliament.org (il forum che riunisce organizzazioni specializzate in monitoraggio parlamentare provenienti da tutto il mondo), la Dichiarazione sull'apertura parlamentare si rivolge a parlamenti nazionali ed organi legislativi sub-nazionali e transnazionali sollecitandoli ad assumere impegni concreti per l’apertura dei dati in loro possesso e a promuovere forme di partecipazione e confronto con i cittadini.

Si noti infine come l'importanza della disponibilità di dati parlamentari in formato open e machine readable sia stata ribadita anche dal National Democratic Institute e dal World Bank Institute all'interno di una survey congiunta, Strengthening Parliamentary Accountability, Citizen Engagement and Access to Information, che già nel 2011 documentava l'impiego di Parliamentary informatics presso il 40% circa delle PMO in tutto il mondo.


Le indicazioni di ricercatori e "communities"

Interoperabilità semantica

Interoperabilità semantica e ontologie

Oggetto di riflessione tra quanti svolgono attività di studio e ricerca sul tema degli open data risultano essere in particolare gli aspetti connessi all'interoperabilità semantica, descritta all'interno dell'European Interoperability Framework for European Public Services come la possibilità di elaborare informazioni da fonti esterne o secondarie senza perdere il reale significato delle informazioni stesse nel processo di elaborazione. In effetti, generalmente gli enti pubblici (e privati) si trovano a gestire basi di dati in primis quale naturale conseguenza della rispettiva funzione istituzionalmente svolta ed eventualmente come supporto interno alle proprie attività; per questo è comprensibile che, qualora essi decidano di aprire i propri dati al riutilizzo da parte di terzi, non abbiano sempre una chiara percezione della precipua potenzialità degli open data – ovvero, appunto, che dati pubblicati da un determinato soggetto vengano incrociati con dati provenienti da altre fonti – e di conseguenza non ci si operi per agevolarla dal punto di vista tecnico. Tuttavia, l'interoperabilità semantica tra dati di provenienza differente costituisce un ingrediente fondamentale se si intende mettere gli utenti in condizione di fruire appieno dei contenuti (appunto, i dati) pubblicati in modalità aperta sul proprio sito web: se si ambisce cioè a pubblicare open data di qualità, e considerando che imprese, utenti e cittadini riutilizzatori attingono ad informazioni rispetto a svariati contesti pubblicate su siti web differenti, i dati in nostro possesso e quelli in possesso di altri soggetti non devono rimanere tecnicamente costretti all'interno di silos separati, incapaci di comunicare tra loro. Al fine di raggiungere questo particolare tipo di interoperabilità, sarebbe pertanto opportuno che all'atto della pubblicazione dei dati si associasse sempre un'ontologia, la quale consiste nella rappresentazione formale e condivisa che descrive i dati attribuendo un significato univoco ai concetti da loro espressi ed alle relazioni che caratterizzano il pertinente dominio di conoscenza.


Formati e qualità dei dati

Linked Open Data e coinvolgimento degli utenti

I rappresentanti di communità Open Data con i quali ci si è confrontati rimarcano pressoché all'unisono la centralità dell'impiego di Linked Open Data ai fine di abilitare appieno le potenzialità che i dati aperti sono capaci di generare, pur riconoscendo la complessità intrinseca al modello e la sua non immediata fruibilità da parte di qualsiasi utente (trattandosi pur sempre di un linguaggio "macchina-macchina"). Essi pongono inoltre l'accento sull'importanza di coinvolgere gli utenti finali quanto più possibile attraverso mezzi e forme di partecipazione diretta o indiretta come, ad esempio: strumenti per maneggiare i linked data (quali vocabolari e ontologie descrittive dei dataset); esempi, tutorial, visualizzazioni e altri materiali divulgativi per includere nel circolo virtuoso abilitato dai dati aperti anche quanti non fossero in possesso di cognizioni tecniche approfondite; iniziative, come hackathon e storytelling, per diffondere presso un pubblico ampio lo stato dell'arte dell'apertura dei propri dati; aggregazione di una comunità di utenti vera e propria attorno al proprio modello di linked Open Data (abilitando contesti entro i quali raccogliere gruppi di discussione fornendo stimoli alla comunità che li regge - similmente, ad esempio, a quanto fatto dal consorzio W3C per promuovere l'utilizzo e la conoscenza rispetto agli standard tecnici da esso realizzati per il World Wide Web).

Attorno a questi due filoni principali, le communities promotrici dei dati aperti si sono fatte portavoce, nel corso delle interviste, di alcune esigenze e opportunità specifiche. In particolare:

  • l'esigenza di completezza nella tracciabilità del dato. La non completezza nella tracciabilità del dato sulla produzione legislativa e nella ricostruzione dei vari stadi di produzione di esso può, infatti, rendere opaca tanto la provenienza del dato finale quanto la catena di passaggi che ne ha scandito i diversi stadi di produzione. Utilizzare standard di rappresentazione dei dati, ontologie e semantiche condivise per tutta la produzione dei dati sull'iter legislativo diventa quindi essenziale se si vuole non solo rendere fruibile il dato sul provvedimento legislativo così come promulgato, ma anche abilitare la conoscibilità e comprensione di tutta una serie di aspetti rilevanti circa l'inter legislativo sottostante: ad esempio, dove e in che modo un dato emendamento sia andato ad incidere sulla norma finale oppure quale parlamentare abbia proposto detto emendamento, in modo da tracciare in concreto gli effetti dell'azione parlamentare sulla produzione normativa. Peraltro, bisogna tenere presente come la catena di tracciabilità dell'attività legislativa sia altamente condizionata dall'andamento dei lavori parlamentari e dalle diverse attività parlamentari. Mentre infatti i percorsi parlamentari per così dire “classici” sono quelli che meglio si prestano ad essere tracciati, in alcuni momenti può capitare che essi vengano marginalizzati dalla contingente situazione politica: si è riscontrato infatti che le proposte di legge ad iniziativa parlamentare rimangano ferme mentre vengono portati avanti disegni di legge promossi dal Governo, che l'attività emendativa nasconda - in alcuni casi - finalità ostruzionistiche e che e l'iter si interrompa quando venga posta una questione di fiducia (con l'effetto oltretutto che i maxi-emendamenti prodottisi facciano perdere traccia del legame con l'emendamento originario). Inoltre, in caso di legislazione delegata, le Commissioni parlamentari sono in grado di intervenire solamente esprimendo un rapido parere. Questi aspetti non devono essere trascurati e vanno pure tenuti in considerazione, in quanto forniscono un correttivo laddove ci si accinga a leggere ed interpretare i dati sulla produzione legislativa.
  • l'esigenza di ridurre le difficoltà inerenti all'integrazione di dati espressi in formato eterogeneo. Un approccio pragmatico consisterebbe nella definizione di una semantica unica, costruita a partire dall'osservazione dei dati stessi o dall'analisi automatica dei loro contenuti (eventualmente per mezzo di tecniche di processamento del linguaggio naturale o statistiche sulla frequenza delle parole). Il fine sarebbe quello della realizzazione di un'ontologia unica e ben documentata del processo legislativo delle due camere, comprendente i termini usati e la loro semantica (ad esempio, cosa significhi “atto” presso la Camera e presso il Senato; se il termine “accorpamento” abbia un significato analogo ad “assorbimento”? etc.); da accompagnarsi alla creazione di URI condivisi per le diverse triple RDF e la previsione di un ID unico per ogni disegno di legge nei due rami del Parlamento. Si potrebbe inoltre valutare l'adozione dello standard di rappresentazione XML Akoma Ntoso per tutti i documenti di Camera e Senato. Da ultimo, potrebbe essere utile anche offrire strumenti di visualizzazione che forniscano un modello di verifica a chi intende ri-utilizzare i dati.
  • l'opportunità di aumentare l'efficacia ed efficienza degli uffici tecnici del Parlamento nello svolgere le proprie attività. Le tecnologie Linked Open Data rappresentano un'opportunità interna di razionalizazione delle risorse umane e tecnologiche; ciò può avvenire, ad esempio, offrendo ai Servizi Studi di Camera e Senato, alle segreterie e alle Commissioni strumenti conoscitivi basati su panorama dei dati aperti disponibili, necessari o rilevanti per l'esercizio delle rispettive funzioni. A tale fine si rende però necessario gestire un processo coordinato per la definizione e scelta di vocabolari, ontologie, thesauri condivisi che siano alla base dei modelli espositivi delle entità rappresentate nei dati, tanto a fini conoscitivi connessi con l'attività parlamentare quanto a fini di riutilizzo dei dati da parte dei cittadini. Inoltre, realizzare uno storytelling rispetto ai flussi di uso interno di dati.camera e dati.senato potrebbe aiutare a coglierne il potenziale, esprimerlo all'esterno ed accrescerne la consapevolezza presso i vari livelli dell'amministrazione.
  • l'opportunità di amplificare la conoscibilità delle iniziative open data di Camera e Senato già intraprese. Un'iniziativa potrebbe essere rappresentata da una "Scuola Open Data" di Camera e Senato che educhi gli utenti rispetto a quel che significhi e comporti manipolare dati aperti; oppure si potrebbe accompagnare la componente contenutistica - rappresentata dai dati pubblicati da Camera e Senato - con una componente formativa che a cadenza quotidiana o periodica provveda a fornire agli utenti informazioni e spunti su come si possano riutilizzare i dati.


Altri dati

Dati sul bilancio del Parlamento

La comunità ha infine manifestato le proprie preferenze rispetto all'apertura, in via prioritaria, di ulteriori tipologie di dati, (alcune anche non di stretta competenza del Parlamento, come i dati territoriali/ambientali e sul rischio di emergenze meteo, i dati del catasto e i dati sui beni culturali). In particolare, si è fatto notare come alcuni tra i primi dataset in formato Linked Open Data ad apparire in Italia, già nel 2011, furono quelli pubblicati nel contesto dell'iniziativa Linked Open Camera, promossa dall'Associazione Linked Open Data Italia e realizzata partendo dalla base dati relativa al bilancio della Camera messa a disposizione dal Partito Radicale. Pur riferendosi ad un contesto che ha già sperimentato la spinta di iniziative dal basso, sarebbe non di meno auspicabile che a curare la pubblicazione di questo tipo di dati provvedessero direttamente Camera e Senato, eventualmente nella forma di un bilancio Linked Open Data unitario del Parlamento, esponendo i dati di budget delle rispettive camere. Se, da un lato, l'iniziativa in sé rappresenterebbe un segnale pratico di contrasto alla sfiducia nella politica mediante un'azione di trasparenza da parte della politica stessa (in questo assumendo pure una valenza simbolica di indubbio peso), dall'altro essa abiliterebbe anche il coinvolgimento di competenze esterne, aprendo alla possibilità di individuare per questo ed altri contesti forme di progetti pilota di tipo politico-tecnologico.