Pagine

giovedì 4 ottobre 2012

I dati geografici liberi ed i Geoportali

Si parla tanto di Open Data e naturalmente il mio interesse è rivolto principalmente a quella tipologia di dati liberi cui sono particolarmente affezionato, gli Open Data Geografici.

Qualche mese fa mi sono iscritto all'associazione OpenGeoData Italia e ne sto seguendo con interesse le iniziative, apprezzando il lavoro che Giovanni Biallo svolge per "stimolare" i referenti degli enti pubblici che producono cartografia a liberare i propri dati. Ho voluto supportare l'associazione perché secondo me serve a gettare oggi le basi per creare le opportunità di domani.

Siccome non siamo qui a smacchiare i leopardi, infatti, ci siamo già dati da fare su questo tema, preparandoci a quanto accadrà nel prossimo futuro, quando saranno finalmente numerosi gli enti che avranno liberalizzato l'uso dei dati.

I dati, e più in generale l'informazione geografica condivisa dalle Infrastrutture di Dati Territoriali (IDT), infatti, possono arricchire il patrimonio che i cataloghi di Open Data rendono accessibile.
Ne parlavo alla conferenza AMFM la scorsa settimana: sempre più spesso ormai vediamo amministrazioni regionali, provinciali o altri enti che mettono a disposizione contemporaneamente Geoportale e Portale di Dati Open.

Il primo, il Geoportale, serve a rendere accessibile l'informazione territoriale che è essenziale per contestualizzare tantissime altre informazioni. Prendiamo l'ultimo portale pubblicato, quello dei dati liberi del Comune di Milano: mentre scrivo gli ultimi dati resi disponibili sono quelli relativi alle zone a traffico limitato, quelli delle linee e delle fermate della metropolitana. Non è un caso: i dati più scaricati statisticamente in questi portali di dati liberi sono sempre quelli di tipo geografico.

Il secondo, il Portale di Dati Open, rappresenta un punto d'accesso alle informazioni che l'Ente mette a disposizione che ha una portata ed un potenziale decisamente più ampi, perché non limitata ai soli addetti ai lavori.

Che succede però: che se c'è un dato territoriale con una licenza d'uso che ne libera l'utilizzo, io voglio poterlo trovare in entrambi i posti: nel geoportale e nel catalogo degli open data dell'ente, e voglio essere certo che sia lo stesso dato, senza il rischio di trovarlo aggiornato solo da una parte o dall'altra.
Per evitare duplicazioni e problemi di disallineamento, ecco che vengono in nostro soccorso i servizi: poiché la stragrande maggioranza dei Geoportali oggi sono stati educati da INSPIRE a ragionare in una logica SOA, orientata ai servizi, è sufficiente che un webservice conforme agli standard definiti dall'OGC, erogato dal mio Geoportale, si preoccupi di aggiornare periodicamente le informazioni territoriali contenute nel Portale dei Dati Open.
Così si fa contenta INSPIRE, che dal 2007 si sgola predicando che il dato dev'essere manutenuto ed aggiornato là dove viene prodotto, e si semplifica la vita al cittadino che saprà di trovare in forma di open data un'informazione sempre aggiornata.

Vogliamo però fare un ulteriore passo avanti?

Non è così complicato, dài. Una volta che mi sono scaricato l'informazione delle linee della Metro di Milano, devo sapere come usarla. Devo avere un software GIS, probabilmente, se voglio incrociare queste informazioni con quelle relative alle zone a traffico limitato ed altre, per capire fin dove posso spingermi con la macchina prima di parcheggiarla e proseguire con la metro.E quest'analisi la devo fare manualmente.

Evidentemente, quel dato, quando va bene, è un dato soltanto a 3 stelle. 

Il numero di stelle, nella classificazione di Tim Berners-Lee, va da 1 a 5. Qui questo concetto è spiegato molto bene. 
Se quel dato fosse a 5 stelle, e quindi oltre ad essere libero ed accessibile via Web fosse anche strutturato, in un formato standard e aperto come il RDF (si, lo so che non è un formato vero e proprio, ma è per capirci), e contenesse i collegamenti ad altri dati, ecco che sarebbe un bel Linked Open Data, geografico, insomma: un GeoLOD

I collegamenti che vogliamo trovare nei LOD sono quelli che ci permettono di "saltare" da un dataset all'altro.Questo approccio al Web Semantico, che mira a rendere le informazioni utilizzabili mediante interrogazioni ed interpretazioni automatiche, è spiegato molto bene su linkedopendata.it. In sostanza, se i nostri dati geografici sono disponibili come Linked Open Data, possiamo far si che vengano elaborati automaticamente da una macchina (ad esempio uno smartphone) senza bisogno di intervenire manualmente. 

Introdurre la dimensione semantica nei dati geografici, passando da OpenData a Linked Open Data, crea quindi un enorme valore aggiunto determinato dalla possibilità di collegare l'informazione territoriale, che è spesso essenziale a definire il contesto di altri dati, alle innumerevoli informazioni esistenti nella "nuvola" dei Linked Open Data ("LOD Cloud").

A questo punto devo fare un esempio per capirci definitivamente (chi ha seguito qualche mio intervento recente lo conosce già).

Cosa posso fare con gli strati relativi ai layer degli Edifici e delle Strade di un Database Topografico in formato Linked Open Data? Se riesco a far parlare queste informazioni con i dati relativi alla posizione del sole nei vari giorni dell'anno, e riesco ad incrociarle con le informazioni sul traffico e la disponibilità di posti auto, posso realizzare un piccolo sogno: creare l'APP per smartphone che mi dica dove parcheggiare la mia macchina affinché, quando la andrò a riprendere ...si trovi all'ombra.

Capito?

Non sono io che faccio complesse analisi spaziali: le fa lo smartphone, incrociando dati ed informazioni, elaborandole automaticamente, collegandosi a dataset ed archivi sparsi in giro per il Web, ecc. Sfruttando i Linked Open Data.

Perché ciò sia realizzabile, bisogna naturalmente lavorare sulla semantica dei dati. Definire le ontologie, trovare un "vocabolario" comune. Questo è un bel lavoro che qualcuno ha già iniziato a fare, ed al quale nei prossimi anni dovremo contribuire.

Nel frattempo chi volesse approfondire il tema può seguire i seminari on-line che il mio amico Alfredo sta tenendo sul tema dei Linked Open Data Geografici.

La prima parte del webinar ""I geoportali e gli open data geografici si è già tenuta e si può rivedere qui. La seconda parte si terrà il prossimo martedì 16 ottobre alle 12,00 e si approfondirà il tema "I Linked Open Data, le metodologie". Per iscriverti clicca qui

Qui sotto invece ci sono le slides che ho usato durante il mio intervento su questo tema, durante la conferenza AMFM della scorsa settimana.