L’integrazione di dati (Data Integration) è quasi sempre collegata alle attivita di dispiegamento delle soluzioni. Si tratta di un processo indispensabile nei progetti che prevedono un quadro di conoscenze esteso, attraverso la messa a regime di informazioni memorizzate da diverse aree gestionali, spesso dovendo superare barriere tecnologiche o infrastrutturali.
In termini generali, si tratta dell’impiego sistematico di metodologie finalizzate all’ottenimento di valore informativo, tale valore si ottiene attraverso l’elaborazione di più livelli informativi sia di tipo geografico (vector e raster) sia di tipo alfanumerico (database, indicatori, files multiformato ecc.).
Spesso si usano termini quali “incrocio di dati” ma l’obiettivo rimane in ogni caso legato alla produzione di nuova conoscenza e livelli informativi che spesso si traducono nella valorizzazione dei dati di base.
Tecnologie utilizzate
L’integrazione di dati avviene utilizzando funzionalità presenti negli strumenti di gestione delle informazioni geografiche (GIS) e grazie ad appositi tools denominati ETL, acronimo che sta per Extract Transform and Load.
Le procedure di data integration sono nella sostanza processi di analisi di correlazioni e/o fusione di dati applicabili sia alla componente geografica sia a quella alfanumerica dell’informazione.
Nel caso di analisi e integrazione sulla componente geografica si parla tecnicamente di overlay o di geoprocessing e si fa riferimento ad algoritmi capaci di elaborare geometrie per ottenerne una ulteriore versione. Fanno parte di questa famiglia di algoritmi le operazioni di risoluzione topologica, buffer, dissolvimento, unione ecc. Tali procedure possono includere dati di tipo Rester, nel qual caso si fa riferimento anche alla map algebra.
Le operazioni sulla componente alfanumerica, tramite gli ETL Tools, sono processi di integrazione dei dati della tecnologia DBMS e del linguaggio SQL con in quali si ottengono aggregazioni e dati di sintesi oppure quadri di correlazione tra dataset diversi.
Prodotti della Data Integration
Contestualmente all’integrazione avvengono sovente molteplici conversioni di formato dati in ragione delle specifiche di progetto. Dal punto di vista informativo i prodotti della Data Integration si possono definire dei “dati derivati” utilizzabili come nuove risorse informative.