Data inizio
Data fine
Tipologia
R&S CSI
Temi
Smart Data Platform
Allegati

Contesto

Completare le attività previste nel Piano 2017 volte al potenziamento delle capability della piattaforma funzionali ai business verticali, relative alla valorizzazione dei dati destrutturati o strutturati in forme diverse dai sistemi relazionali e tabellari usati tradizionalmente (contenuti testuali, ma anche di immagini, modulistica, log dei sistemi e geometrie in ambito spaziale).

Tali dati possono essere contenuti in oggetti multimediali, in documenti digitali o in formati specifici dell’ambito spaziale e territoriale ed è necessario individuare le modalità con cui estrarre e trasformare l’informazione contenuta nei diversi formati binari adottati negli anni.

Obiettivi

Gli ambiti di ricerca che nel corso del 2018 risultano di maggior utilità sono:

A.  l’estensione del motore di ricerca sui dati testuali, lavorare sulla capacità di elaborare e fare analytics sui dati destrutturati estratti da fonti eterogenee tra cui i dati di tipo spaziale;

B. l’estensione delle attuali possibilità di fruizione dei dati da Yucca;

C. l’estensione delle attuali possibilità di gestione dei dati con Yucca

Rispetto a questa ripartizione, le attività che andremo ad affrontare, in relazione ai risultati attesi/condivisi con i potenziali progetti fruitori, saranno:

  • Sperimentazione e prototipazione sul motore di ricerca dei contenuti testuali usando dictionary e tassonomie provenienti dagli ambiti verticali e specialistici (attività in sinergia con le proposte contenute nelle schede in ambito sanità e cultura);
  • Verifica delle tecniche e modalità per estrarre e trattare i dati destrutturati contenuti in diversi formati digitali di interesse con particolare focus sui dati spaziali (geometrie, shape file)
  • Sperimentazione dei linguaggi e delle tecnologie necessari a integrare, elaborare e fare analytics sui dati provenienti da fonti destrutturate o dai dati spaziali e relativa verifica di protocolli e strumenti finalizzati alla data visualization dei risultati ottenuti al passo precedente;
  • Prototipazione del catalogo dei dati in Yucca, per una migliore gestione dei dati, con individuazione delle tecnologie e dei modelli che a partire dalle ontologie rappresentino la semantica dei dati presenti;

Ciascuna delle attività produrrà un deliverable documentale sulle tecniche applicate, i problemi incontrati e le soluzioni individuate in fase di sperimentazione/studio. Nel caso della sperimentazione sul motore di ricerca testuale verrà inoltre prodotto il deliverable software del prototipo implementato, come anche per il prototipo del catalogo.

Ricadute

Le ricadute delle attività previste sono orientate ad evolvere la piattaforma Yucca, predisponendola alla generalizzazione delle progettualità di ricerca proposte dai business, di volta in volta dettagliate:

  • La sperimentazione e prototipazione sul motore di ricerca dei contenuti testuali, ha l’obiettivo di accogliere il dictionary dell’ambito sanità e cultura, e di quanti in futuro ne avessero di propri;
  • La verifica delle tecniche e modalità per estrarre e trattare i dati destrutturati contenuti in diversi formati digitali, come anche la sperimentazione dei linguaggi e delle tecnologie necessari a integrare, elaborare e fare analytics sui dati provenienti da fonti destrutturate o dai dati spaziali, sono di interesse del business della Fiscalità e del Territorio, con particolare riguardo al filone delle Emergenze;
  • La verifica dei protocolli e strumenti finalizzati alla data visualization è una proposta in continuità con le ricerche portate avanti nel 2016-17, di interesse del business del Territorio, ma di fatto ha ricadute su ogni visualizzazione di analisi georeferite;
  • Le ricadute dell’ultima tipologia di attività hanno valenza prevalentemente verso l’interno del CSI, rappresenta uno strumento di governance della piattaforma di valorizzazione e al contempo una capability per i fruitori che potranno agevolmente rintracciare le informazioni presenti e disponibili all’uso.