Programma
Ricerca e Sviluppo Interna CSI
Data inizio
Data fine
Tipologia
R&S CSI
Temi
Smart Data Platform
Allegati

Cresce, nei diversi ambiti verticali di business, il valore presente nei dati destrutturati o strutturati in forme diverse dai sistemi relazionali e tabellari usati tradizionalmente. Si tratta prima di tutto di contenuti testuali, ma anche di immagini, modulistica, log dei sistemi e geometrie in ambito spaziale.

Diventa perciò prioritario sperimentare e verificare le tecnologie e gli approcci che consentano grazie a Yucca di rispondere alla necessità di utilizzare e integrare tali dati in ambito Big Data, di indicare le modalità per fare elaborazione ed analytics ai fini della loro valorizzazione verticale di business.

Le tematiche di ricerca che nel corso del 2017 risultano di maggior utilità per completare le capability di Yucca sono:

  • l’estensione del motore di ricerca sui dati testuali, lavorando sulla capacità di elaborare e fare analytics su dati destrutturati estratti da fonti eterogenee tra cui i dati di tipo spaziale
  • l’estensione delle attuali possibilità di fruizione dei dati da Yucca
  • l’estensione delle attuali possibilità di gestione dei dati con Yucca
  • la definizione di modelli di governance sulla valorizzazione dei dati, sul popolamento dell’Enterprise Data Hub e prototipazione

In relazione ai risultati attesi e condivisi con i progetti di ricerca che usano Yucca, le attività del 2017 saranno:

  • sperimentazione e prototipazione sul motore di ricerca dei contenuti testuali, al fine di estendere la capacità di usare dizionari e tassonomie provenienti dagli ambiti verticali e specialistici (da sviluppare in sinergia con le attività di ricerca sui temi sanità e cultura)
  • verifica di tecniche e modalità per estrarre e trattare i dati destrutturati contenuti in diversi formati digitali di interesse: documenti, immagini, geometrie spaziali, shape file, mail
  • sperimentazione di linguaggi e tecnologie necessari a integrare, elaborare e fare analytics sui dati provenienti da fonti destrutturate o dai dati spaziali
  • verifica di protocolli e strumenti finalizzati alla data visualization dei risultati ottenuti al passo precedente
  • studio e scouting di minima delle soluzioni tecnologiche e metodologiche per rispondere con Yucca alle esigenze sui Linked Data, di possibile interesse sui temi territorio, salute e cultura
  • prototipozione di policy e strumenti per la valorizzazione dei dati

Ciascuna delle attività produrrà un documento finale sulle tecniche applicate, i problemi incontrati e le soluzioni individuate in fase di sperimentazione estudio. Nel caso della sperimentazione sul motore di ricerca testuale verrà inoltre prodotto il software del prototipo implementato, come anche per il prototipo di valorizzazione.

Opportunità

Le ricadute delle attività di ricerca previste sono orientate a far evolvere la piattaforma Yucca, predisponendola alla generalizzazione delle progettualità di ricerca proposte dai business, di seguito dettagliate:

  • la sperimentazione e prototipazione sul motore di ricerca dei contenuti testuali ha l’obiettivo di estenderlo per accogliere i dizionari in ambito sanità e cultura e di quanti in futuro ne avessero di propri
  • la verifica di tecniche e modalità per estrarre e trattare i dati destrutturati contenuti in diversi formati digitali sono di interesse per chi lavora su fiscalità e territorio, come anche la sperimentazione dei linguaggi e delle tecnologie necessari a integrare, elaborare e fare analytics sui dati provenienti da fonti destrutturate o dai dati spaziali
  • la verifica dei protocolli e strumenti finalizzati alla data visualization è proposta in continuità con le ricerche portate avanti nel 2016, di interesse per il business territorio, ma di fatto ha ricadute su ogni visualizzazione di analisi georeferite
  • uno studio sulle opportunità offerte dalla gestione dei dati di tipo Linked all’interno di Smart Data Platform andrà incontro alle attività presenti nelle schede di ricerca presentate dalle aree salute, cultura e territorio
  • le ricadute dell’ultima tipologia di attività hanno una valenza prevalentemente interna al CSI, grazie alla strutturazione dei modelli di governance della piattaforma di valorizzazione e della prototipazione di uno strumento.