Big Data e Data Science Introduzione al concetto di Big Data e principali ambiti di applicazione in Italia (Data & Analytics Framework e Piattaforma Digitale Nazionale Dati)

Data Highways: How Information Flows in Our World

La locuzione big data indica genericamente una raccolta di dati così estesa in termini di volume, velocità e varietà da richiedere tecnologie e metodi analitici specifici per l’estrazione di valore o conoscenza. Per metonimia, il medesimo termine è utilizzato per riferirsi alla branca della data science che si occupa di analizzare queste tipologie eterogenee di dati allo scopo di scoprire i legami tra fenomeni diversi (ad esempio correlazioni) e prevedere quelli futuri.

La disciplina può essere vista come un’evoluzione dei tradizionali metodi di business intelligence (data analysis, data warehouse, etc.), allargata però al trattamento di masse di dati estremamente grandi e variegate.

In Italia la pubblica amministrazione ha previsto la creazione di un modello di big data governance, denominato Data & Analytics Framework (DAF), all’interno dal piano triennale AgID del 2017-2019. La recente riforma del Codice Amministrazione Digitale (CAD) recepisce il DAF all’art. 50-ter, introducendo la Piattaforma Digitale Nazionale Dati (PDND) che lo integra al suo interno.

Il DAF si basa su una piattaforma big data, composta da un data lake, un insieme di data engine e relativi strumenti per la comunicazione dei dati. Nel data lake vengono memorizzati, nel rispetto delle normative in materia di protezione dei dati personali, dati di potenziale interesse quali, ad esempio:

  • le basi di dati che le PA generano per svolgere il proprio mandato istituzionale;
  • i dati generati dai sistemi informatici delle Pubbliche amministrazioni come log e dati di utilizzo che non rientrano nella definizione precedente;
  • i dati autorizzati provenienti dal web e dai social network di potenziale interesse della Pubblica amministrazione.

La realizzazione e la successiva gestione del DAF è affidata al BDT-PA, ovvero Big Data Team della PA, un team composto da data scientist, big data architect ed esperti di dominio che provvedono al disegno e all’evoluzione concettuale della Piattaforma big data, alla costruzione di modelli di interconnessione delle diverse sorgenti dati, all’analisi dei dati, allo sviluppo di modelli di machine learning, al coordinamento dello sviluppo di data application e all’organizzazione di “competizioni” scientifiche su tematiche di interesse per la PA.

 

About Ryan

IT Project Manager, Web Interface Architect e Lead Developer di numerosi siti e servizi web ad alto traffico in Italia e in Europa. Dal 2010 si occupa anche della progettazione di App e giochi per dispositivi Android, iOS e Mobile Phone per conto di numerose società italiane. Microsoft MVP for Development Technologies dal 2018.

View all posts by Ryan

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.