GIORNO 1:
DATA GOVERNANCE: da mero obbligo normativo a fattore abilitante per l’attuazione delle strategie di business
Negli ultimi anni, abbiamo assistito alla sempre più frequente emanazione, da parte dei Regolatori, di normative aventi ad oggetto il governo dei dati aziendali. Tuttavia, nel corso del tempo, molte aziende hanno acquisito consapevolezza del valore che i dati rappresentano per il proprio business, in quanto risorsa strategica determinante per i processi decision-making. Ma da dove partire? Governare i dati di un’azienda presuppone la conoscenza analitica delle informazioni che compongono l’Organizzazione, sotto forma di entità, relativi attributi, mutue relazioni.
Topics:
1) INTRODUZIONE ALLA DATA GOVERNANCE:
- La Data Governance tra normative di settore e leggi (i.e. Direttiva EU BCBS 239, Circolare 285 Banca d’Italia, Reg. 38/2018 IVASS, Regolamento EU 679/2016, etc)
- Modelli e standard di riferimento per la Data Governance (DAMA DMBoK, Data Maturity Model, Data Governance Institute)
- Relazioni con altri Framework e Best Practice (ISO, COBIT, etc)
- I trend della Data Governance (Artificial Intelligence, Machine Learning, Internet of Things)
2) MODELLI ORGANIZZATIVI PER IL GOVERNO DEI DATI
- Ruoli e responsabilità per governare i dati
- La Data Governance tra IT e Business
- Il Chief Data Officer
- Principali modelli adottati dalle Organizzazioni moderne
- Data Governance as a Service
3) CONOSCERE E GESTIRE I METADATI AZIENDALI
- Cosa sono i metadati: tipologie di metadati e standard per la loro definizione
- Ontologia e semantica
- Quali sono i principali strumenti per la gestione dei metadati aziendali: Data Catalog, Business Glossary e Data Dictionary
- Il valore del Metadata Management
4) CONOSCERE IL CICLO DI VITA DEI DATI E LE RELAZIONI TRA ESSI ALL'INTERNO DEI PROCESSI AZIENDALI
- Cos’è il Data Lineage e a cosa serve
- Dimensioni del Data Lineage
- Realizzare il Data Lineage per una Data Governance efficace: tecniche e principali ostacoli
- Data Lineage e Metadata Management: un approccio innovativo
5) LABORATORIO E CASI PRATICI
GIORNO 2:
DATA QUALITY e adeguata rappresentazione dei dati a supporto dei processi aziendali
Un dato è considerato di qualità solo se ha delle caratteristiche valide ed è in grado di soddisfare l'uso cui è destinato.
Per questo motivo, i dati devono essere accurati, aggiornati, rilevanti, completi, comprensibili e affidabili.
La qualità dei dati rappresenta anche lo stato di completezza, coerenza, tempestività e accuratezza che li rende appropriati ad un uso specifico.
La Data Quality è l’ambito della Data Governance che comprende una serie di processi ripetibili, finalizzati al monitoraggio continuo dei dati aziendali e al miglioramento della loro significatività (es. attraverso l’arricchimento).
Anche saper rappresentare nel modo giusto, collocando i dati in un contesto visivo corretto, aiuta manager e decision-maker a identificare rapidamente modelli, tendenze e prendere decisioni migliori per il proprio business.
La Data Visualization è la disciplina che si occupa d’individuare i migliori modi per rappresentare i dati in modo grafico, utilizzando tutti gli strumenti che possano aiutare a rendere il dato analizzato il più fruibile e accessibile possibile.
Topics:
1) INTRODUZIONE AL DATA QUALITY MANAGEMENT
- Data Quality impact: principio del garbage in-garbage out e costo dei “bad data”
- Il Data Quality Assessment: valutare la qualità delle informazioni su 7 dimensioni
2) PREPARAZIONE DEI DATI E TECNICHE PER MIGLIORARNE LA QUALITA': "THE HIDDEN DATA FACTORY"
- Data Discovery: identificare le fonti-dati e “scoprire” le relazioni tra i dativ
- Data Profiling: statistiche descrittive e presentazione di alcuni strumenti a supporto (i.e. Bot)
- Data Cleansing checklist: come incrementare la qualità della base dati
- Tecniche di Data Transformation: normalizzazione, discretizzazione e imputazione di valori
- Normalizzazione dei dati e deduplica
- Manual cleanup
- Esempio applicativo: workflow di Data Cleaning
- Data Quality Firewalls: golden rules per la Data Entry
3) DATA DESIGN: PROGETTARE LA MODALITA' CORRETTA PER VISUALIZZARE DATI E INFORMAZIONI
- Exploratory vs explanatory Analysis: principali differenze
- Come rendere la visualizzazione dei dati esplicativa (Data Storytelling)
- Piattaforme Open source per la Data Visualization: Google Data Studio, Power BI e Raw Graphs
4) LABORATORIO - ESEMPI e CASI APPLICATI
GIORNO 3:
DATA SCIENCE e MACHINE LEARNING, alla base di modelli di Data Governance evoluti
L’esplosione del volume dei dati digitali, il cosiddetto fenomeno Big Data, costituisce una grande opportunità per le imprese di qualsiasi settore produttivo, che proprio a partire dall’analisi sistematica dei dati raccolti e dalla loro organizzazione possono trovare delle correlazioni utili per le proprie scelte e per le strategie di business.
In questo contesto, la data science si configura quindi come l’insieme di metodi, processi, algoritmi e tecnologie che consentono di estrarre la conoscenza utile dalla moltitudine di dati strutturati (database) e soprattutto non strutturati (testi, immagini, video ecc.), che l’azienda ha a disposizione.
I metodi statistici e analitici più avanzati, assieme all’intelligenza artificiale e al machine learning, sono le risorse di base della moderna data science per il business.
Topics:
1) LA CENTRALITA' DEI DATI COME FATTORE STRATEGICO PER LO SVILUPPO DEL BUSINESS
- Perché i dati rappresentano un asset aziendale strategico
- Opportunità di valorizzazione del patrimonio informativo aziendale (Data Valorization e Data Monetization)
- Case study: l’utilizzo dei dati per abilitare il decision-making
- Le principali sfide nell’utilizzo dei dati: utilizzare i big data analytics per prendere decisioni di business
2) INTRODUZIONE AL MACHINE LEARNING APPLICATO
- L’Hype Cycle dei Big Data: il livello di maturità delle tecnologie emergenti
- Modelli predittivi: metodi di apprendimento (Supervised vs Unsupervised) e principali tipologie di algoritmi
- Il framework CRISP-DM: pipeline per l’implementazione di un processo di ML
- Piattaforme open source per il ML: linguaggi di programmazione e low-coding tool
- Overfitting e underfitting: le principali causa di fallimento dei modelli di ML
- Model performance assessment: criteri di valutazione dell’efficacia dei modelli
- Etica e Machine Learning: spunti di riflessione sui bias degli algoritmi
3) USE CASE DI MACHINE LEARNING
- Alcuni esempi applicativi
4) LABORATORIO - ESEMPI E CASI APPLICATI