[Introduzione Panoramica sulle varie tecnologie di apprendimento supervisionato e non: problemi
di regressione, classificazione e clusterizzazione.
Blocco 1
[Teoria] Problemi di regressione e gli algoritmi più popolari (modelli lineari, decision tree).
[Live Coding] Creare un modello regressivo per predire il prezzo di una casa con Scikit-Learn:
definire il problema; ottenere i dati; importare e pulire i dati; plottare i dati per una prima analisi;
dividere i dati in set per l'allenamento e la validazione; creare modelli regressivi con diversi
algoritmi disponibile in Scikit-Learn e confrontarne la performance.
[Esercizio/Lab] Creare un modello regressivo per predire l'efficienza di consumo di un'automobile.
Blocco 2
[Teoria] La libreria Pandas per gestire dati in formato tabellare. Gestione di valori NaN;
selezionare, filtrare e aggregare i dati; gestione di serie temporali usando interpolazione e
indicizzazione; gestione di dati categorici.
[Live Coding] Leggere serie temporali di dati meteorologici (temperatura, precipitazione) di alcune
città e calcolare indicatori climatici come la temperatura media minima e massima per mese e
plottare il risultato.
[Esercizio/Lab] Ottenere, interpolare e plottare una serie temporale di dati riguardante un
parcheggio pubblico.
Blocco 3
[Teoria] Problemi di classificazione e introduzione alle reti neurali.
[Live Coding] Classificazione di fotografie di segnaletica stradale con una rete semplice (fully
connected, un unico strato nascosto) usando la libreria PyTorch.
[Esercizio/Lab] Classificazione dei caratteri "0" - "9" scritti a mano del dataset MNIST con una rete
semplice e PyTorch.
Blocco 4
[Teoria] Cenni a reti neurali convoluzionali e deep learning.
[Live Coding] Migliorare la performance della rete precedente per la classificazione della
segnaletica aggiungendo strati convoluzionali (architettura LeNet).
[Esercizio/Lab] I partecipanti possono applicare la stessa modifica alla loro rete per il
riconoscimento dei caratteri.
Blocco 5
[Teoria] Problemi di clusterizzazione e gli algoritmi più popolari (k-means, DBSCAN).
[Live Coding] Un esempio di customer segmentation su dataset di kaggle.com usando Scikit-Learn
e l'algoritmo DBSCAN.
[Esercizio/Lab] Ripetere l'esercizio con un altro dataset di kaggle.com a scelta del partecipante.