Machine Learning e analisi predittiva per l'azienda.
Descrizione
Questo corso è progettato per fornire una formazione solida e operativa sul Machine Learning, con un taglio pratico e accessibile anche a chi non ha competenze tecniche. In tre giornate, i partecipanti acquisiranno le competenze fondamentali per applicare il Machine Learning in contesti aziendali, migliorando processi decisionali e operativi.
Struttura del corso:
- Fondamenti teorici: introduzione ai concetti chiave del Machine Learning, alle tipologie di modelli e alle principali metodologie.
- Preparazione e analisi dei dati: tecniche di data cleaning, analisi esplorativa e selezione delle variabili.
- Modellazione predittiva: costruzione e valutazione di modelli per la previsione e la classificazione.
- Interpretazione dei risultati: lettura dei modelli, comprensione degli output e applicazione ai processi aziendali.
Il corso adotta una modalità “blended”, alternando brevi sessioni teoriche a esercitazioni pratiche guidate. L’attività pratica si svolge con Orange, una piattaforma no-code che consente di costruire workflow di Machine Learning in modo intuitivo, senza necessità di scrivere codice. Questo approccio permette di concentrarsi sull’analisi e sull’interpretazione dei dati, rendendo il corso adatto anche a profili non tecnici.
Target
Prerequisiti
Una propensione al pensiero logico e matematico costituisce senz'altro un elemento facilitante per i partecipanti al corso, pur non configurandosi come un requisito imprescindibile
Programma Corso
Modulo 1: Introduzione al Machine Learning (ML)
- Definizione del ML e panoramica
- Breve storia del ML
- Differenze tra ML supervisionato e non supervisionato
- ML vs AI vs Data Mining vs Statistica: come non confonderli.
- Esempi di ML noti al pubblico. Il ruolo trainante di Google, Amazon e Facebook
- Perchè il ML può aiutare le aziende a prendere decisioni migliori
- Sviluppare una mentalità data-driven, col supporto dell’intuizione (sinergia)
- Quali aspetti del business di una azienda sono adatti al ML (predittivo)?
- Principali termini del ML
Modulo 2: Caricamento e Pre-elaborazione dei Dati
- Standardizzazione e normalizzazione
- Rilevamento e gestione di valori mancanti
- Identificazione e gestione degli outlier
Modulo 3: Analisi Esplorativa dei Dati (EDA)
- Tipologie di variabili: numeriche e categoriche
- Dataset (in vari formati)
- Correlazione numerica e matrici di correlazione
- Dipendenza ed Indipendenza delle variabili categoriche (test chi-quadro)
- Plot grafici: scatterplot, boxplot, istogrammi, barplot, lineplot, heatmap
- Visualizzazioni interattive
Modulo 4: Modellazione Predittiva
- Il fitting dei dati
- Il decision boundary
- Modelli di regressione: lineare, logistica
- Modelli di classificazione: alberi decisionali, foreste, KNN, SVM, Naive Bayes
- Reti neurali
- Modelli semplici vs modelli complessi
- Modelli rigidi vs modelli flessibili
- Le classi sbilanciate: cosa fare
Modulo 5: Valutazione dei Modelli
- Training, test e cross-validazione
- Metriche: accuratezza, matrice di confusione, R², RMSE
- Overfitting e variabili omesse (i due principali problemi dei modelli): come evitarli
- L'importante trade-off tra bias a varianza
Modulo 6: Selezione delle Feature
- Tecniche manuali e automatiche
Modulo 7: Deployment dei modelli di ML
- Strumenti per il deployment: API, containerizzazione (Docker)
- Integrazione dei modelli nei sistemi aziendali
- MLops
- Monitoraggio e manutenzione dei modelli in produzione
Modulo 8: Machine Learning Non Supervisionato
- Clustering: K-means, gerarchico, DBSCAN, t-SNE
- Distanze e matrici delle distanze
- PCA (Analisi delle Componenti Principali)
Modulo 9: Serie Temporali
- Analisi dei trend e pattern
- Forecasting dei prossimi valori (regressione, exponential smoothing, ARIMA)
Modulo 10: Esercitazioni Pratiche con Orange
- Introduzione allo strumento Orange
- Creazione di workflow in Orange
- Analisi di casi aziendali
Modulo 11: Esportazione dei Risultati
- Export, Report e documentazione
Modulo 12: Tecnologie e tool di ML
- Open-source: python, R, scikit-learn, TensorFlow di Google, PyTorch, Weka, Orange
- Proprietari: Google, Microsoft
- tool no-code, low-code
- Python, R ed Excel
- Microsoft