Databricks
Descrizione
Il corso è strutturato in modo tale da fornire una breve panoramica del cloud di azure in modo tale da poter effettuare le corrette configurazioni propedeutiche all’utilizzo, l’installazione e la configurazione di Databricks, una piattaforma che offre strumenti che consentono di connettere le origini dati a un'unica piattaforma per elaborare, archiviare, condividere, analizzare, modellare e monetizzare i set di dati con soluzioni dalla BI all’intelligenza artificiale generativa.
Target
Professionisti IT, data scientist, data engineer e analisti
Prerequisiti
Conoscenza di base di programmazione, fondamenti di cloud computing
Programma Corso
Giorno 1
- Il Cloud Computing ed Azure
 - Architettura di Azure ed i servizi principali
 - Azure ed i Data Services principali
 - Gestione dei gruppi di risorse in Azure
 - Gli Storage Accounts in Azure
 - Il Database Sql Server sul Cloud di Microsoft
 - Introduzione a DataBricks
 - Architettura DataBricks
 - Configurazione dell'ambiente
 - Installare e configurare Databricks
 - La UI di DataBricks e come navigare
 - Cosa sono i Workspace di DataBricks
 - Come creare un Workspace DataBricks
 - Data Management in DataBricks
 - Apache Spark al centro della piattaforma Azure DataBricks
 - Spark per alimentare i Cluster di calcolo e Sql WareHouse
 - Qual è la relazione tra Apache Spark e Azure DataBricks ?
 - Come funziona Apache Spark in Azure DataBricks
 - Perché utilizzare Apache Spark in Azure DataBricks
 
Giorno 2
- Configurare le proprietà di Spark in DataBricks SQL
 - Collegare una fonte di dati Apache Spark
 - Comprensione delle colonne di base e dei tipi di dati
 - Gestione del File System nei Notebook
 - Gestione dei Jobs e dei Cluster
 - Creazione e configurazione di Cluster
 - Creazione di Job utilizzando il Notebook
 - Come eseguire un Job
 - Visualizzazione dei Job e dei dettagli
 - Introduzione a Delta Lake
 - Delta Lake, una evoluzione del Data Lake tra Big Data e Spark
 - Utilizzo di Delta Lake in Databricks
 - Caricamento dei dati in Delta Lake
 - Gestione dei dati in Delta Lake
 - Panoramica sulla sicurezza in Databricks
 - Gestione della sicurezza di Databricks
 - Gestione del Backup e del Recovery
 - Risoluzione dei problemi
 - Troubleshooting