Il programma del corso prevede di fornire gli strumenti base per effettuare una corretta analisi dei dati univariati, bivariati e multivariati, da un punto di vista descrittiva o inferenziale, al fine di descrivere i fenomeni che caratterizzano un ambiente naturale. I vari tipi di dati (sequenziali, spaziali, composizionali, circolari, etc.) sono analizzati tenendo conto dello spazio campionario di appartenenza e, quindi, analizzando le loro diverse peculiarità.
4) Statistical data analysis explained, C. Reimann, P. Filzmoser, R. Garret, R. Dutter, Wiley, 2008, ISBN: 978-0-470-98581-6
5) copia dei lucidi delle lezioni in formato pdf da copiare su supporto elettronico
Obiettivi Formativi
Conoscenze:
Il corso intende fornire una preparazione di base per la comprensione dei principali metodi grafici e numerici necessari per l’analisi dei dati ottenuti dallo studio di un ambiente naturale al fine di costruire modelli concettuali.
Competenze acquisite:
lo studente acquisisce competenze per un corretto trattamento dei diversi tipi di dati ottenibili dallo studio di un ambiente naturale, per la loro validazione dal punto di vista analitico e per impostare modelli concettuali per descrivere i fenomeni analizzati in modo critico.
Capacità acquisite al termine del corso:
lo studente acquisisce la capacità di valutare e quantificare il comportamento delle variabili analizzate in vari contesti naturali al fine di definire lo stato di un sistema e prevederne la possibile evoluzione con la relativa incertezza.
Prerequisiti
Insegnamenti contenenti i prerequisiti (vincolanti e/o consigliati)
Corsi raccomandati: Matematica e Statistica
Metodi Didattici
Numero di ore totali del corso: 150 (= 6 x 25)
Numero di ore per studio personale e altre attività formative di tipo individuale: ca. 100
Numero di ore relative alle attività in aula: 28
Numero di ore relative ad attività di laboratorio (lezioni in laboratorio): 28
Altre Informazioni
Frequenza delle lezioni ed esercitazioni:
Raccomandata (ma facoltativa) alle lezioni, obbligatoria alle esercitazioni (almeno 2/3).
Strumenti a supporto della didattica:
lavagna semplice, videoproiettore per computer, lavagna luminosa, esercitazioni per analisi dati in aula informatica.
Modalità di verifica apprendimento
Esame orale
Programma del corso
Popolazione, campione e natura dello spazio campionario
Grafici per illustrare la distribuzione dei dati. Diagrammi a dispersione (x-y plots), istogrammi, diagrammi quantile-quantile, diagrammi a scatola.
Misure di distribuzione statistica. Valori di tendenza centrale (media aritmetica, media geometrica, moda, mediana, media troncata, media mobile), misure di dispersione (range, range interquartile, deviazione standard, varianza). Quartili, quantili, percentili.
Modelli di variabili casuali per descrivere i fenomeni naturali. Legge normale log-normale. Costruzione dei normal probability plots.
Analisi bivariata. Coefficiente di correlazione parametrico e non parametrico. Regressione lineare, metodo dei minimi quadrati, regressione non lineare per la modellizzazione di fenomeni complessi.
Introduzione all’inferenza. Comparazione di dati usando test statistici. Valutazione di ipotesi usando test statistici.
Diagrammi a dispersione per dati sequenziali, identificazione di andamenti (trends) temporali. Comportamento stazionario e non stazionario, media mobile, regressione lineare e non lineare. Autocorrelazione, analisi spettrale, modelli di Box-Jenkins. Identificazione di ciclicità.
Analisi dei dati spaziali, costruzione di h-scatterplots. Autocovarianza, variogrammi e algoritmi di kriging per la costruzione di mappe.
Analisi dei dati circolari. Assi, direzioni e vettori. Diagrammi a rosa. Determinazione della orientazione media, della moda e della mediana.
Determinazione della dispersione angolare. Distribuzioni teoriche di riferimento, il modello di von Mises. Stime con piccoli campioni o con campioni caratterizzati da dispersione.
Analisi dei dati composizionali. Il problema degli spazi vincolati (simplessi).
Analisi multivariata: grafici multidimensionali, individuazione di casi anomali in spazi con più dimensionai. Modelli di probabilità per distribuzioni multivariate.
Analisi delle componenti principali e analisi fattoriale. Analisi dei grappoli. Analisi di regressione. Analisi discriminante e metodi di classificazione diversi basati su informazioni note a priori.