Wasserman, L. (2004). All of statistics. Springer-Verlag, New York.
Dispense del docente disponibili in Moodle
Obiettivi Formativi
CONOSCENZA E COMPRENSIONE
Il corso è dedicato alla trattazione dell’inferenza statistica avanzata, dei modelli statistici per l’analisi della dipendenza fra più variabili quantitative e qualitative. Al centro del corso sta la trattazione degli elementi fondamentali del modello di regressione lineare multipla. In particolare, verranno trattati per dati sperimentali e non sperimentali: i modelli di regressione per dati continui, includendo eventualmente fattori e interazioni, l'analisi dei residui e le tecniche di scelta del modello. L’analisi dei dati qualitativi, mediante modelli logistici.
CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE
Parte integrante del corso è anche la discussione delle situazioni reali in cui sono appropriati i metodi e delle assunzioni sottostanti. Verranno trattati vari esempi e applicazioni in ambito scientifico, tecnologico, economico e sociale. A tal fine si utilizzerà il linguaggio statistico R. Al termine del corso lo studente è in grado di analizzare dati sviluppando i modelli appropriati, adattando tali modelli con i metodi più efficienti e valutando e presentando i risultati in termini critici. Lo studente assimilerà il linguaggio R con cui stimare modelli di relativa complessità.
OBIETTIVI FORMATIVI
• Sviluppare la capacità di specificare modelli statistici appropriati a seconda del problema
• Imparare e saper applicare la teoria matematica della statistica
• Sviluppare la capacità di interpretare le stime e la capacità di comunicare I risultati in modo rigoroso, discutendo criticamente le conclusioni.
Prerequisiti
Conoscenze di base di statistica e calcolo delle probabilità
Metodi Didattici
Lezioni frontali. Esercitazioni in classe e laboratorio usando il linguaggio R.
Altre Informazioni
Frequenza delle lezioni ed esercitazioni: Raccomandata.
Strumenti a supporto della didattica:
UniFi E-Learning: http://e-l.unifi.it
Modalità di verifica apprendimento
Prova scritta relativamente ai primi 3 cfu e prova orale sui restanti 3 cfu
Programma del corso
Le basi dell’inferenza statistica: Campionamento da popolazioni finite e da variabili aleatorie;
formulazione generale del problema; il modello statistico; campione casuale, modelli statistici per campioni casuali; i principali problemi inferenziali; le principali impostazioni inferenziali; il principio del campionamento ripetuto
Statistiche e distribuzioni campionarie: Somma, media e varianza campionaria per campioni casuali; campionamento da popolazioni normali, distribuzione del massimo e del minimo.
Approssimazioni asintotiche, il metodo delta.
Verosimiglianza: La funzione di verosimiglianza; Statistiche sufficienti e minimali sufficienti.
Stima di massima verosimiglianza: Stime e stimatori; Stime di massima verosimiglianza (SMV); Proprietà di equivarianza. Aspetti computazionali: massimizzazione diretta; equazioni di verosimiglianza; algoritmi di massimizzazione. Informazione osservata di Fisher; problemi regolari di stima; Informazione attesa di Fisher. limite inferiore di Cramer Rao; Efficienza; Massima verosimiglianza e famiglie esponenziali
Cenni su funzioni di pseudo verosimiglianza: verosimiglianza profilo, verosimiglianza marginale e verosimiglianza condizionata
Verifica delle ipotesi: Elementi del problema; Test del rapporto delle verosimiglianze massimizzate; Valore-p; test uniformemente più potenti.
Stima intervallare: Metodo delle quantità pivotali; Valutazione degli intervalli e ottimalità; Determinazione della numerosità campionaria
Elementi di teoria asintotica: Proprietà asintotiche delle SMV: Consistenza della SMV; Distribuzione asintotica della SMV; Efficienza della SMV. Distribuzione asintotica del rapporto delle verosimiglianze massimizzate; Test di Wald; Test di Wilks. Intervalli di confidenza asintotici: Intervalli di confidenza asintotici ottenuti da a stimatori di massima verosimiglianza
Misure di associazione: indipendenza condizionata; covarianza, correlazione marginale e parziale per variabili normali; odds ratio marginale e condizionato per variabili discrete
Introduzione all’analisi dei dati: richiami del modello di regressione lineare semplice, il metodo dei minimi quadrati, stimatori di massima verosimiglianza, intervalli di confidenza; verifica delle ipotesi. Introduzione al linguaggio R. Esercitazioni di analisi di dati in R.
Modello di regressione lineare multipla: interpretazione dei coefficienti di regressione parziale, variabili dummy, interazioni, stima di massima verosimiglianza, regioni di confidenza, test di ipotesi, devianza. Esercitazioni in R
Modelli di regressione non lineare: variabile dipendente binaria, regressione logistica, funzione di link, interpretazione dei coefficienti di regressione parziale, variabili dummy, interazioni, stima di massima verosimiglianza, regioni di confidenza, test di ipotesi, devianza. Esercitazioni in R
Cenni sulla selezione del modello: metodi di selezione stepwise backward, forward e misti, criterio del p-value, criteri di informazione e verosimiglianza penalizzata. Esercitazioni in R
Modelli grafici: introduzione alla teoria dei grafi, grafi non orientati, grafi direzionali aciclici, Bayesian network, proprietà di Markov, fattorizzazione della distribuzione di probabilità congiunta, d-separazione, costruzione di un modello grafico, inferenza e selezione del modello, applicazioni in R