Offerta formativa | Università degli Studi di Firenze

Anno di corso

Primo Anno - Primo Semestre

Dipartimento di Afferenza

Statistica, Informatica, Applicazioni "G. Parenti" (DiSIA)

Tipo insegnamento

Attività formativa monodisciplinare

Settore Scientifico disciplinare

SECS-S/01 - STATISTICA

Crediti Formativi

6

Ore Didattica

48

Periodo didattico

11/09/2023 ⇒ 22/12/2023

Frequenza Obbligatoria

No

Tipo Valutazione

Voto Finale

Contenuto del corso

mostra

Programma del corso

mostra

Docenza

Lingua Insegnamento

Italiano

Contenuto del corso

Questo è un corso di inferenza statistica avanzata e di modelli statistici per l'analisi dei dati

Libri di testo consigliati (Cerca nel catalogo della biblioteca)

Wasserman, L. (2004). All of statistics. Springer-Verlag, New York.

Dispense del docente disponibili in Moodle

Obiettivi Formativi

CONOSCENZA E COMPRENSIONE
Il corso è dedicato alla trattazione dell’inferenza statistica avanzata, dei modelli statistici per l’analisi della dipendenza fra più variabili quantitative e qualitative. Al centro del corso sta la trattazione degli elementi fondamentali del modello di regressione lineare multipla. In particolare, verranno trattati per dati sperimentali e non sperimentali: i modelli di regressione per dati continui, includendo eventualmente fattori e interazioni, l'analisi dei residui e le tecniche di scelta del modello. L’analisi dei dati qualitativi, mediante modelli logistici.
CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE
Parte integrante del corso è anche la discussione delle situazioni reali in cui sono appropriati i metodi e delle assunzioni sottostanti. Verranno trattati vari esempi e applicazioni in ambito scientifico, tecnologico, economico e sociale. A tal fine si utilizzerà il linguaggio statistico R. Al termine del corso lo studente è in grado di analizzare dati sviluppando i modelli appropriati, adattando tali modelli con i metodi più efficienti e valutando e presentando i risultati in termini critici. Lo studente assimilerà il linguaggio R con cui stimare modelli di relativa complessità.

OBIETTIVI FORMATIVI
• Sviluppare la capacità di specificare modelli statistici appropriati a seconda del problema
• Imparare e saper applicare la teoria matematica della statistica
• Sviluppare la capacità di interpretare le stime e la capacità di comunicare I risultati in modo rigoroso, discutendo criticamente le conclusioni.

Prerequisiti

Conoscenze di base di statistica e calcolo delle probabilità

Metodi Didattici

Lezioni frontali. Esercitazioni in classe e laboratorio usando il linguaggio R.

Altre Informazioni

Frequenza delle lezioni ed esercitazioni: Raccomandata.
Strumenti a supporto della didattica:
UniFi E-Learning: http://e-l.unifi.it

Modalità di verifica apprendimento

Prova scritta relativamente ai primi 3 cfu e prova orale sui restanti 3 cfu

Programma del corso

Le basi dell’inferenza statistica: Campionamento da popolazioni finite e da variabili aleatorie;
formulazione generale del problema; il modello statistico; campione casuale, modelli statistici per campioni casuali; i principali problemi inferenziali; le principali impostazioni inferenziali; il principio del campionamento ripetuto

Statistiche e distribuzioni campionarie: Somma, media e varianza campionaria per campioni casuali; campionamento da popolazioni normali, distribuzione del massimo e del minimo.
Approssimazioni asintotiche, il metodo delta.

Verosimiglianza: La funzione di verosimiglianza; Statistiche sufficienti e minimali sufficienti.

Stima di massima verosimiglianza: Stime e stimatori; Stime di massima verosimiglianza (SMV); Proprietà di equivarianza. Aspetti computazionali: massimizzazione diretta; equazioni di verosimiglianza; algoritmi di massimizzazione. Informazione osservata di Fisher; problemi regolari di stima; Informazione attesa di Fisher. limite inferiore di Cramer Rao; Efficienza; Massima verosimiglianza e famiglie esponenziali
Cenni su funzioni di pseudo verosimiglianza: verosimiglianza profilo, verosimiglianza marginale e verosimiglianza condizionata

Verifica delle ipotesi: Elementi del problema; Test del rapporto delle verosimiglianze massimizzate; Valore-p; test uniformemente più potenti.

Stima intervallare: Metodo delle quantità pivotali; Valutazione degli intervalli e ottimalità; Determinazione della numerosità campionaria

Elementi di teoria asintotica: Proprietà asintotiche delle SMV: Consistenza della SMV; Distribuzione asintotica della SMV; Efficienza della SMV. Distribuzione asintotica del rapporto delle verosimiglianze massimizzate; Test di Wald; Test di Wilks. Intervalli di confidenza asintotici: Intervalli di confidenza asintotici ottenuti da a stimatori di massima verosimiglianza

Misure di associazione: indipendenza condizionata; covarianza, correlazione marginale e parziale per variabili normali; odds ratio marginale e condizionato per variabili discrete

Introduzione all’analisi dei dati: richiami del modello di regressione lineare semplice, il metodo dei minimi quadrati, stimatori di massima verosimiglianza, intervalli di confidenza; verifica delle ipotesi. Introduzione al linguaggio R. Esercitazioni di analisi di dati in R.

Modello di regressione lineare multipla: interpretazione dei coefficienti di regressione parziale, variabili dummy, interazioni, stima di massima verosimiglianza, regioni di confidenza, test di ipotesi, devianza. Esercitazioni in R

Modelli di regressione non lineare: variabile dipendente binaria, regressione logistica, funzione di link, interpretazione dei coefficienti di regressione parziale, variabili dummy, interazioni, stima di massima verosimiglianza, regioni di confidenza, test di ipotesi, devianza. Esercitazioni in R

Cenni sulla selezione del modello: metodi di selezione stepwise backward, forward e misti, criterio del p-value, criteri di informazione e verosimiglianza penalizzata. Esercitazioni in R

Modelli grafici: introduzione alla teoria dei grafi, grafi non orientati, grafi direzionali aciclici, Bayesian network, proprietà di Markov, fattorizzazione della distribuzione di probabilità congiunta, d-separazione, costruzione di un modello grafico, inferenza e selezione del modello, applicazioni in R

B032455 - FONDAMENTI DI STATISTICA PER DATA SCIENCE

Anno Accademico 2023-24

Lingua Insegnamento

Contenuto del corso

Libri di testo consigliati (Cerca nel catalogo della biblioteca)

Obiettivi Formativi

Prerequisiti

Metodi Didattici

Altre Informazioni

Modalità di verifica apprendimento

Programma del corso