STATISTICA MULTIVARIATA

Obiettivi formativi

Obiettivi formativi Saper riorganizzare i dati multivariati per la loro analisi statistica. Acquisire gli strumenti per l’analisi di dati statistici multivariati. Conoscenza e capacità di comprensione. Conoscenza delle metodologie di statistica multivariata e della loro formalizzazione mediante l’algebra delle matrici. Capacità di applicare conoscenza e comprensione. Comprendere quali sono le tecniche più appropriate per saper prendere decisioni basate su evidenze empiriche, rispondere alle richieste informative aziendali e saper estrarre le informazioni rilevanti dai dati osservati. Saper realizzare una indagine statistica –avvalendosi delle competenze già acquisite di Informatica, Statistica Descrittiva, Inferenziale e Campionamento– e saper analizzarne i dati multivariati con le metodologie più appropriate della Statistica Multivariata. Autonomia di giudizio. Gli studenti sviluppano capacità critiche attraverso l’applicazione di metodologie di statistica multivariata a un'ampia gamma di modelli statistici. Imparano ad interpretare criticamente i risultati ottenuti applicando le procedure a insiemi di dati reali. Abilità comunicativa. Gli studenti, attraverso lo studio e lo svolgimento di esercizi pratici, acquisiscono il linguaggio tecnico-scientifico della disciplina, che deve essere opportunamente utilizzato sia nelle prove scritte intermedie e finali che nelle prove orali. Le abilità comunicative vengono sviluppate anche attraverso attività di gruppo. Capacità di apprendimento. Gli studenti che superano l’esame hanno appreso un metodo di analisi che consente loro di affrontare, le esperienze lavorative.

Canale 1
MAURIZIO VICHI Scheda docente

Programmi - Frequenza - Esami

Programma
I Dati, la loro organizzazione statistica (Data Warehouse), il Controllo e la correzione (Preprocessing) Le strutture statistiche e matematiche dei dati: questionario, matrice dei dati; codifica binaria delle variabili qualitative; tabelle di contingenza; matrice a blocchi di tabelle di contingenza; matrici di distanze. Le strutture informatiche dei dati e loro organizzazione: record, file, modello relazionale per le basi di dati; sistemi informativi Statistici. Controllo e correzione dei dati nelle fasi di una indagine statistica: errori casuali e sistematici; dati mancanti; dati fuori campo; incongruenze logiche; dati anomali; imputazione dati mancanti. Le sintesi dei dati, le loro trasformazioni e le principali distribuzioni teoriche multivariate dei dati Le sintesi: vettore delle medie; vettore degli scostamenti quadratici medi e delle varianze; matrice di varianze e covarianze; matrice di correlazione; matrice di chi-quadrato; medie delle distribuzioni parziali; rapporto di correlazione. Le trasformazioni: matrice dei dati centrata; matrice dei dati standardizzati; matrice delle distanze doppiamente centrate. Distribuzioni multivariate: distribuzione multinormale; distribuzione multinomiale. Classificazione non supervisionata (cluster analysis) Le caratteristiche dei clusters sulla base della (dis)similarità e distanza fra unità multivariate: Misure di (dis)similarità e distanza. Misure di Omogeneità ed Isolamento dei clusters. I metodi non gerarchici: K-medie, Pam e K-medie fuzzy, accenni all’EM; Scelta delle variabili, scelta del numero dei clusters, interpretazione dei risultati; I metodi gerarchici aggregativi: legame singolo, legame medio, legame completo, centroide, metodo di Ward. Interpretazione del dendrogramma, metodi di scelta di una partizione; Classificazione supervisionata (modello di previsione di un cluster), I metodi: Analisi lineare discriminante; Regressione logistica; Alberi di classificazione. Valutazione del modello di classificazione e selezione delle variabili Le metodologie di riduzione dimensionale: analisi delle componenti principali (PCA); rotazione delle componenti; analisi fattoriale; biplot; analisi delle corrispondenze e analisi delle corrispondenze multiple; analisi delle componenti principali non lineari (CATPCA); Interpretazione dei risultati
Prerequisiti
Statistica e Inferenza Statistica
Testi di riferimento
Dispense del Corso Approfondimenti: G. McLachlan, D. Peel, (2000). Finite Mixture Models, Wiley Series in Probability and Statistics. A. C. Rencher, (2002). Methods of Multivariate Analysis, Wiley Series in Probability and Statistics; 2nd edition; A.D. Gordon (1999). Classification, Chapman & Hall, 2nd edition;
Modalità insegnamento
Esame Orale
Frequenza
3 volte a settimana da Ottobre a Dicembre
Modalità di esame
Prova Orale
Modalità di erogazione
Esame Orale
  • Codice insegnamento1022894
  • Anno accademico2024/2025
  • CorsoStatistica gestionale
  • CurriculumCurriculum unico
  • Anno3º anno
  • Semestre1º semestre
  • SSDSECS-S/01
  • CFU9
  • Ambito disciplinareStatistico - probabilistico