PROBABILITA' E STATISTICA

Anno accademico e docente
Non hai trovato la Scheda dell'insegnamento riferita all’anno accademico di tuo interesse? Ecco come fare >>
English course description
Anno accademico
2017/2018
Docente
ALESSIA ASCANELLI
Crediti formativi
9
Periodo didattico
Annualità Singola
SSD
MAT/06

Obiettivi formativi

Questo corso, della durata di 72 ore (9 cfu) si svolge in parte nel primo semestre (48 ore di probabilità) ed in parte nel secondo (24 ore di statistica).

Il primo obiettivo del corso è portare lo studente a familiarizzare con la matematica degli eventi aleatori, soprattutto attraverso i problemi, rendendolo capace di inquadrare un problema reale in maniera corretta e quindi risolverlo autonomamente, utilizzando i teoremi studiati.

Il secondo obiettivo del corso, non per importanza ma per ordine temporale, è introdurre i primi elementi di statistica descrittiva ed inferenziale. E' infatti l'utilizzo congiunto delle tecniche provenienti dalle due discipline, probabilità e statistica, che trova applicazione nella interpretazione e risoluzione di svariati problemi provenienti dagli ambiti più disparati, dall'economia, alla biologia, alla medicina, alla farmacologia, al controllo di qualità nei processi produttivi, alla demografia.

Le principali conoscenze acquisite dagli studenti saranno:

- conoscenza delle misure di probabilità e delle loro principali caratteristiche
- conoscenza delle regole del calcolo combinatorio
- conoscenza del concetto di probabilità condizionata
- conoscenza del concetto di variabile aleatoria, densità, funzione di distribuzione, media e varianza di una variabile aleatoria
- conoscenza delle principali variabili aleatorie sia discrete che assolutamente continue
- conoscenza dei processi stocastici di Bernoulli e di Poisson
- conoscenza dei principali teoremi limite: leggi dei grandi numeri e teorema del limite centrale
- tecniche di statistica descrittiva per la rappresentazione grafica dei dati
- tecniche di statistica descrittiva per calcolare misure di sintesi di posizione, di variabilità e di forma
- conoscenza dei concetti di distribuzione campionaria di una statistica, stimatore, efficienza e non distorsione
- conoscenza delle principali tecniche di statistica inferenziale: regressione lineare, test statistici di verifica delle ipotesi

La principale abilità acquisita dagli studenti sarà quella di saper modellizzare problemi reali nel linguaggio del calcolo delle probabilità e della statistica, di rappresentare e sintetizzare informazione campionaria e di applicare tecniche inferenziali a supporto dei processi decisionali.

Nello specifico, le principali abilità acquisite dagli studenti saranno:

- saper definire misure di probabilità ed applicarne le proprietà
- saper operare con la probabilità condizionata, in particolare con la legge delle alternative e la formula di Bayes
- saper contare gli elementi di un insieme finito mediante le tecniche di calcolo combinatorio apprese
- saper riconoscere le variabili aleatorie, saper operare con le variabili aleatorie, calcolarne densità e distribuzione (sia congiunta che marginale), media e varianza
- saper inquadrare un processo di Bernoulli e fare previsioni sull'andamento del processo
- saper inquadrare un processo di Poisson e fare previsioni sull'andamento del processo
- saper applicare i teoremi limite in vari contesti
- riassumere l’informazione campionaria attraverso grafici e misure di sintesi e interpretare i risultati
- saper applicare il metodo di regressione lineare a partire da un insieme di dati osservati
- saper utilizzare i test di verifica di ipotesi

Prerequisiti

E' necessario aver acquisito ed assimilato i contenuti degli insegnamenti di Analisi I e II

Contenuti del corso

Il programma del corso è il seguente:

- Introduzione (2 ore).
Cenni storici, problema della divisione della posta, impostazione classica, frequentista, soggettiva, definizione assiomatica.

- Assiomi della probabilità e calcolo combinatorio (8 ore).
Definizione di σ-algebra, misura di probabilità, spazio di probabilità, loro proprietà. Spazi campione equiprobabili. Calcolo combinatorio: regola fondamentale, disposizioni semplici, permutazioni, disposizioni con ripetizione, combinazioni.

- Probabilità condizionata ed indipendenza (6 ore).
Probabilità condizionata. Legge delle alternative, grafi, teorema di Bayes. Paradossi di Monty Hall e di Monty Hell. Eventi indipendenti.

- Variabili aleatorie discrete (8 ore).
Definizione di variabile aleatoria reale, discreta, finita, numerabile, piu` che numerabile, funzione di distribuzione e sue proprietà.
Densità di probabilità discreta, principali densità discrete: binomiale, ipergeometrica, geometrica, binomiale negativa, di Poisson.
Distribuzioni congiunte e densità congiunte, densità marginali. V.a. indipendenti, dipendenti, equidistribuite. Media di una v.a. discreta, proprietà della media, media condizionata. Varianza e deviazione standard, proprietà, momenti. Disuguaglianza di Chebyscev.

- Processi stocastici (8 ore).
Introduzione ai processi stocastici. Processo di Bernoulli: definizione, il successo arriverà prima o poi (quasi certamente), numero medio di prove per il primo successo e per k successi consecutivi, legge debole dei grandi numeri per la binomiale. Il problema della rovina del giocatore. Variabile di Poisson e processo di Poisson: coincidenze, la densità di Poisson come limite della densità binomiale, paradigma di Poisson, processo di Poisson, numero di eventi che si verificano in un intervallo di tempo.

- Variabili aleatorie con densità (8 ore).
Definizione di v.a. con densità, confronto tra variabili discrete e continue, media, varianza e proprietà. Standardizzazione. Principali densità continue: uniforme, esponenziale, normale, gamma. Uso delle tavole per la normale e sue proprietà. Tempo di attesa per la realizzazione di n eventi ed intertempi in un processo di Poisson.
Distribuzione e densità congiunta, densità marginali. Indipendenza. Teorema di De Moivre-Laplace. Correzione di continuità.

- Teoremi limite (6 ore).
Funzione generatrice dei momenti, proprietà, esempi. Teorema del limite centrale di Laplace, convergenza in distribuzione. Legge debole dei grandi numeri, legge forte dei grandi numeri, convergenza quasi certa, confronto tra le due leggi.

- Statistica descrittiva (6 ore)
Rappresentazione grafica dei dati: istogrammi, poligoni di frequenze, diagrammi a settori circolari, diagrammi a barre, box-plot. Calcolo di misure di sintesi di posizione (media, mediana, moda, quartili), di variabilità (range, range interquartile, varianza, deviazione standard, coefficiente di variazione) e di forma (simmetria).

- Distribuzioni campionarie (2 ore).
Distribuzione campionaria di una statistica, stimatore e stima, efficienza e non distorsione.

- Test statistici (10 ore).
Principi generali. Intervalli di confidenza. Test Z e test t, a un campione e a due campioni, a una coda e a due code, p-value.

- Regressione lineare (6 ore).
La retta di regressione e il diagramma di dispersione. Il coefficiente di correlazione lineare. Il modello di regressione e la stima dei parametri. Il coefficiente di determinazione. L’analisi dei residui. Test sui parametri e sulla bontà del modello. Regressione lineare multipla.

Metodi didattici

Il corso comprende sia lezioni frontali che esercitazioni. Solitamente, dopo alcune ore di lezione frontale in cui si introducono nuovi concetti o teoremi importanti, seguono un paio di ore di esercizi sull'argomento svolto. Per le esercitazioni, all'inizio di ogni capitolo si consegna allo studente un foglio di esercizi sul capitolo, contenente parecchi testi di esercizi. Lo studente ha il tempo di guardare autonomamente gli esercizi e tentare di risolverli. In aula verranno poi svolti i principali, più quelli esplicitamente richiesti dagli studenti.

Modalità di verifica dell'apprendimento

L'esame si articola in due prove:

- una prova scritta della durata di 3 ore relativa alla parte di probabilità, in cui allo studente viene richiesto di risolvere alcuni esercizi (generalmente 3 o 4) e di esporre uno (o due) degli argomenti svolti a lezione
- una prova scritta di durata di un’ora relativa alla parte di statistica, in cui allo studente viene chiesto di risolvere esercizi di statistica descrittiva e inferenziale per rispondere a domande a risposta multipla.

Lo studente riceve un voto p tra 0 e 31 per la prova di probabilità, ed un voto s tra 0 e 20 per la prova di statistica. Lo studente supera l'esame se: prende almeno 16/30 in probabilità ed almeno 10/20 in statistica, ed inoltre la quantità 2/3p+1/2s+1 è maggiore o uguale a 18.

Il voto finale tiene conto di entrambe le prove, ed è dato da 2/3p+1/2s+1, arrotondato all'intero più vicino.
Lo studente può sostenere più volte la prova di probabilità, o la prova di statistica, o entrambe; nel momento in cui lo studente consegna un nuovo elaborato, si intende però che egli voglia rinunciare al voto conseguito nell’elaborato precedentemente consegnato.

Testi di riferimento

Per la parte di probabilità, appunti delle lezioni ed esercizi svolti in aula fanno riferimento ai seguenti testi (in ordine alfabetico):
- Baldi Paolo: Calcolo delle probabilità, seconda edizione, McGraw Hill, 2011
- Caravenna Francesco, Dai Pra Paolo: Probabilità. Un'introduzione attraverso modelli e applicazioni, Springer, 2013
- Dall'Aglio Giorgio: Calcolo delle probabilità, terza edizione, Zanichelli, 2003
- Ross Sheldon M.: Calcolo delle probabilità, seconda edizione, Apogeo, 2007

Per la parte di statistica, appunti delle lezioni ed esercizi svolti in aula fanno riferimento ai seguenti testi (in ordine alfabetico):
- Levine David M., Krehbiel Timothy C., Berenson Mark L.: Statistica, quinta edizione, 2010 Pearson.
- Bonnini Stefano, Grassi Angela: Esercizi svolti di Statistica e Calcolo delle Probabilità, 2015, Voltalacarta