Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

Probabilità ed Inferenza Statistica, Appunti di Probabilità e Statistica

Vengono esposti in modo semplice definizioni e teoremi di base della probabilità e dell’inferenza statistica. Presenti anche degli esempi.

Tipologia: Appunti

2020/2021

Caricato il 18/06/2021

_sinenomine
_sinenomine 🇮🇹

4

(1)

1 documento

1 / 18

Toggle sidebar

Documenti correlati


Anteprima parziale del testo

Scarica Probabilità ed Inferenza Statistica e più Appunti in PDF di Probabilità e Statistica solo su Docsity! INFERENZA L’inferenza statistica ha per oggetto l’analisi dei dati ottenuti da un campione casuale e come obiettivo quello di dare una validità generale alle informazioni ottenute. Essa si basa sulla teoria della probabilità . Per esperimento casuale si intende un qualsiasi processo ripetibile la cui singola esecuzione, detta prova, dà luogo ad un risultato non prevedibile. I possibili esiti di una prova sono definibili in anticipo e ben catalogabili. Il singolo risultato dell’esperimento casuale si chiama evento elementare e l’insieme di tutti gli eventi elementari viene detto spazio campionario. Viene definito evento un qualsiasi sottoinsieme dello spazio campionario, ovvero un insieme di eventi elementari. ES: Lancio di un dado Spazio campionario=S={1,2,3,4,5,6} Uscita di un numero pari=E={2,4,6} Operazioni su insiemi Dati due insiemi A e B, si dice: • complementare di A l’insieme dei punti di tutto lo spazio che non appartengono ad A. • insieme unione di A e B l’insieme dei punti che appartengono ad A, a B o ad entrambi. • Insieme intersezione di A e B l’insieme dei punti che appartengono ad entrambi. • A e B sono disgiunti se hanno intersezione vuota. Grazie ai Diagrammi di Eulero Venn si riescono a mettere in evidenza le relazioni fondamentali tra gli eventi. Def: o Lo spazio campionario S è l’ EVENTO CERTO, ovvero che si verifica sempre; o Il suo complementare 𝑆𝑐 è l’EVENTO IMPOSSIBILE, che si caratterizza con l’insieme vuoto; o Una collezione di eventi si dice NECESSARIA se la loro unione costituisce un evento certo o Una collezione necessaria di eventi disgiunti a 2 a 2 costituisce una partizione dello spazio campionario S. Le operazioni tra gli eventi godono di alcune proprietà: 1. IDEMPOTENZA: 2. ELEMENTO NEUTRO 3. COMMUTATIVA 4. ASSOCIATIVA 5. DISTRIBUTIVA Possiamo quindi considerare gli eventi come insiemi con cui possiamo operare grazie all’algebra di Boole, che è completa. PROBABILITÀ La probabilità è una funzione P() definita nello spazio campionario S che gode delle seguenti proprietà: 1. 2. 3. Ulteriori proprietà della probabilità ▪ ▪ ▪ ▪ Interpretazione della probabilità ❖ Definizione classica La probabilità di un evento A è il rapporto tra il numero dei casi favorevoli al verificarsi dell’evento e il numero totale dei casi possibili, supponendo che questi siano ugualmente probabili (definizione tautologica). Vantaggio: posso calcolare questa probabilità facendo un semplice rapporto tra cardinalità. Svantaggio: è necessario che tutti gli eventi dello spazio campionario siano equipribabili; inoltre S potrebbe essere un insieme infinito, pertanto non ha senso parlare di cardinalità. ❖ Definizione frequentista La probabilità dell’evento A è il limite della frequenza relativa con cui A si verifica in una lunga serie di prove ripetute tutte sotto le stesse condizioni. Vantaggio: si superano gli svantaggi della definizione classica Svantaggio: in una situazione non definita non è possibile andare a definire il limite nel senso matematico. ❖ Definizione soggettivista La probabilità di un evento è il grado di fiducia che un individuo, sulla base delle conoscenze possedute in un determinato momento, assegna al verificarsi dell’evento. Vantaggio: mediante la quantificazione del grado di fiducia che si ripone nell’evento, non si richiede la ripetibilità dello stesso come nella definizione frequentista. Svantaggio: vi saranno tante probabilità di uno stesso evento quante sono le persone ad esprimere il proprio grado di fiducia, e inoltre tale quantificazione della fiducia è strettamente legata alla percezione dell’individui. Calcolo delle probabilità Quando gli eventi elementari sono equiprobabili, la probabilità di un evento è: 𝑃(𝐴) = 𝑛(𝐴) 𝑁 Ovvero, la probabilità di A è la frequenza relativa degli eventi elementari contenuti in A. Esempio 1 (lancio di un dado) Esempio 2 Qual è la probabilità che estraendo a sorte 3 elementi si estragga {A,A,B}? Il numero di casi favorevoli è pari al numero di gruppi che si possono formare con 13 elementi prendendone 3 alla volta, ovvero: Se X è una v.c. discreta, allora si definisce funzione di ripartizione F, la funzione che ad ogni valore assunto associa il proprio livello di probabilità sommato con quelli relativi ai valori inferiori, ovvero: Media, varianza e deviazione standard di una v.c. discreta La media (o valore atteso) della v.c. discreta X si definisce come: La varianza della v.c. discreta X si definisce come: La deviazione standard risulta essere la radice quadrata della varianza. Variabili casuali standardizzate Data X v.c. ,con media 𝜇 e deviazione standard 𝜎, si definisce variabile casuale standardizzata Z la seguente: Essa risulta avere media nulla e varianza unitaria (quindi anche deviazione standard unitaria). Funzione di densità Se X è una v.c. continua, essa viene descritta da una funzione di densità f, che è tale se: 1. 2. La probabilità che X v.c. continua assuma un valore compreso nell’intervallo (𝑎, 𝑏) risulta essere: Nel caso di X v.c. continua, la funzione di ripartizione risulta essere uguale all’area sottesa dalla funzione di densità tra il limite inferiore dell’intervallo di definizione di X e un certo valore x, ovvero: Media, varianza e deviazione standard di una variabile casuale continua Così come per la v.c. discreta, definiamo media, varianza e deviazione standard di X v.c. continua rispettivamente come: Quantili Data una v.c. continua X, fissato un livello di probabilità p, si definisce quantile di livello p la quantità 𝑥𝑝 in corrispondenza della quale la funzione di ripartizione assume esattamente il valore p, ovvero: Disugliaglianza di Chebyshev Sia X una v.c. qualsiasi con media 𝜇 e varianza 𝜎2, fissato 𝛿 > 0, vale la seguente: Oppure equivalentemente Questa disuguaglianza fornisce informazioni utili solo per 𝛿 > 𝜎. Variabili casuali doppie discrete Dato uno spazio campionario S, si chiama variabile casuale doppia discreta la coppia di v.c. discrete (𝑋, 𝑌) che si ottiene associando ad ogni evento elementare dello spazio campionario una coppia di reali (𝑥, 𝑦). È possibile associare ad ogni coppia(𝑥, 𝑦) un livello di probabilità espresso con la funzione di probabilità congiunta, che gode ovviamente delle due proprietà: 1. 2. Esempio: lancio di 3 monete. X= “numero di realizzazioni dell’evento Testa”; Y= “numero di variazioni di sequenza”. Distribuzione doppia di probabilità Per distribuzione doppia di probabilità si intende la tabella a doppia entrata con cui si fa corrispondere a ciascuna coppia (𝑥, 𝑦) la relativa probabilità. Dal punto di vista grafico avremo un sistema di 3 assi cartesiani: i punti del piano xy rappresentano le coppie (𝑥, 𝑦), mentre con la terza coordinata si rappresenta la probabilità associata al singolo punto del piano. Funzioni di probabilità marginali Data la funzione di probabilità congiunta 𝑓(𝑥, 𝑦), è possibile ottenere le funzioni di probabilità delle singole v.c., ovvero le cosiddette funzioni di probabilità marginali, nel modo seguente: Analogamente è possibile ottenere la media e la varianza della distribuzione marginale: Data una distribuzione doppia di probabilità descritta da 𝑓(𝑥, 𝑦), si definisce covarianza la quantità: Proprietà della covarianza 1. 𝜎𝑋𝑌 = 𝜎𝑌𝑋 (𝑠𝑖𝑚𝑚𝑒𝑡𝑟𝑖𝑎); 2. 𝜎𝑋𝑋 = 𝜎𝑋; 3. 𝜎𝑎+𝑏𝑋,𝑌 = 𝜎𝑋,𝑎+𝑏𝑌 = 𝑏𝜎𝑋𝑌; 4. 𝜎𝑎+𝑏𝑋,𝑐+𝑑𝑌 = 𝑏𝑑𝜎𝑋𝑌; 5. 𝜎𝑋𝑌 ≤ √𝜎𝑋𝜎𝑌 . Coefficiente di correlazione lineare di Bravais Consideriamo una distribuzione doppia di probabilità descritta dalla funzione di probabilità congiunta f. Il coefficiente di correlazione lineare di Bravais tra X e Y è dato da: 𝜌 = 𝜎𝑋𝑌 𝜎𝑋𝜎𝑌 ∈ [−1,1]. Si dimostra che: Indipendenza di due variabili casuali discrete Date due v.c. discrete 𝑋 e 𝑌, consideriamo la probabilità condizionata: Diciamo che Y è indipendente da X se la probabilità condizionata non dipende da X, qualunque siano 𝑥 e 𝑦. In tal caso si ha: 𝜎𝑋 2 = ∑ 𝜎 𝑋𝑖 𝑏𝑒𝑟𝑛 2 𝑛 𝑖=1 = 𝑛 ⋅ 𝑝(1 − 𝑝) Osserviamo che per n=1 si ha che BIN(1,p)=B(p). Esempio Un agenzia di viaggio sta cercando di offrire nuovi pacchetti vacanza. Su 100 clienti contattati solamente 20 hanno acquistato il nuovo pacchetto (p=0,2). Restano da contattare 12 persone, qual è la probabilità di: A. Non vendere neanche un pacchetto? B. Vendere esattamente due pacchetti? C. Non più di due pacchetti? D. Vendere almeno due pacchetti? ▪ La v.c. di Poisson Rappresenta il numero di eventi che accadono in un intervallo unitario di tempo, lunghezza, area, spazio. Ad esempio il numero di clienti che arrivano in 20 minuti; il numero di scioperi all’anno in Europa; il numero di difetti per un lotto di prodotti; ecc. Essa gode di alcune proprietà: o Permette di modellizzare il calcolo del numero di volte che un evento si verifica in un dato intervallo unitario di tempo, area o volume. o La probabilità che un evento si verifichi in un dato intervallo di tempo, area o volume è la stessa per tutti gli intervalli o Il numero di eventi che accadono in un intervallo è indipendente dal numero di eventi che accadono in un altro intervallo (disgiunto) di tempo. o Il numero medio di eventi di ogni unità è identificato da 𝜆. La funzione di probabilità della v.c. di Poisson risulta essere: 𝑃(𝑋 = 𝑥) = 𝜆𝑥 ⋅ 𝑒−𝜆 𝑥! , 𝑥 = 0,1,2, … 𝑒 𝑟𝑖𝑠𝑢𝑙𝑡𝑎 𝑐ℎ𝑒: 𝜇𝑋 = 𝜆 𝜎𝑋 2 = 𝜆 Esempio Alla reception di un albergo arrivano clienti al ritmo medio di 72 ogni ora. Qual è la probabilità che 4 clienti arrivino nei prossimi 3 minuti? • La v.c. uniforme discreta La prova che genera una v.c. uniforme discreta si può assimilare all’estrazione di una pallina da un’urna contenente m palline numerate da 1 a m. Il numero naturale 𝑚 ≥ 1 è il parametro che caratterizza tale v.c. discreta. Formalmente, nell’estrazione casuale di una pallina da un’urna che contiene m palline numerate da 1 a m, se all’evento “si è verificata la pallina che reca il numero x” si associa il numero reale x, per x=1,…,m, allora si definisce la v.c. X uniforme discreta che assume i valori x=1,…,m, con m probabilità costante, ossia: 𝑃(𝑋 = 𝑥) = 1 𝑚 , ∀𝑥 = 1,2, … , 𝑚. Tale v.c. sarà indicata con 𝑋~𝑈𝑑(𝑚). Inoltre media e varianza risultano essere: 𝜇𝑋 = 𝑚 + 1 2 ; 𝜎𝑋 2 = 𝑚2 − 1 12 . Funzione di densità di probabilità per v.c. continue La rappresentazione grafica di distribuzione di probabilità per una v.c. continua X è una curva identificata con f(x) e viene chiamata funzione di densità di probabilità o semplicemente distribuzione di probabilità. Le aree sottese dalla curva permettono di calcolare le probabilità per x. Ad esempio, nel grafico, l’area A al di sotto della curva tra i due punti a e b, è la probabilità che x assuma un valore compreso tra a e b. Modelli per variabili casuali continue ▪ La v.c. normale Essa descrive molti processi casuali o fenomeni continui e può essere utilizzata per approssimare delle distribuzioni discrete (ad esempio quella binomiale per 𝑛 → ∞. Essa è considerata la v.c. di base per l’inferenza statistica. Una v.c. X continua si dice v.c. normale o gaussiana con parametri 𝜇 𝑒 𝜎2, e la si indica con𝑋~𝑁(𝜇, 𝜎2), se è definita su tutto l’asse reale con funzione di densità: 𝑓(𝑥) = 1 𝜎√2𝜋 ⋅ 𝑒(− 1 2)( 𝑥−𝜇 𝜎 ) 2 , Da un punto di vista grafico, la funzione di densità, detta distribuzione normale, ha una campanulare e simmetrica, ed è ben visibile che media, mediana e moda coincidono. Sempre dal punto di vista grafico, più aumenta lo scarto quadratico medio, più la campana si allarga, mentre l’altezza della campana è data dal valor medio. Di largo uso è la distribuzione normale standardizzata, ovvero una distribuzione con 𝜇 = 0 e 𝜎 = 1 Una v.c. con una distribuzione normale standardizzata, indicata con z, è chiamata v.c. normale standardizzata. Per una v.c. normale standardizzata risulta: 𝑍~𝑁(0,1); 𝜙(𝑧) = 𝑓𝑢𝑛𝑧𝑖𝑜𝑛𝑒 𝑑𝑖 𝑟𝑖𝑝𝑎𝑟𝑡𝑖𝑧𝑖𝑜𝑛𝑒 = ∫ 1 √2𝜋 ⋅ 𝑒(− 1 2)𝑤 2 𝑑𝑤, 𝑧 ∈ [−∞, +∞]. 𝑧 −∞ Per calcolare la probabilità che una v.c. normale standardizzata assuma valori in un dato intervallo si standardizzano gli estremi di tale intervallo e si usano le tavole di probabilità della normale standardizzata. Infatti: 𝑃(𝑥0 ≤ 𝑋 ≤ 𝑥1) = 𝑃 ( 𝑥0 − 𝜇 𝜎 ≤ 𝑍 ≤ 𝑥1 − 𝜇 𝜎 ) = 𝜙 ( 𝑥1 − 𝜇 𝜎 ) − 𝜙 ( 𝑥0 − 𝜇 𝜎 ) Esercizio In un’azienda elettrica la durata di una lampadina ha una distribuzione normale con 𝜇 = 2000 ℎ e 𝜎 = 200 ℎ. Qual è la probabilità che una lampadina estratta a caso durerà: A. Tra 2000 e 2400 ore? B. Meno di 1470 ore? È possibile inoltre, a partire dalla probabilità, trovare il valore di z, sempre mediante la tavola di probabilità. Legge dei grandi numeri (teorema di Bernoulli) Tale legge descrive il comportamento della media di una sequenza di n variabili casuali indipendenti e caratterizzate dalla stessa distribuzione di probabilità (ad esempio n lanci della stessa moneta, n misure della stessa grandezza, ecc) al tendere ad infinito della numerosità della sequenza stessa. In altre parole, grazie alla legge dei grandi numeri possiamo “fidarci” che la media che calcoliamo a partire da un numero sufficiente di campioni sia sufficientemente vicina alla media vera. Per la legge dei grandi numeri si può quindi dire che: • La media della sequenza è un’approssimazione della media della distribuzione che migliora al crescere di n; • Viceversa, si può prevedere che tali sequenze mostreranno una media tanto più spesso e tanto più prossima alla media della distribuzione quanto più grande sarà n. Un caso particolare di applicazione della legge dei grandi numeri è la previsione probabilistica della proporzione di successi in una sequenza di n realizzazioni indipendenti di un evento E: per 𝑛 → ∞, la proporzione di successi converge alla probabilità di E. Esempio Riprendendo l’esempio dell’urna delle 5 palline si ha: Valore atteso di una statistica campionaria Il valore atteso, cioè la media, di una statistica campionaria può essere vista come la media aritmetica dei valori della statistica campionaria associati a tutti i campioni dello spazio campionario, ossia, nel caso della media campionaria: 𝜇𝑋 = ∑ 𝑋𝑖 𝑛 𝑖=1 𝑛 Nell’esempio precedente infatti è data dalla somma dei valori assunti dalla media nei 25 campioni dello spazio campionario divisa per 25, ovvero: 𝜇𝑋 = 1 ⋅ 1 + 1,5 ⋅ 2 + 2 ⋅ 3 + 2,5 ⋅ 4 + 3 ⋅ 5 + 3,5 ⋅ 4 + 4 ⋅ 3 + 4,5 ⋅ 2 + 5 ⋅ 1 25 = 3. Tutto ciò ha ovviamente senso nel momento in cui ci troviamo in uno spazio campionario finito. Varianza di una statistica campionaria La varianza di una statistica campionaria può essere pensata come il risultato delle seguenti operazioni: 1) Si associa ad ogni campione dello spazio campionario il quadrato dello scarto tra il valore della statistica campionaria (nel nostro caso la media campionaria) e la media della statistica stessa; 2) Si prende la media aritmetica delle quantità così ottenute. 𝜎 𝑋 2 = ∑ (𝑋𝑖 − 𝜇𝑋) 2𝑛 𝑖=1 𝑛 La quantità determinata in questo modo è una misura del grado di variabilità della statistica campionaria, cioè del grado medio di oscillazione della statistica attorno al suo valore medio. Riferendoci all’esempio precedente si ha: 𝜎 𝑋 2 = (1 − 3)2 + ⋯ + (5 − 3)2 25 = 1 È possibile dimostrare che media e varianza della media campionaria sono dati rispettivamente da: 𝜇𝑋 = 𝜇; 𝜎 𝑋 2 = 𝜎2 𝑛 , dove 𝜇 e 𝜎2 sono rispettivamente la media e la varianza della popolazione generatrice. Dunque il valore atteso della media campionaria coincide con la media della popolazione e la varianza della media campionaria, interpretabile come la media delle oscillazioni (gli scarti al quadrato) che essa presenta rispetto alla sua media, è data dalla varianza della popolazione divisa per n. Ciò significa che la “variabilità” della media campionaria è molto più piccola della “variabilità” della popolazione, infatti al crescere di n tende a 0. La v.c. media campionaria è generata dall’associazione a ciascun campione dello spazio campionario di un numero reale, dato dalla media aritmetica dei valori contenuti nel campione stesso. Esempio Riprendiamo l’esempio visto in precedenza circa il periodo di gestazione. La popolazione è data dalla v.c. normale avente media 256 e varianza 18^2. Se facciamo riferimento a campioni di ampiezza 30, possiamo affermare che il valore atteso della media campionaria è ugual a 256 mentre la varianza della media campionaria è pari a 182 30 = 10,8. Ciò significa che mediamente è uguale a 10,8 la differenza al quadrato tra il valore assunto dalla media campionaria nel singolo campione dello spazio campionario e la media della popolazione. Media e varianza della media campionaria per una popolazione Bernoulliana Si può dimostrare che il valore atteso e la varianza della media campionaria sono dati da: 𝜇𝑝 = 𝑝; 𝜎𝑝 2 = 𝑝(1 − 𝑝) 𝑛 . Si tratta di un caso particolare delle formule viste in precedenza per 𝑋: si ottengono da quelle sostituendo 𝜇 e 𝜎2 alle espressioni valide per la popolazione bernoulliana. Esempio Consideriamo una popolazione bernoulliana con 𝑝 = 0,45, da cui immaginiamo di estrarre un campione di ampiezza 50. Vogliamo calcolare il valore atteso e la varianza della media campionaria. Sappiamo che la media e la varianza per questo tipo di popolazione sono 𝜇 = 𝑝 e 𝜎2 = 𝑝(1 − 𝑝). Pertanto indicando con ?̂? la media campionaria in questo contesto, ovvero la proporzione di successi nel campione, si ottiene che: 𝜇𝑝 = 𝑝 = 0,45, 𝜎?̂? 2 = 𝑝(1 − 𝑝) 𝑛 = 0,45 ⋅ 0,55 50 = 0,0049. Distribuzione della media campionaria nel caso di una popolazione normale Consideriamo come popolazione generatrice quella normale 𝑁(𝜇, 𝜎2). Si può dimostrare che in questo caso la media campionaria 𝑋 ha una distribuzione normale, ovvero è descritta dalla seguente funzione di densità: 𝑓(𝑥) = 1 √2𝜋 ⋅ 𝜎 √𝑛 ⋅ 𝑒 − (𝑥−𝜇)2 2𝜎2 𝑛 . Graficamente risulta: Esempio Riprendiamo l’esempio del periodo di gestazione con durata della gestazione v.c. normale con media 265 e deviazione standard di 18, vogliamo calcolare la probabilità che in un campione di 35 unità la media campionaria sia compresa nell’intervallo (250,276). Teorema del limite centrale Quando il campione ha un’ampiezza sufficientemente grande, la distribuzione campionaria della media può essere approssimata con una normale, qualunque sia la forma della v.c. oggetto di studio. Si può quindi affermare che la distribuzione campionaria di 𝑋 si avvicina maggiormente alla media, in quanto la varianza è molto piccola e tende a zero per 𝑛 → ∞ ⇒ l’approssimazione di 𝜇 migliora. Questa proprietà della media campionaria è legata al risultato del teorema del limite centrale, e viene illustrata graficamente dalla figura che segue, dove la popolazione è una v.c. esponenziale con parametro 𝜆 = 0,05. Esempio • La durata in minuti delle conversazioni telefoniche che arrivano ad un ufficio pubblico in una settimana è descritta da una v.c. esponenziale con parametro 𝜆 = 0,45. Ci chiediamo quale sia la probabilità che in un campione di 42 telefonate la durata media sia compresa tra 1,5 e 2,3. Applichiamo il teorema del limite centrale tenendo presente media e varianza della popolazione: • Consideriamo una popolazione di 195 studenti di un corso di laurea che hanno sostenuto la prova scritta di Statistica con una votazione media di 21,6 con una varianza di 36,6. Vogliamo calcolare la probabilità che in un campione di 45 studenti estratti da questa popolazione il voto medio sia compreso tra 20 e 23. • Un quiz è composto da 60 domande, ciascuna delle quali prevede 4 risposte, una sola è quella corretta. Vogliamo calcolare la probabilità che scegliendo a caso una risposta la proporzione di risposte corrette sia compresa tra 0,15 e 0,26. Bisogna prima considerare che la proporzione di risposte corrette è una particolare media denotata con ?̂?. Inoltre bisogna considerare che la popolazione ha media 𝑝 = 0,25 e varianza 𝑝(1 − 𝑝) = 0,1875. Pertanto, applicando il teorema del limite centrale si ha: Distribuzione campionaria della varianza Qualunque sia la popolazione generatrice, il valore atteso e la varianza della varianza campionaria 𝑆2 sono dati, rispettivamente da: 𝜇𝑆2 = 𝜎 2; 𝜎𝑆2 2 = 𝜎4 𝑛 ⋅ (𝛽2 + 2𝑛 𝑛 − 1 ), dove 𝛽2 è l’indice di disnornalità della popolazione, che è nullo quando la popolazione generatrice è normale. Consideriamo una popolazione generatrice normale con media 𝜇 e varianza 𝜎2. Sia 𝑆2 la varianza di un campione casuale di ampiezza n proveniente da tale popolazione. Allora, la distribuzione campionaria della v.c. 𝑉 = (𝑛−1)𝑆2 𝜎2 è una v.c. 𝜒2 con n-1 gradi di libertà.
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved