Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

PROBABILITA'. INFERENZA STATISTICA, Appunti di Statistica

concetti dettagliati di probabilità e inferenza statistica

Tipologia: Appunti

2020/2021

In vendita dal 16/02/2022

_marthiinaa
_marthiinaa 🇮🇹

17 documenti

1 / 16

Toggle sidebar

Documenti correlati


Anteprima parziale del testo

Scarica PROBABILITA'. INFERENZA STATISTICA e più Appunti in PDF di Statistica solo su Docsity! n MODELLO è? - min i. a n Y = ✗ + B.✗ + EI " ( y ; - ji ) ' = = ÷ , ⇐ ☐ ( Yi - a - bxi ) " - Min ji = atbxi derivata dia n n n n n t " ( yi - a - bxi) " = -2 (Yi - a - bxi ) - O ii. ,da i. a ÷, ( Yi - a- BXI / =D i ⇐ ☐ Yi - i. alti - i.abxi-oy-a-bx-oia-y.be f n n n n n{ gyi.yyi.a.yyiy.yi.yyi.a.gg, . . , .⇐ alyili - axi - bx! / = -2 (⇒ yixi-i.n.at/ii=abX?)-- O h n n n n n n n Xiyi - ai .at/i-bi..,X?--i..i.XiYi-(y--bI).?i.Xi-bi..i.Xi?--i..,XiYi-y-i..i.Xi- + bx-i.fi - b " E- a i. i. ×? = h ' i-j.fi?;n--5i+bx-a-b " IE.si?;-=o n n i. i. Xilfi n - JI - b i. i. ×? E' =p = > b. = talk" Godeva , Y ) n VIXI = Devil ) COVCKY) ""somma dei prodotti sostituiamo b per trovare a la - g- BI ) - prodotto delle quadrato della media media media del quadrato la devianza (varianza) della Y si scompone : Devin → V in somma dei somma dei quadrati quadratiDev / Y / = SQT = , ⇐ Iyi - J )' regressione d' orrore a T P = ⇐alti - Y ) ' + i :( yi - fi ) " = sqrtsqt = variabilita' Y spiegata dal modello + variabilita' Y non spiegata dal mod . È _ - - ' i (yi-ylq.ggi.y-j.E.fyi-isit-E.IE -È g- i - _ | & 1- comp. 2- comp . - ' dento = SQE 1- SQR der . dovuta . . ( Ji - Y ) 1 , alla regressione D ✗ h h h h ( yi-yiY-i.ayi-a-bxiY-lyi-y-tbe.be/iY--i=allyi-y-)-b(xi-E ) )?i-A i - A TÈ n n n = ( yi-y-Y-bzlxi-X-I-2blyi-y-kxi.FI/in--ufnv(x)i--n-i--a--Dev(Y)-b2 Devlx ) - 2bcodevtX.Y-D-EX.rs' Devlx) = = Dev /Y ) - BZDEVIX ) - SQT-SQR-DSQt-SQE-SQRT-sarbaDIX-b.TT - " ( bxi - BEH% . i. a | n h h = (bxi-y-y-bx-Y-la-bxi-y-Y-i.alyi-y-Y-SQR.esi - a pia BONTA' DI ADAITAMENTO Ra = SQR SQT = 1- SQE SQT OSR' 51 indice relativo che ci informa su quanta variabilita ' della Y e' spiegata dal modello lineare ( piuttosto che dall' errore ) R' =D adattamento pessimo , la retta di regressione e ' costante j-y.ba/SQR--O) 122=1 adattamento ottimo , tutti i punti sono allineati sulla retta ( SQR - Sat ) si dimostra che Ra - poke = Oxy quindi R2 = 0 e R' = 1 Oiox PXY = O pxr = 1 h b' i ( Xi -E)a ↳dev' IX.Y ) pia , SQR i.atti - À ) " per# ' DEVIN SQT = " ( y , -g) 2 = ilyi -igp =/ er / Y ) i. a = Cadeva /KYI DCVIX )Dev /y ) = PIX se 122>-0,70 Si accetta il modello , perche ' vuol dire che il 70% della variabilita' della Y viene spiegato dalla retta di regressione individuata ESERCIZIO y , 127644 - 9.5.333 -2196,667 = ggg.gg }A. 9 unita' statistiche E- 5.333 32 ✗ = " n°- cilindri " § = 2196,667 ✗ = " cilindrata " Dev ( X ) = " ( ✗ i -5.33312=32 ✗ = a -1 @✗ + E n i -- a a = g- - be ⇐ axiyi = 127644 a -2196,667 -693,873 . 5,333=-1503,758 b. = Godeva , Y ) 4=-1503,758+693,873✗ MODELLO DEVLX) per ogni incremento della X , Y aumenta in media di una quantita ' pari a 693.873 COVIKY ) P" = UN / ✓ (y ) = È = 0.891 ⇒ R2 = più -0,8912 modello accettato 32 ' ' %%%f_ ! 0.7938→ 79% valore 9 g Osserva.pt . Ra = SQR sqt SQR= ⇐LÌ - 8) ' = ,⇒ (Ji - 2196,66712 9^1=-1503,7581-693,873.2 = È, = -1503,7581-693,873.4 = : " yg = -1503,7581-693,873.8 = • A C- d ; PIÀ ) = 1- PIA) a { AVÀ = 1 a A- A RÀ = 0 DISGIUNTI PIAUÀ ) = PIA) -1 PIÀ) = 1 • 1701 = O a ' = P (n) = 1 0 = d- a • PI Al B) = PIA) - PIAN B) _ , B PIO) =P(E) = 1- PLI) = 1-1--0 A = ( Al B) V ( AN B) DISGIUNTI ; • DIAU B) =P/Al -1 PIB) - Plan B) DI A) =P (( AlB) UP (ARB)) A. B C- D; A , B eventi qualsiasi ! P / Al B) + PIAN B) PIAI B) = PIA) - PIAN B) (AUB) = (AIB) u ( ANB) VIBIA) 3° assioma • A C- Sn ; 0 SPIA) E A PIAVBI =P/ AlB) 1- PIANB) -1 / BIA) Plat > 0 1° assioma Kolmogorov = ' PIA) - PIAN B) + PIANB) + PIB) - PIANB) PIÀI > 0 =/ HAI -1 PIBI - PIAN B) PIÀI = 1- PIA) ± O MAI E A PROBABILITÀ CONDIZIONATA condizionare un evento A ad un altro evento B significa ridurre lo spazio degli eventi a poiche ' si e ' v rifiBertone diventa un evento atto ) pianB) p ( Al B) = PIB) I 318 = 41g = § mamma th diventa tutto quello che non e ' B. che si e ' gia ' verificato ( evento condizionante certo ) R = A INDIPENDENZA Due eventi A e B si dicono indipendenti , ALB , se e solo se DIANB) = PLAIPIB) PIAIB) =P (A) ; PLBIA) =P(B) il verificarsi di uno non influenza il verificarsi dell' altro . Ovviamente si ha che se ANB = 0 (ev . Incompatibili) allora PIANB) = 0 ; PIAIB) = O =/ PIA) •AETEEAAfga@ogg@ 7606 TEOREMA DELLE • ^ . Ma 1 PROBABILITÀ TOTALI se gli eventi A1 , A2 . . . . . Aa . . . . . AK formano una partizione dello spazio degli eventi , sono tali che D= Ai U Aa V . . . UAK ( collettivamente esaustivi = le loro probabilità sommano esattamente A) Ai n Aj = 0 . ti =/ j (disgiuntivi o mutuamente esclusivi ) allora per ogni evento BEN si ha che P / B) =P( BN Ae ) + PIBN Aa) -1 . . . -1 PIBMAK) ! PIB / A1) P / A1) -1 PIBIA2) PIAa) -1 . . . 1- PIBIAK) PIAK) r A A} A' . f- 2 . . . . . AK , . . . . AK = > partizione di 1 1) II.Ai = 1 A" = 2) Ai n Aj = 0 lt i. j = 1 , . . . , K ; Ai , Ai insiemi qualsiasi 1<=4 P/ B) = ? B= ( Bn Ar) U ( Bn Aa ) u ( Bn A} ) U ( Bn Aa ) insieme delle unioni delle intersezioni di B con tutti gli insiemi A P/B) =P / B MAI ) 1- PIBNA2) 1- PIBNA}) -1 PIBN Au ) 3° assioma di Kolmogorov ' =P /Ai / PIB / A1 ) -1 PIAa)PIB / Aa) -1 PIA} ) PIBIA} ) -1 Plan ) PIBIA" ) di probabilità di B sapendo che Ae si e' gia' verificato TEOREMA DI BAYES probabilità a posteriori e' un modo alternativo per calcolare le probabilità condizionata , che e' facile da ricavare dal primo principio per il quale , per ogni coppia di eventi A e B. SI ha che PIAN B) = PIAIBIP (B) da cui PIAIB) =È = PIBI A) DI A) PIB)e' una dichiarazione circa la probabilità di A , che si e' verificato condizionatamente a B- B) - es : P (malattia I sintomi) ammalarsi viene prima di manifestare i sintomi teorema delle probabilità totali 1- → il medico calcola la probabilità a posteriori che quei sintomi siano determinati da quella malattia P(B) =P (BIAIP(A)+ PIBIÀ)PIÀI Supponiamo che Ae , Aa , . . . . Aia . . . . . AK sono eventi disgiunti le cui probabilità sono non nulle e sommano esattamente a 1 . Se B e ' qualsiasi evento la cui probabilità e ' diversa da 0 e da 1 , si ha che PLBIAr) P ( Ata) P( art B) = Pjblnilplnitplblaaltfafglgjjjllblitklllakl; PIBIAKIP(Ar) = K ☒ = , P ( Blair) PIA,) Interpretation : A1 . Aa . . . . . Ah , . . . . AK sono le possibili cause di B , l' etfelto , quindi , il teorema di Bayes ci permette di invertire il condizionamento PIBI Ata) =P tentato causa ) P ( Art B) =P ( causa etfelto) • PIAN per la = 1 , . . . . K e ' nota come probabilità a priori p(Ap , g) = P(Ar n B) < • PIBI Aia) per 12=1 . . . . . K e ' nota come verosimiglianza P ( B) • P ( ARI B) per la = 1 . . . . . K e ' nota come probabilità a posteriori p (ApiB) =P (B) P ( Art B) =P(Ar) PIBIAR) LEGGI DI DE MORGAN 1- PLAVB ) = P (A- n B) non ( A o B) = (non A) e ( non B) 2-PLATB ) =P (ÀUB) non LA e B) = (non A) o (non B) a f- a B = a B a r 2- a B = a B ↳ È a VARIABILE ALEATORIA v. a . X e' una funzione definita sullo spazio campionario a che associa ad un evento w un unico numero reale × X :b ✗E R / ✗ e ' una realizzazione della v. a. ✗ I v. a. si dice discreta se puo ' assumere un numero discreto (finito o numerabile) di numeri reali nonsarete → ✗ discreta V. a si dice continua se puo ' assumere tutti i valori compresi in un intervallo reale a continuo→ ✗ continua FUNZIONE DI PROBABILITÀ > a distribuzione di frequenza Data una v. a. discreta X , la distribuzione di probabilità di X . PHI , e ' una funzione che associa ad ogni × la probabilità di verificarsi , cioe' p : 7 [ 0,1] ; plx) = P(✗ = × ) dove ✗ denota il dominio di p , chiamato supporto proprieta' : • 0s p (✗ I = P / ✗ = ✗ I s 1 DX E ✗ • ✗ e ✗ PCX) = 1 FUNZIONE DI RIPARTIZIONE F/ • 1 Data una v. a. discreta ✗ con funzione di probabilità PHI , la funzione di ripartizione di X . FIX / e' una funzione che associa ad ogni ✗ la probabilità che si verifichi un valore e ✗ , cioe' F : ✗ → [0,17 ; Flx) = PIXS ✗ I = y < ✗ pt y) Proprieta' : • 0<-1-7×1 s 1 probabilità sempre tra 0 e 1 • F/ ✗il s f-( ✗a) se ✗e < ✗a funzione non decrescente • fino Flx) = F /col = 1- } o < Flxl sa • ✗Eh Flx) = F / - co) = O • ✗ Mai FIXI = Flat ) = a continua da destra Il VALORE ATTESO di una v. a. discreta ✗ e' ELX ) = ✗ e ✗ ✗PIU a I della v. a . in statistica descrittiva la VARIANZA di una v. a. discreta ✗ e ' ULX) = E (X - ELX 112 = ✗⇒ ( ✗ - El ✗ 112 plx) la DEVIAZIONE STANDARD e ' SDLX) = VLX) | ✗ i ☒ ☒ E/2X) = 2 EH) = E ( X2 ) - El X )' = ✗e ✗ ✗2pA) - × ✗ plx) " >• EIBX ) = b EIX) ✓( X ) = E( X - ELX ) )' EIBX) " ✗ BX PIU = E (X2 ) -1 E ( ✗ 12 - 2✗ EH) = EIX' ) + E /E /XP) - E/ 2✗ E / ✗D= E / X2) -1 E /Xp - E/2X) E/E/✗ 1) = = bam, xplx) = E/ X2 ) -1 EH)2 - 2EH ) E ( X) = E ( X2 ) - E /Xp ! BEH) TRASFORMAZIONI DI V. A . → valide solo se Y = g ( X ) con g funzione lineare Data una v. a. Y definita come funzione lineare di una via . X , cioe ' Y = a -1 BX si ha che : • EH ) = E/ a + DX ) = a + BEIX ) eauiuarianza rispetto a trasformazioni lineari e • VIY / = Ha -1 DX ) = BZVIX) non ha eretto sul risultato ✗ ; Y = a -1 BX V14 ) -- Hat BX) E / Y ) = , E la -1 BX )iauxka-bxl-t-la-bXNPHI-au.lt/a-bxl-a-bElXIYpIx)---auxla-bx)plX) = a " ✗ lap / × ) -1 BXPIX) ) = = au ✗ ( b / ✗ - E / XD ' plx) = , baau ✗ ( x - E (✗ 112 plx ) = a" ✗ a PHI + a" ✗ b✗PIU = a aux PHI -1 bam, ✗PIU = atbEH) = bavlx ) - Éx) Ela) = a ; ✓(a) = 0 ; E/ BX ) = BEH) ; VIBX ) = ba VIX ) V. A. STANDARDIZZATE se ✗ e' una via . con valore atteso EIX ) e varianza VIX ) allora Y = ✗ - EH) ✓(× ) e ' una v. a. standardizzata , cioe' una via con EH ) = 0 e V14 / = 1 ✗ ; y , ✗ - EHI ✓( y ) = V X - EH) ✓ ( X ) EH ) = E ✗ - EH) VIX) → costante /1) I | VIX) = 1 , ✓ (× , E [ × . EHI] "ante 101 = 1 UN - EH) ) = %, [VIX ) -VIENI]VIXI = 1 ✓ (× , EHI - EHI ] = O = ✓¥# = 1 I valori standardizzati esprimono la distanza tra i valori osservati e la media in termini di DS lo scarto dalla media EIX ) centra la distribuzione dei dati sullo 0 la divisione per DS rende unitaria la V della distribuzione dei dati → → INDIPENDENZA Date 2 v. a. discrete . ✗ e Y , con funzione di probabilità pxlx) e p> ( y) , la distribuzione di probabilità congiunta di (X , Y ) e' Pxy (× , y) = pxlx) py ( y) se e solo se ✗ 1- Y ✗ e Y sono indipendenti es : estrazione con reimbvssolamento di due palline da un' urna che contiene 5 palline numerate da 1 a 5 . A = " 1° pallina pari " ; B = " 2° pallina e ' pari " ; PI " entrambe sono pari " ) = Plan B) =P(A) P / B) = 21s . 21s =P (BIA ) =P (B) = 21s es : estrazione senza Nimbussolamente . PI " entrambe sono pari " ) = Plan B) =P/ A) DI BIA ) = 21s . %, ↳ eventi dipendenti ✗ 1- Y = PIBIA ) = 114 =/ P (B) = 215 Date n v. a. Xi ognuna distribuita con una distribuzione di probabilità pxi ( X ) con un certo valore atteso EIXII e una certa varianza V1Xi ) , consideriamo la v. a. Y ottenuta come combinazione lineare Y = dai + bi Xi ) dove ai e bi per i = 1 . . . . . n sono costanti . Se le Xi sono tutte indipendenti fra loro allora E(Y ) =L , [ai + bit(Xi ) ] e V ( Y ) =? , b? VLX;) se le variabili non sono indipendenti COVARIANO ' ☒ COMBINAZIONI LINEARI DI NORMALI . Se ✗1 . ✗ 2 . . . . . Xn sono V. a. NIM , 02 ) con i = 1 , . . . . n tra loro indipendenti , allora la seguente v. a . Y = ? , ai + bi Xi in cui ai e bi per i = 1,2 , . . . . n sono costanti reali , e ' ancora distribuita normalmente con i parametri Yu N n n i. sai + billi ; i⇒bio? n ✗ 1 . ✗ 2 . . . . . ✗n v. a . dove ✗in✗(µ . 02 ) ti = 1 . . . . . n ; Y = . .⇒ ( ai -1 bi Xi ) ; ✗ i 1- Xj 4 i. j = 1 . . . . . n con i =/ j n n n E/ Y ) = E i⇒ ( ai + biXi ) = . . .at/ai-biXi)--iii(Elai)tElbiXi) = dai + bi / E / X) ) = % i = , / ai + bini ) n n ✓ ( Y ) = V i.dai tbi Xi) = " ↳ ⇐a /Hai ) + ✓ Ibiki)) = «abiti /Xi) = " -0 né i⇒ bio? indip . n " se ✗e. ✗ a . . . . , Xn sono i. i. d . ti/µ , 02 ) allora la seguente v. a . Y = i⇒ Xi e' tale che YNNnn ; nè ) ✗e . ✗a . . . . . ✗n n V.a . tc XinMu . 02) 0 i = 1 . . . . . n ✗it Xd ti i.j = 1 , . . . , n con i # j } i. i. d. indipendenti e identicamente distribuite n Y = . .⇒ ✗ i Ynlt ( nn ; nè) con Ely) = nn ; V14 ) -- not es : il costo di produzione Y di un certo prodotto dipende dal costo di due componenti : 4=2-1 ✗ e -12×2 sappiamo che ✗in tl5,1 ) e ✗ANNI 10,112) , dove te e Xa sono lndlp, EH ) = E (2-1×11-2112)=2-1 E / ✗e) + 2E ( ✗a) = 2-15-12110 ) = 27 } your /27.3)V14 ) = V12 -1 ✗e -12✗a) = VI ✗il -1 4 VI ✗ a) = 1 -141112 ) = 3 • DISTRIBUZIONE CHI - QUADRATO : ✗~ ✗ & con ✗ > O →mi v Siano 21.2-a . . . . . 2- v V V. a. normali standard e indipendenti , la v. a . ✗ chiamata ✗2 si ottiene : ✗ = ,⇒ È supporto : ✗ = Di valori positivi ( o , -1001 ; parametro V ( numero dei gradi di liberta ' / num . delle v. normali standard che EIX ) = v ; VIX ) = 2v descrivono ✗ 2 all' aumentare dei gradi di liberta ' v . converge a una distribuzione normale ✗NXI ; ✗zedo.tl fortemente } asimmetrica la tavola riporta , rispetto ai diversi gradi di liberta ' , il valore della v. a . ✗ ' corrispondente a una alterni - a dx si appiattisce . Si} smorzava.mn . nata area o nella coda destra della distribuzione ; permette di calcolare : probab . PIX > Xo ) per un fissato valore ✗o il valore ✗✗ per cui PIX - ✗a) = a fissato a un livello di probabilità a = 0,05 il valore ✗e.✗ per cui P/✗ a-✗i.a) = 1 - o fissato a un livello di probabilità a = 0,05 i valori ti - ✗ e Xa per cui Plx , - ✗ E ✗ s ✗a) = 1 - 2x fissato a un livello di probabilità a- 0,05 es : ✗Io.gs = 0,352 = 90,05 "×" es : ✗& , o, < = 1.61 f/✗% ' gradi 1 da barca qo, → a = 1-0,1=0,9 di libertà """ coda coda di sx 0,352 ×; 1,61 " ✗È = GO.us ' 90,1 normale • DISTRIBUZIONE t - STUDENT : ✗~ tu con ✗ e ( - co , co ) standard sia 2- n V10.1 ) e Yuki , la v. a . ✗ chiamata t - Student si ottiene come ✗ = Z Y / V supporto : ✗ = R ; parametro : v ¥ .EIX ) -- 0 ; VIX ) = " ✓ - 2 all' aumentare di v. la variabilita ' diminuisce e la distribuzione si fa piu ' piccata fino a convergere in una normale standard ; a differenza della V presenta delle code piu ' pesanti a dx e sx . ✗ ~ tu ; ✗ II.•NO , 11 la tavola riporta , come l' ×' , il valore della v. a. t - Studlnt corrispondente a una determinata area ✗ nella coda destra della distribuzione es : +7 ; ✗ = ops = , 1,895 ^ = go.gs la sx) es : +7 ; ✗ = o.gs = , - ty ; o, os = - 1,895 Ho = Me = I = 90,0s +7 ; 0,1 te , 0.9 = 90,9 = 90,1 ☒ 1-2-1=1 - Io 171 nuova TEOREMA DEL UNITE CENTRALE " È sia ✗ 1 , ✗2 , . . . Una successione di v. a . i. i. d. con media µ e varianza 02 finite E = i ✗i si ha che n la v. a . Zn = (X - n ) converge in distribuzione , per n- co , alla v.a. normale standardizzata (☒ _µ% n , onn = Var an FIGNO, 1) EHI = E f- i Xi ) = f- i E / Xi ) = -1 " n i = , M = ¥ ' ☒µ =µ 1 VIÌ ) = V f- i ✗ i = fp V i✗ i =p ma i V1 Xi) [ Fa " 02 = ¥ . ☒ . 02 = °' indip . i. i. d. "" ^ GENERALIZZAZIONE ÷ la v. a . ✗ n ✗% si puo ' ottenere come somma di n V. a. normali standardizzate indipendenti al quadrato , quindi per n abbastanza grande , la sua distribuzione e ' molto simile a una Mn , 2h) : ✗ - " ma V10.11 2h n→ co ÷ la V. a. binomiale ✗ puo ' essere vista come somma di h v. a . bernoulliare i. i. d. , quindi per n abbastanza grande la sua distribuzione e' molto simile a una Mnp , np /1 - p) ) : X - np ma No , 1) np (1 -p) n→ co ÷ se consideriamo una successione di Poisson del seguente tipo : ✗in Poi) , Xan Polara) , Xsn Po / 37) , . . . con 1 > O si ha che la distribuzione di ✗ = i ✗ i puo ' essere approssimata , per n grande , da una Ulna , nt) : X - na na III v10.11 inferenza $#atti$ttica PREVISIONE PRIMA DI Effettuare l' INDAGINE e ' la teoria che permette di trarre conclusioni a partire da un' osservazione parziale della realta' / circa una popolazione da un campione di dati tratti da quella popolazione ) ; fornisce una misura in termini di probabilità di quanta fiducia possiamo mettere nelle nostre conclusioni ; → teoria della stima ( puntuale e intervallare ) → teoria dei test > /tetal universo dei campioni✗ , ✗ n f-( × , 0 ) con 0 incognito : ipotizziamo A-µ ^ di numerosità n ↳ generico quanto sono vicini campioni modello i valori ☒ del campione > Un insieme di tutti i possibili sottoinsiemi di P di numerosità n Cn C- PN , n < < N dalnvalore reale O di P + (✗ e , ✗ a . . . . . ✗ n ) sintetizzare i valori con misura di sintesi→ I = f- i⇒ Xi( STATISTICA CAMPIONARIA ha . T = h/ ✗ 1 , ✗2 , . . . , ✗ n) ; n v.a. che descrivono il campione /che assumono il valore ✗e . ✗a . . . . . Xn ) ✓ ( ✗ 1 , ✗ a . . . . . ✗ n ) ; REALIZZAZIONI di n v. a . i. i. di CAMPIONAMENTO CASUALE SEMPLICE : estrazione di un' urna di biglie con rumbussolamento | campionamento BERNOULLI ANO Un = N " co campionamento IN BLOCCO Un = ( Il coefficiente binomiale→ piu' grande e' la popolazione estrarre con Nimbus . o senza rermbus . non cambia il risultato es : ✗ = reddito D= famiglie italiane cn = 5 ; ✗ e = 20.000 , ✗ a = 100.000 . . . . . ✗ 5 = 50.000 ; i. i. d. → descrive i possibili valori di un campione di 5 unita ' ti statistiche ✗e descrive i possibili per ogni numerosità n ottengo una valori della v. a . ✗ 1 , ✗ 2 , _ . . . ✗5 realizzazioni di via . ✗1 . ✗2 . . . . . ✗5 diversa realizzazione del fenomeno T- G ( ✗ 1 , ✗ 2 , . . . , ✗n ) > ✗ e e ' una realizzazione della v. a . ✗ e che descrive il risultato che osserveremo t, t t, sulla prima unita' estratta , Xa e ' la realizzazione della v. a . ✗a che descrive il risultato che osserveremo sulla seconda unita' estratta . . .t = h / ✗e , ✗ 2 , . . . . ✗ n ) realizzazioni delle v. a . > media aritmetica h ( ✗ 1 , ✗ a . . . . . ✗n ) = I = In " i ✗ i h ( ✗ e , Xa , . . . . Xn) = E = In " i ✗ i→ valore medio della popolazione⇒ VALORE INCOGNITO O > MEDIA CAMPIONARIA OBIEITNO dell' inferenza statistica e' utilizzare le osservazioni campionarie per risalire al vero valore dei parametri ignoti e da qui alla distribuzione di probabilità del fenomeno di interesse . si vuole stimare il vero valore dei parametri ignoti in base alle osservazioni e capire quanto accurata sia la stima proposta → STIMA PUNTUALE si vuole identificare un insieme di valori ragionevoli per i parametri ignoti → STIMA INTERVALLARE si formula un' ipotesi sul vero valore e si vuole verificare tale ipotesi , in base alle osservazioni VERIFICA di IPOTESI V. A. MEDIA CAMPIONARIA stimatore corretto e consistente perµ la v. a. descritta dai valori medi di X , v. a . con media µ e varianza 02 , in Un e ' la v. a. campionaria : ☒ = L Ifi che ha EIXT =µ ✓(f) = 02 VIII -- VIA i Xi ) = La ✓ ( i Xi) ; fra i V /Xi ) = 1^ " inclip . o, i.f.d. ha i 02 = ¥ -✗ . 02 = 02 n la dispersione della ☒ intorno al baricentro e' tanto ridotta quanto maggiore e ' la dimensione del campione . 02 se ✗NNµ . 04 la distribuzione della media campionaria e ' ✗~ NIM . n Se ✗ ✗NIM . 021 la distribuzione della media campionaria e' X-mna.mu . Il n→ co V.A. VARIANZA CAMPIONARIA stimatore distorto ma asintoticamente corretto per µ la v. a. descritta dalle variante di X , v. a. con media µ e varianza 02 , in Un e ' la v. a. variant a campionaria : È =L !! ✗ i - X-P che ha E / 52) = 02 ( " ) stimatore corretto e consistente per 02 > valida in media " e ' il fattore di Bessel usato per ' correggere ' la v. a. varianza campionaria 5=52^-1 ' n = n- e i / ✗ i - X-p che ha Elsa) = 02 ✓ ( sa ) = 20" n-1 o, si ha che '%! =È% ✗In-1 ) n - i gradi di liberta 'considerata la trasformata di sa , '""" o, V. A. PROPORZIONE CAMPIONARIA stimatore corretto e consistente per P di popolazione la v.a. descritta dalle frequenze relative ai ✗ n Ber / pt in Un e' la v.a. proporzione campionaria : Fr = 1 " n i⇒ ✗ i che ha E (Fr ) =p ✓(fr ) = PH - P) , V /Fr) = Vtn iXi) " ^ =/ FaV1 i Xi) = fa i V /Xi ) = fa i p / 1- p ) = fa . a. pH - p ) = PGP ) E/Fr) = E /f- i Xi) i. i. d. =L E / i Xi) = in i E /Xi) ! f i p ' = -1µA . p =p ✗~ Berlp) la distribuzione approssimata della proporzione campionaria e' FreneràN / p. %" / STIMA PARAMETRICA : teoria tishenana -neymaniana > stima uno o piu ' parametri Incogniti di popolazione note le osservazioni campionarie e un modello funzionale ( funzione di densita' di probabilità 1 stima ogni parametro di popolazione identificando un valore puntuale oppure un range di valori che con una certa fiducia contiene il parametro → la realizzazione t = lrlxe . . . . . ✗n )→ l' accuratezza dipende dalla DEVIAZIONE STANDARD IT) = I VIT) ll problema della stima puntuale puo ' ricondursi alla scelta di una statistica campionaria T opportuna per stimare il valore del parametro ignoto 0 , chiamata STIMATORE = v. a. con una sua distribuzione campionaria che varia nell' universo dei campioni . Proprieta' degli stimatori : V bassa ; nani < • WRREITEZZA : uno stimatore Tn per 0 si dice corretto se il suo valore al vero valore di P atteso coincide con il parametro di popolazione : Eltn) = O la distribuzione campionaria di uno stimatore corretto e ' centrata attorno a 0 . la correttezza garantisce che la media delle stime ottenute su tutti i c. c. s . didim nsionen che possiamo estrarre dalla popolazione sia uguale al parametro ignoto . ✗ ; ✗N f- ( × ,µ ) ; µ = ? • Tra = ✗min + ✗m" T, è uno stimatore2 Tn = E ELE ) =µ ¥ , = ✗min + ✗ mai corretto per µ 2 Elton) -_ f- E / ✗min 1- ✗max ) = f- [E / ✗max) + El ✗ min)] = f- ( µ +µ ) = µ • @ = @2 E(5) = oa " j ' ¥ 02 , ma, EH) E(X ) È e ' uno stimatore distorto per ora ⇒ stimatore Tn per 0 se B. (Tn ) = Eltn) - O =/ O fino E (54 = 02 e ' asintoticamente corretto per 02 ⇒ stimatore Tn per 0 se tifa E/Tn) = 0 f- aumentando la dimensione campionaria i valori si avvicinano sempre piu ' ai valori veri di P ) se utiuttassimo uno stimatore distorto , ossia tale che E /Tn ) < 0 o Elin) > 0 . allora un media le stime ottenute su tutti i possibili c. S.s . sottostimarebbero o sovrastimarebbero , rispettivamente , il valore valore del parametro . • O =p E ( Fr) = E / fa i Xi ) = LE / i Xi) = In i E /Xi) = f i p = ¥ - K - p =p Fr e' uno stimatore corretto per p PROPORZIONE p Ha dato Xn Berlp) e un c. c. s . (Xii . . . . ✗n) ( quindi ✗1 . . . . . Xn sono bemouvuane iii.d. ) , vogliamo costruire IC di livello 1-o per p . E= In Ei✗i = Fr perche' ✗in Ber ( p) ti Fr . p Sappiamo che , per TLC , Frega di / p ; P'% ' ) e standardizzatido che pun.pt IFENG.tl allora treP (- ti - a / a s plin - p) E 71 -Na ) = 1-✗ ; P Fr - 2- e - a /a P' ' sp E Fr -17, _ a / a PIÈ = 1 - o sostituendo a Fr il valore campionario P ( la stima) e stimandone W SE si ottiene IC per la frequenza di successi in popolazione p : Icp = ( pt ± 2-e-✗ la Ì " - E ' ) , SE di è n Tale intervallo è approssimato perche ' Fr si distribuisce asintoticamente secondo un modello normale VERIFICA DI IPOTESI X fenomeno ; ✗ N f- ( × , 0 ) ; 0 = ? E ' una procedura statistica che permette di valutare congetture riguardanti un parametro 0 della popolazione f-(X) utilizzando le informazioni campionarie i> 2 ipotesi : Ho : e ' l' ipotesi nulla che si intende preesistente l' osservazione dei dati campionari , si ritiene vera fino a prova contraria e si auspica rifiutare alla luce del risultato campionario Hi : è l' ipotesi alternativa che si contrappone all' ipotesi nulla e che si auspica accettare alla luce del risultato campionario la combinazione di tto e ti genera il sistema di ipotesi : • bilaterale { Ho :O = A s . unilaterale { Ho :O = Oo s { Ho : 0 = 00 S th : 0 ¥ Oo S Hi : 0 < po c coda " µ, ; o > o , e coda di 1. sia ✗ un certo fenomeno casuale di cui si conosce la famiglia di distribuzione di probabilità FIX ; 0 ) con 0 ignota . 2 si vuole verificare una certa ipotesi su 0 sulla base di un campione di n osservazioni > A- µ F- ☒ 3 la verifica di ipotesi si basa su : uno stimatore T per 0 ( chiamato statistica test ) ; la distribuzione 0 = 0' F- 8 f-(T ; 01 dello stimatore T ; l' ipotesi nulla Ho :O = % ; l' ipotesi alternativa Hi : 0 = , =/ . >.< 01 ; una 0 =p F-Fr regola per prendere una decisione sulla base del campione estratto : rifiutare o accettare Ho ; la probabilità o di commettere un errore nel prendere una delusione . /→ I tipo : rifiutiamo Ho quando e' vera→ ✗ = P/piantare Ho / Ho vera ) al diminuire di × , → II tipo : accettiamo Ho quando e' falsa→ p =P accettare Ho / Ho falsa ) } aumenta B si tende a fissare a priori ✗ ad un valore piuttosto piccolo (✗ E { 0,05 i 0,01. } ) - LIVELLO DI SIGNIFICATIVITA ' la regola va definita su Un che viene diviso in 2 parti , A e R , disgiuntive ed esaustive A : l' insieme dei campioni per cui si accetta Ho Un e, ( e" • TI Ho B : l' insieme dei campioni per cui si rifiuta Ho la Cs Cs a.)\si identifica lo stimatore T ( statistica test ) per 0 e si calcola il valore campionario tc ; si sceglie il livello di ☐ 00 significatività del test a zona di accettazione → se Ho e' vera . T tendeva ad assumere valori prossimi a Oo . Al contrario , se te sara' suficientemente distante da Oo si deciderà di rifiutare Ho e accettare Hi→ si sfrutta il livello di significatività del test a { probabilità da cui derivano il / i valori critici , 9, - a. che delimitano la zona di rifiuto (zona critica ) R e quella di accettazione a . { rifiutiamo Ho se te > q,-a / A te cade nella coda destra p-value =probab. di ottenere un valore accettiamo Ho se te < q, -a / Oo della statistica test piu ' estremo di quello osservato nel campione RIFIUTIAMO µ . → I test e' SIGNIFICATIVO al livello di significatività a e.µ al livello Ho se Accettiamo Ho se L' area sottesa alla densita' della ott 0,11 a destra di al n zc = E -µ < z, _ a 1 - ☒ ( e- MZc = # > te - a oy n o,rn ) = P- value che e' la prob . che , sotto HO o n P-value < a p.name > a / assumendo Ho vera) , la statistica test assuma un valore piu ' → R Ho → A Ho estremo ( nella direzione specificata da Hi ) di quello attenti - ✓amante osservato . piu ' piccolo e' il P-value piu ' Ho e' inverosimile ; piu ' grande e ' il P - value piu' i dati danno sostegno ad Ho rifiutiamo Ho al livello di significa se p-value < o accettiamo Ho al livello di significa se p-value > × es :P-value = 1- è /È,% / = 1 - ( II!! / = 1- d- 12.6291 =/ 1 - 0,9957 = 0,0043 0,004 < 0,05 → RIFIUTIAMO Ho TEST PER µ CON 02 NOTA : popolazioni normali sia ( ✗1 , ✗ 2 . . . . . ✗n ) un c. c. S . da ✗ n it (µ , 021 con 0 ' nota . Si vuole verificare al livello di significa ✗ il sistema di ipotesi : { Ho : µ = no H' in + Ma bilaterale ( entrame le code) KNM . 04h ) se Ho e' vera , si ha che 2- = I-no ~ (0.1 ) che e' la statistica test per µ . Sia Il valore di µ nel campione • n astratto e > 2- e = E,% la sua versione standardizzata sotto Ho . I valori critici sulla otto , 1) sono ± 2- i. da : 1-✗ A = (- -21 - ha i + 2- e - a /2) ☐ Si rifiuta Ho se 2- c < - 2- 1- ✗12 Oppure B. = ( - coi - 2- e-a /al U ( 2- e-a /ai + co) Zc > 21 - ✗12 se il sistema di ipotesi e' se il sistema di ipotesi e' { Ho : µ = no { Ho : M -Mo Hi : µ > No Hi : µ < Ma allora il valore critico sulla allora il valore critico sulla V10 , 11 e' a- e-✗ : otto , 1) e' - 2-i.a : A = I - 00 ; d- i - × ) A = I - 2- e - ✗ ; + co) B =/ 2- 1-✗ ; + co ) B = ( - co ; - 2- e - a ) si rifiuta Ho se a-o > Zia si rifiuta Ho se Zc < - 2-e -a popolazioni non normali sia (✗ e , ✗a . . . . . ✗n) un c. c. S . da una popolazione di media µ e varianza 0? Si vuole verificare al livello di significatività o il sistema di ipotesi { Ho : µ = Ma per il TLC che ☒agit/µ , % ) Hi : µ =/ Mo se Ho è vera si ha che la statistica test per µ e' 2- = "- no ma di / 0,1 ) o/ n n→ co sia Il valore campionario di µ e 2- e = % la sua versione standardizzata sotto Ho ⇒ i valori critici sulla otto , 1) sono : 1=2-1-ma . Quindi 1- = (- Zena ; -171-Na ) e R = ( - co ; - ti-a /a) U ( za-Na ; -10) si rifiuta Ho se zc < - 71-a /2 Oppure to > ti-a /2 (se He : µ >µ. allora il valore critico e' ti - ✗ e si rifiuta Ho se te > ti - a TEST PER µ CON 02 IGNOTA : popolazioni normali sia (✗1 , ✗ 2 , . . . . ✗ n ) un c.c.s . da ✗ ~ NIM , 021 con 0 ' non nota . Sia sa lo stimatore per 02 e ☒ quello perµ . Se Ho e' vera , si ha che T =# ntn., che e' la statistica test per µ . Sa/ n Sia ☒ il valore di µ nel campione estratto e sa la varianza campionaria corretta , te = ""° s, n e ' la versione Campion . standardizzata di T sotto Ho . • se tu : µ =/ Mo ; se te < - tn-1 ; e - a /a 0 te > tn -1 ; 1- a /a → R Ho • se Hi : µ >No ; se te > tn -1 ; 1-a → R Ho • se tu : µ <µ . ; se te < - tn-1 ; e -a → RHO TEST PER p : GRANDI CAMPIONI (n > 120) sia (te , ✗ a . . . . , ✗n ) un c. c.s da una popolazione XN Ber ( p) , Fr lo stimatore del parametro bernoulliamo e è la corrispondente stima campionaria . Si vuole verificare al livello di significatività ✗ il seguente sistema di poter { Ho :p =p. . Per il TLC sotto HO si ha che z = Fr - po po / 1- po ) / n IGINO , 1) Hi : p =/ po sta f ll valore campionario di tre zc = F- P' il suo standardizzato sotto Ho polipo / In i valori critici sulla V10 , 1) sono : ± 71-Na . Quindi A = (-71-Na ; 2-e-a/a) e R = ( -00 ; - ti-a /a)Ultima ; -10) e si rifiuta Ho se ti < 71 - a /2 Oppure se te > 71 - a / a se Ha :p > po il valore critico e ' ti - a ; se zc > te-×- RHO se Ha :p < po il valore critico e' te - a ; se zc < - ti- a- RHO
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved