Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

Statistica descrittiva, probabilità, variabili aleatorie e inferenza statistica, Appunti di Statistica

Il documento raccoglie tutti gli appunti prese a lezione e gli esercizi svolti in classe insieme alla professoressa. Si inizia con la statistica descrittiva, in ogni argomento è presente un esercizio e grafici, per poi passare alla probabilità con la dimostrazione del teorema di Bayes, successivamente le variabili aleatorie e la verifica d'ipotesi

Tipologia: Appunti

2021/2022

In vendita dal 27/09/2023

susana-tapia-1
susana-tapia-1 🇮🇹

1 documento

1 / 98

Toggle sidebar

Documenti correlati


Anteprima parziale del testo

Scarica Statistica descrittiva, probabilità, variabili aleatorie e inferenza statistica e più Appunti in PDF di Statistica solo su Docsity! "DiSTRBUZIONE DEi CARATERi E RAPPRESENTAZIONE Le DISTRIBUzIONI STATISTO E deciniono il modo incui uno o più caraveni E mangesiano in un dato colletTivo(diem buiscoro).pescaie. Unirgia" consisie nel dencazione delle modalira caservore, unirai x uniTO esempio: consideriamo in un colletTivo di 15 studemi, il camanere resão Mo? Unita ST. sesso M M =›111 1111ALIANA PeMarenera una Maporesentazione sinterco Si passa ala isara Di FREQUENZA fSAIEDADII associa ane modalira che può assumere un caraTTere x le coMMispondenTi freq assolute Sesso ill freq. (ni) MF S1015 n IDEO. RELATiLE.. è data dal ramponto tra drea.. AssoluTa e Totale di uniTa del colletTo per la i- esima modaliTà Ifs: nsin) FREQ REL FERCENTUALE : è la frequenza Melanica molTiplicaTo per 100 Pi: fj. 100 \ i ) H 3. AG = 490 o X X X Y X X X FREQUENZE CUMULARE - Freq. 465. ACCUMULATA -La preg. accumulara di una classe o data davasamadela della classe con quala delle classi | Nj.: > nj | le frea. cumulare si freg. DEL. ACCUMULATA B: SOnO ORDINARE r'late sport frea Pj NJ ADORNO 588 20,5% 23,5% 8,87 586 29.41.11. 0,059 5.9 %. 00 140 160 170 Fj 0,1205 0,0,1500 0,823 205% 40,17. 52.91. 82,37 94,11.100 %. 170 1 100% DISTRIBUZIONE IN CLASSi Di VALORI vaniabile quartativa coninua usualmente viene rappresenTatomediante una rabera di frequenze associare a dassi di valori Speso nj Bisogna presentare una sinTesi; sija una distrib. per crassi che hanno la stessa ampiezza 100 3 freq1 1001 - 1150 Aj Pi6 0,6 6011: 2 190 1 150 - 1200 13 2300 2 0,3100 30% 1 200 - 1300 0110 1 10%. 100% ISTOGRaMMA -> è un grafico ad aMee e le banne non sono distanziare perché è continuo e sono numeri roali 3 ORiETiVO are pare Metanolari che sono lecari alla baseserche alabase ci sono le dassi del caratere L'анеа e - del retrangolo è la frequenza. pertanto quel che cambia 1 BiSOgnO DETERMiNARE L'AMPiEZZA DELLA CLASSE DI / " EsTemo Sue =estrewo INf seme x determinare l'ALTEZZA di ogni ret. esempio distribo. In CLASSi spesa abo ni (j -> COLORE CENTRALE 0 - 100-150 10 3520 50 125 150-300 225 * = (50. 10) + (35. 125) + (20.205) = 65 = 600 + 4375 + 65 = 144, 2 chivso a destra ! Se la DiSTRiB. di drag.рем и санатена possiamo афнообішаняla X è suddiviso in classi media utilizzando il calore delladasse cj Si estremo sue+ esTr. int ai: xmax - xmin•• L, AMPiEZZA DELA CLASSE ESERCiZi -> 1) media, rapp. grafica,, amolare, %. Fat. > So mila € Paturard no faturaro ni Ci Qi hil SC 80 120 23 O-50 44 50 10 80 ec1-120 80 8576 110266 25 5065 30100 40 17 13 275 = (80.23) + (80.47) + (120. 107 80 = 1.190 + 3760 + 1200 XI = z 16,375 (85. 25) + (70.65) + (10. 100) 266 = 2125 + 4650 + 11.000 266 = 66,7 x= { ni ci DiSTRiB IN ClASSI 47 23 10 2.7 2.3 . 7,71 50 80 120 30 120 If X i I) Ni E8 90 Fj HEDIA ARTHETiCA PONDERATA II) Nj 35 155 265 7j 0.32 se somma di una serie di valori catiplicato " peso Xa= XIP1 + XePe + XKfK 91 + le + p3 yjfj ej esempio Nesome/ ото (к) 1 27 CON 22 254 205 28 96 • Dj 203 132 2251201252 Spj = 39 î=1 nExipi : 972 i= 1 xa: 972 = 24,92 39 PROPRIETÀ MEDIA ARITMETiCA la sauma dei colori asservari é uguale Di vaLore cuadio cocipliar Дон il numero di unina § xi : nxa 1:1 2 la m.a è compresa THa il più piccolo e il più grande dei dati osS 3. la SOttA DEGLi SCARTi della m a è uguale a 0. Li dijferenza tra le modalinai e la media arirmerica scagni REGATUi 100 200 30 100 500 600 100 d SCARTi POSITIVi MEDiA = 325 4. la somma dei quadtrari degli scarni dei aloni osservani da una cosTante C è minima quando c e uguale aula media arT. 5 ( xi - c) = 0 = Win i: V Ja t=1 + minimizza la sano degli scaRTis. su unirà sono divise in sottoinsieme con media la codia generale nerodrigio porterania der enions cui con pesi = ada Xa = 1 I Tach) Pi MEDIA GEOMETRiCA o utilizarga na caso porti e' insieme a наронті 6i Usa dal escupio per i Tassi di cresata. .×2 • Incolodo sua _-›distrib. uniraria Xg calcolo Sulla 103 X52 kerk fr.. XK PROPRIETA: il CocanITivO dalla media. è navale-ana wada ariTateTica n dei logarinui Chan = A) 1log (Xi) n 5= MEDiANA: vaLOre che divide a cerai la distribuzione adinara dei valori. rapp. il Soi. della Divide il conerico in due sonoinsiemi di uguale numerosi disinibo. uno con modalia di ordina più basso l'auro Xi ordinara (x) 1 2 3=-> mediana => He = 3 nel caso di numeri dispari à il contrale se sono pari utilizziano Fj. X n NA Gados ordinaña 80885 Fi 15= 02 2/5 :315: 0,6416=08. 5/5 = Fjs, 0,6| perché 0,5 è la mera 2,75 23 1.2 125% > 03 SOF X,0.2 12093 He = s0/ dalle mutasignicicho na unjanuraro più cado di 70 03 = AS%..ai inf di 96 01 -> 39 in cui il 281 statisriche dalla un presenta un Pili piccolo di 29 wontre il 781. 010Un 7 a39 Wi di 26 03 -> 751val IV 96 unito presentano un ing a 96 don medi InDICi Di VARIABILITA". (RANGE = Max - Xmin | o campo di VARiAZiONE DIJ. iNTERQUARTILE = 1 dA : a3-. 01| L, è l'ampiezza del inTervallo che contiene il so%. dei dai * 25.2)HOnge: 120 - 0 = 120 da.= 96 - 39 = 54 (ind. Ass.) NARiANZA -> dijerenza deve modalina ( scarti) e la media O = 1 5 (xj - x. ) > 0.-> non auò venire un каконе податіно. L> DEViANEn OSS. 8 ' Ho I NOCi ASsaiTi hanno il cinco uguale a O e i cassmo 065. 1 : la varianza non possiede la stessa unita di misura dei aROMidella varianza i durarone a Blanciontil'unita di misuro DEVIAZIONE STANDARD: è la Modica quadrata della varianza 7 (xi -=)2 COSMICIENTE Di VARIASIONE CV • rapponTO Tra la dev. standard e la media mariplicato (e4 100 ev3.T. 100 §>o Divdano x 0 moda per eliminano lo dipendenzadalla dilensione.si calcola per confrontare la variabilinai della distribuzione del санатене con del caratera Y quando sono espressi o con misura o con diverso Ordine di grandesso Se CVX , onora la variabiliTà del carañera x é maggione di quela del carattera 4 INDICi RELATUN ES i11111 DiBitib. max 100 00 n=/0000 X = 20 = n MinOmax e * 3 (n - min da sinMax g : X Si passa da un indice Assono ad un indice RELATiVO se conosco il min e i car farò -s i = I - win (I)max (I) - min(T) VARIANZA NELLA DISTRIB = Di FREO. n § (x3 - x)° •nj o V = {(xg -*) fj eserc) Xi X8050G. мона evianza Manza ass e Melariodevasione viazione Standard 15: 9+8+15728+29 = 34 = 14. 2) (x; ( xj -x)2 . 5 (S(:(1Ha5; UMi 14.3)14.8)14.8)14.. - 8)14,8) (- 9.8)2 ( 2 j213,2) г OU= 139 24 67,174 20 20476.8 -D OHOGENE ITA EO ETEROGENEITA" la laMianza si calcola su caMaTeri quanTiTavi Nelle qualitative si calcola una disferanziaziona esempi A molto soddisf. soddisfatto CD= 4 = modalità " HAX OMOGENEinA" -> TuTTe le modaliTà assumono la sressa drea. Tranne l'utila js = 12 = 1= dj - 1 = ecceTTo dj = 1 hi -) DiSTRiBUZIONE DEGENERE 40 --›1 deTa anche LINiMA ETEROGENEITA 20 " HiN OMOGENEITA" > TuTTe le modaliTà assumono la sressa freq. J1 = 12 = . .. dj D DiSTRIB. UNifORHE t 886562 ds A K MASSIMA ETEROGENETÀ AIk 0,25 -> A INDICE Di GiNi Di OHOGENEITA" K = Os =£ ti 2j=1 SIK win -> win. ausg. 1 шах -> шах aog. INDiCE Di GiNI Di ETEROGENEINA E1 = 1-01 04Ed & K=S INDiCE RELATIVO Di ETEROGENEITADi 21 = E1 K-1 K "> Max INDiCE NON BiMMETRICO -> wax exerog.(disrib. unif). ( " . degenera esempi 50sTrib desgreno X 100 X; обов 000 2 4040 di A000 eterog. 1000 1 => 01 (Maxaug.) E1 = 1-01 = 1 - 1 = €1 = 1 - 0,25 = 0,75 es = O . : D e1 = Шах 4aucoeneiramin eteros EgriSTHil 000D Aj 10 40 uniforme = мах стегод dil Jj3 005 0,0625 25 0,06280,251 0,0625125 0,0625 1 0,25 -201 C 1 = 0,75 шах 4.7 ошодпетої. cHengthe TEOREMA Di cara una distribuzione di valore x dei quaei si conosce solo la 5 ed e dato un valore postivo K, possiamo afferma Ho g(Ixj- x) » X0)s а рониете di capire. discostano un inTervaLointeri al da frequenze di valori che a x+F diреншетеin valore di Trovare la frequenza = degli scosTamenti espressi assoluTo (xi -x la sua devianza =>, Ko Tuto* | шоддюні оидвосі d un valore наа6 esempio = 170 a20 ×- 2-20 130 di » 26? *170 *+2-20 210 k = esempio 12G 101 = 0,25 Quindi il 251. dolladistrib.sardi opiú alta di 210 cm o più bassa di 1.30. o sudenni che hanno conseguito un voro < 99 o > 103 0.75% K=2101 103 *-KG 101 - 21 A Fine 1+= 1 = 0,25 -+ § X Oro k) 3. 30- 30 3 dj 00333 468 211hj; 33.31. 46.71. 5858 3 100 % 30 Fj 0,333 C 27 35 ción 45,5 aj § a N E. diSs m) i prodoti che cosTano massimo 407 sono 2 1,55 066 25 - 301. 50 X = (10. 07,5) + (14. 35.(S) + 16. 48s) 275+497*27 -= 348 Me = De + (05 - Fin- + ) Am = 31 + ( 015 - 0333) 10 = 34162 Em - Fm - 0,8 - 0,333 X0,28 = 10.33 X0.75 = BoX DOT " " gradio a scarola, chiusa e toglara aui incirca a -> талісо опонинатію. descriziono perché racchiude le sarto misure importanti di na distrib di grog semplice canaterizzato da 3 elementi principali: 1. UnaLiNEAdistribuzional . che indica la posizione deva media della 2. inRETTANGOLO la au auTezza indica la aMiallina dei caLdi prossimi ana mediana 3 dueSEGMENT che sono caMiono dal Mettançdodeterminati in base ai valori e icui esTraniesimemi della dismio. CAREA DELBOX BIOT NON INDICA L' INTENSTA Nela rappresentazione dei dani mediante conto doi.колоні ANnau е vediate ed sor pror si puo venere ConsiderareComolicire sup. del Matrangalomanese int sen * VALORI ANOMALI => ECCEDONO CINTERLALLO DEfiniTO dO X< Qs - 1. (LSR - LiR) X7 0871 (USe - Lie) 1= 1,5 -) valori anouali1= 2 -) il eccodonTi esempio reddito 108580 93 3 5170 0. 2 4 nj di 8128098 00009 1500204. 1 valori anocali Fi 000 01: 40 X0,26: 40 X0, Q2 = He = 40 Q3 = Min = 10 нах = 60 con valori anomali Xinf < Q1 - X (03 -Q1) 2 40-1.5(50-401< 40 - 15 : 25 X sup > 50 + 15 = 65 Non esisie 165 => 65 60 So Q Q1 = He 35. 20 10 - VALORI ANOMALI STANDARDiZZAZIONE -> al ringra la disendi ma due quantita : meria o variabilirasi passado una variabile x -., XI: = Xi - X VARIABILE STANDAROIZZATA (avrai variabili con x =0 e 0 = 1 ASiMMETRIA -> sTudiaMo i asicumerria di una distribuzione significa Studiarne la зонша si dice asimmerrica se non è possibile individuare un asse verticale che Tagli la distrilo. in 2 parti iguali - sU 125 - 20 15 10 5 0 1 AssimeTrapasmian (media › mediana › moda) Assimania (medra «mediana 2 moda) Nel BOX RoT -> 955. pog.• Me vicino@s не и Q12 3 5 9 10 11 12 13 Se la distribuzione è simmetrica media = mediana = moda osercizio concentrazione.. (METTERE LE Xi in CRO.ne I Ni Fj Aj QiXI 116 = 0,167 15 15/210 = 0,071 15. 216 = 0.333 35 59 35|210 = 0,1672O 316 2 0,5 (He) 3 416 20.,667 881210 10.276 98/210 2 0,46 5 5620833 150 1501210 2 0,714 52 6 616 = 1 210 210 210 г160210. possiamo dedurre dai valori assUnTi da Aj e Di che A тейе quaste (2) hanno. stes guarnita sono non decrescenti peso '= (FS - Qi). 167-0071) + (0,033 - 0, R= 9 =Es IME Fi 4888679846710-090.833, 167) + 1 0,5-0,276)+ - 0.714) z0, 167 + 0,333 + 0, 5 + 0,667 + 0,833 z0.796 2. 0,3195 -> 0, 322) CONCENTRAZIONE MEDIO BASSA 2.491 .. Nel caSO TeOriCO di massilia concenrazione g= (0169 - 07 + (0336-03 + (05-01 + (0.667 - 0) (01833-0) = 25 = 1 0,167 + 0,333 + 0, 5 + 0,667 + 0,B82 25 #Nel caso di minima concontraziona g = (0,167-0167) + (0.333+0,353) 2408 €Sedia eta « amovione 00000 S si 1 16670S 35 21 00000T z C 1 0,714 ‡0,48 0,86 DIEt Opti 30167 0,33 0,50,66 CURVA Di CORENZ O SPEZZATA Di CONCENTRAZIONE I è maro unilizzara perché esprime visitamente la convenio sias AsCISSO -> Fi=> no. relative areulare inTensiTai Melante cienmilare Qi - sequiento che congrunge il punto 0,0 al punio e, 1 1,0 0,9 0,8 0,7 Linea di equidistribuzione Area - & garra so cano gong 0,6 Q 0.5 0,4 0.3 0,2 Area di concentrazione Spezzata di concentrazione0,1 0.00,0 0,1 0,20.3 0,4 0,5 0,6 0,7 0,8 0,9T.oF più si trova vicino a dire do le Qi sono- туеноні ніврото оле дій ! È un cuadrato percha ti e Qi arriano al massino a 1 • CONCENTRAZIONE NULA -> la curva di CoMenz coincide con lo Qi rOTa di equidistribuziona. • CONCENTRAZIONE MASSIMA -> la curiadi LoManz coincide con i careri fré del Triançolo renangaro Ls L'anca é massima e pari a 112 .-> F; è sempre », a aj Graficamenne accade che la spezzara di concenazione coincida. con i asse dalla ascisse finoaula penultima unita « più evicina aliasse dale • CONFRONTO TRA DE QUQLE DiLERSE -> la cUra si concentasion rajera do quella du Xi 28 9 8888 600 nj840G00o di 0,333000, 2167 No1 Pj 33,37. 20 1. 20 % 16,17 1. 10100 Fj 9238 1 c) OC 00BoT 3 3 373 3% 90*I.100 1 3. 44 = ₽ ( . nig) = (10 50) + (6150) + (6.300) 1 (5: 800) + (3.800). 500 + 900 + 1800 + 2600 + 2400 = 8100 = 270 30 30 Lie consumo medio nei 30 giorni di aprile è uguale a270 kw ve = 100 - 200 ( dasse mediana) Me = In + 0,5 - Fm - 1). Am = 100 + / 9,5 - 0,33 10,53 - 0,33-) 100 = = 100 + (0,1). 100 = 185 nj (500-2701: 3 8°= (50 - 270) - 10 + (150-270) ° 6 + (300 - 2701 : 6 + (500 - 240)%, 5* = 484000 + 86 400 + 5400 + 264 600 +842:700 30 - 1,683.000 3 30 = 56'100 0 = V56100 - 236,85 531 percenTuale nei quali i consumi sono stani infertioni a 200KK I ANALiSi DEL 'ASSOCIAZIONO TRA ALE CARATTERi Ls hadidferenti come stagon: Iedera de le cuccolirci assune da aule camairer, DiSTRIBUZiONi DOpPiE -> distribuzioni che vanno a considerare de unitadue variabilisia qualinative che quantarive possono essere DaTi due camaneniX e Y. si dejinisce distribuzione doppia di grequenze DELLE FREQUENZE CONGIUNTE divero la tra a scoure delle unità che prosentano congiuntamanie la voca esempio i-esina del primo X CINESEAR. carattere eTOT wodalita j - esiva dalAODETTI F secondoGEnERE RESP. 11565 ** = 5 3 4 6 2 C 2 ADOST 2 1 3 1 10 2 2 TOTALE 5 4 a FORivere INTERI SONDOGeNO La FREQUENZA CONGIUNTA ASSOCiANA ALLA CORRISPONDENE Es: 1 è la FREQUENZA CONGiUNTA aSSOCiaTa alla modalità 4 del nuoro di addetti e alla cucadraresponsabile del genere . La DISTRiBUZIONE MARGINALE COMMiSpOnde alla saura di un soLo caraTere fanaleES qual è ladeurina a proponesione da pure verata i aui rasponsabe e P = & = 0,44 la DISTRIBUZIONE PARSIALE Di UN CARATTERE È CONDiZiONATA aLLa modanta assunte dan altro canale Es: qual e i nuvero medio di Ordenti dei punti ventalia il ai responsori à un como Vado ad analizzare la distribuzione del numero Distribuzione (H) condizionata della X data YEY/ Distribuzione marginale della X, У; П11 у n1; У Пік Totale X X; Пік Пь Хн Totale Пн1 1 Пні Пнк Пк Пн. n Distribuzione (K) condizionata della Y data X=x, Distribuzione marginale della Y 12 ESERCiZiO FREQ SOTUARIA gan inece 28,6 71,4 25 35 100% ASSIDUA 50911 59155 1007 TOT 66 39,390 1001 A) %. successi è maggiore per gliassidui? n° successi -> .50= 90. 9 %. asside 55 " est. di chi ha recuan ilesameassiduationie ha n° -)10 = 28,6%. 35 B) In Qual é il Tasso di successo ama prova intermedia in genorale? 60 = 67,7% 90 38 = 33,3% che un legame tra la frequenza. la cosranza per sperare la prova interiodia c'è associazione perché 66, 7 $ 33,3%. ! SE FOSSERO STAi UGUALI NON Ci SAREBBE STATA ASSOCIAZIONE esoMazo MALATTIE CARDIOVASC Si NO TUMO Si NO 50911 1021 5 91 318 Mis 60 50 1 4040 50 nij = n11 n22 : 35 1004 55100145 100 / di quali chenon fumano qual è la percentuale di quelli che hanno malanie card. l: 10 = 22,21.%. 45 PrO/noç = 35 = 47,8 %. Psi/Sif : 5055 = 911 PrO /Sif : 5 2 97. 55 INDIPENDENZA -> Due caratteri X e Y si diranno indipendenn se la distric molarive condizionare di un callattere rispeñto quamodalito del altro sono uguali ASSOCiAZiONE -> in presenza di qualche lename tra x e Y. lo studio della Melazione tra i due cardieri richiede di distinguere la ripologia di caratieri che si - specificano cendensceressari a studiare la dipendenza interdipendenza , DiPENDENZA = studia come le modalità di un carat dipendano da - di un autro caraTere secondo un legame unidirez , INTERDiPENDENZA = si assume che i due caraTeRi abbiano lo stesso nudo e che il legame sia bidirezionale. * il carattere x si dira indipenconte dal carattere Y se tutte la distribMolarive condizionare risuitano uguali tra loro e giali ala distric marginale.. viceversa pery. esercizio MALATTIE CARDiO Si NO S50.33 I 22 FUMO NO 10 27 3518 TOT 60 40 TOT 55 45 marginali 100 Teonicho• dal conte che si noeneessoercaso in aui nonavessi rossun tipo di associaziona nij -Mi..M.J n nis = n1. x n. 1 = 60.55 33 n 100 60 : 24 100 n21 = 55.40 = 22 100 (60-35) " 2 = = E n'if n22 = 45.40: 18100 L= (50 -33)3 + (10 -22)2 33 + (5 - 22) + (35-18) 18 12 8,75 + 10.70 + 13,13 + 16,05 = 48, 6 c'è ciperdenso *! Se non a fosse stara dipendenza x? = o per passare da un indice ass. a uno nel => T - min (I)Max(I) - min (I) V = V0486 = 0,697x'rel = (2. 100 - = 48,0 1486 100 eserCiziO Porzione verdur SPOT Si10.6 TO 2 5680 5 14,1 4 159 28 53 20 so 30 100 nel = 20. 53 = 10,6 100 112 = 20.47 = 9,4 M31 = 30•83=15,9 100 n32 = 30.47 314,1 100 121 = 50.53 = 100 H: 3. K=2: 1, 100 n22 = 50 • 47 = 23,5 100 X (0-10,6)7+ 120:04 + (25-26 2+ (25 - 23,5) - (28-15.9) 7 (2-14.3 = 10,6 + 11,95 + 0,085 + 0,096 + 9,21 + 10,38 = 42,321 X'rel: 42, 321 = 0, 423 V= 10. 423 = 0,65 100 in una Tabella Metanodaro sdo il caratere che ha un numero inferiore di modalità puòsupendere perijeranonie dal auno Vendita on line Tot si по12 Centro X1 Semicentro 4 о 2 Perif. X3 о 3 To 5 5 INTERDiPENDENZA PERFETTA -> 4 2 3 in questo rabella lo vendira onlina(y) diperdedan ubicazione (x • рендеташир : X NON DIDENDE DA Y seX = X1 -> 4 = Vs X = X2 -› 4 =42SeX = X3 42 X, X2 Tot 4 о 4 Y Y2 2 2 Уз 0 3 з Tra due carateri X e Y esisTe inierdip- endenzaрендето se a gri modalira di uno dei ave coMMispOnde una e una sola modalitadel autoсанатене e Tot 4 PUO' ESSERE SOLO RAGGIUNTA SOLO NEL CASO DI TABELLA QUADRATA. 2 3 9 "'INTERDiPENDENZA TRA CARATTERi QUANTITATI es alterar Persone mano pesant ara x • • Persono Pesant * е 4 sono enaciti санатені quantiTativi X' = x-* Persone + basse » 1 es. peso ½ GRnAiCO A DISPERSIONE / SCATTERPLOT " до секто я олато дорію модомато un uni с тата міронтат i puri ii accorgo di due cose • Sumature di cane i insieme dei punti riporTaTi DEsumo le sia донше generale cerco 3 formo : 1. зочно fià mano amngata e inclinata posivamente • Jorena allingara e indinata negarivamenne , cioè a scendere 3. una sorTa di sfera, una forma circolare I e II quadrante =scosTomenti • se una dimenta, aumanna auche l'autra i prodo ti degli scarti avró cegno + TeIИ =scostament discordi PRODOTTi DEGLi SCARTIauranno segno positivo per i puri del I e I 9. e педатію рен i punni del TI e Iv g. Segno algebricoQuadrante IV prodotto Concordi Discordi Concordi Discordi la somma dei "SCONTI chiamata CODEVIANzA SinTeTi200 la distribuziona la distribuzione dei punti nei 4 quadranti e < 2 (xi - X)(vi i=1, Se 70: prevalgono i puri nel I e TI Q. : RELAZIONE POSITIVA (CONCORDANZA) .Se <0: a " nel II e IN 9: RELAZIONE NEGATiVA (DISCORDANZA) . se = o r. punti uniformemente distribuiti nei 4 quadrani: Hel. citica na 10 * corcordanza: se la maggios porre degli scostamanni sono concordi REGRESSIONE LiNEARE SEMPLiCE So la SEGRESSiONE Si Studia lo DIfENDENan di Cha laMabile. REGRESSIONE: individua una lamiabile cavo dipendente dal alti e analizza la relazione di dipendenza oria dava seconda оніша Si analzzava l'intendipendion20 con il chi - quadrato) CORRELAZIONE studia l'Associazione tra due lamiabbili auttraverso misure " simunetriche di interdip. (concord. o discordanza) -, a un ara deschitiva è un semplice HETODO Di INTERROLAZiONE L› arraverso i equazione di una retta cerco di descrien la nudadisperdione dei ann osservaTa nel diagramma Date due variabili KeY"'aMabile V (DIPENDENCE) sia influenzava si è inTeressaTi a comprendere cane dalia X ( ESPUCATiVA I e dunzione di X se pa ogni lavoro de e comusponde in del La Melazione junzionale è lineare , se possiamo scrivere N = Bo + B1X Bo. = interceta Bs = coeff. angolare Fahrenheit 6 a 8 d LA - Prof.ssa Tiziana Laureti 10 Centigradi 15 2 25 una relazione statistica tra la Y e la x può essero descrita da : V = 80 + 31X + E -> componente causonente STOCASTICA DETERMiNISTICA Bo (INTERCETTA) è il valore che assume la variabile openciante Y Quando la variabilo esplicatia x = O. B81 = (COSCE. ANGI) indica di quanno varia in media la variano. dipendente y por un incremento unitario di X DEni RETTA HA UN DETERMINATO COEFF. E UNA DETERMINATA INTERCETTA. esempio un campiono di10MeddiTOconsi (x) gemigue aliane si rilevano ilConsuLt .aensle per genorialimentari (Y), in euro. Reddito (X) Consumo (vi) 600 310 650 320 670 340 690 380 700 400 720 420 760 430 780 440 790 470 800 480 34 300 550 600 650 700 750 reddko Il diagramma di dispersione suggerisce la presenza di un legame lineare di tipo crescente A diagramma di dispecsione Con l'analisi di regressione incareSi deve stimano ovola seta che descrive meglio Ta miola di pinne evidenziara del grafico La è stimata-Quando conosciava il valoredell'intericanaau'orginee del coeff.angolare (pondenzon 700 reddito 760 850 STiMA DEi COEFFiCIENTi Di REGRESSIONE Una ovalsiasi metTa y = Bo + Bit Su piano (X, 4) è una stima deua , che li ho calco Sig che licogno calcio REAZiONE LiNEARE ipoTizzaTa Traтите le чете ai dan., Cioèquella che passa arú vicino alla nuda dei del digramma.ASSUNZIONI DEL MODELLO DI REGRESSIONE Affinché dunzioni bene, a basa su una serie di assunzioni Assunsicra 1 ->) la junziona Jlx) YI . BO i BAks , Ei è lindaro per oen -InDIPENDENTi Assunzione 2 -> le SOnO VARIABILi CASUALI [e(Ei) = 0)e LARiANZA COSTANTE [ V (Ei) = 0 рен ogn i = 1 ; iN.Assunzione 3 -> i valori xi della variabile esplicativa X sono non senza STIMA PUNTUALE DEi COSPiCIENTi Di REGRESSIONE Indicheremo con = So + Baxi il valore di Y stimaTa dove So sono le strie da defficien unito dona reto di regressione Si utilizza come metodo di STima il VE †METODO DEi MINIMI QUADRATI ((S) ConsisTe nel ricercare le stime di so e B1rendono cinica la junzione di peralia, che definiamo il residuo comoPeso so osservaro" ale tre omoni spassanne canon la nasgrenanza tra id ênYS = 41 : 41 - (BO + B1x4) re stima êi=• RESIDUO valore Osservaro da calcolare = valore fomio dalla reta si stimano Bo e B1 ossia la SOMMADEi in modo Tale da minimizzare la junzione G. QUAORAT DEi RESIQUi e - Doi MisOlvO un due incognire G (Bo, Es) = E Ez - E ( Vi - (80 + 8s xi)) CAPACITA" ESOLDATIVA DELLA RETTA! Lindice che misura la bania di cañamento dava retta de regressiona di dati è ilCOERTGENTE Di DETERMINAZIONE &° delavariabile devianza totale Misposno Si può dimosTrare che vale la secuente Molazione {141-7)2 = A -4)? ) 6. sarSanna dei avadinan Taralo salSauma quadr. REGRESSIOnE SOS Somma quadran Orrore y^ У (xi, 4i) SOE ê, = y - § У - y / V = Bo + B,x SQT = 5( -1) SQE =587 (45-1) X Si vaniabilira della Y,, come distanza tra il valore e la modiapuò analizzare in due parti, grazie aula vera: la prima parte: é la VARiANZA SPIEGATA ossia la distanzo tra un puntomedia (=4) sulla MeTTa de Magressione (=4i) e la 2 la seconda porte: e il RESiDUO O l'ERDORE ossia la distanza tra.valore osservaro di V(= yi) e il carispondente оконе отшато ( = Ti) allora non è stato un buon Lando COEFiCiENTE Di DETERMINAZIONE 5 (91 -4)? { ( yi -T) ° => гарронто та в = sal 1 - SQE SQ SaT dovranza e ladeva variabiledipendente y тапто шосооно ё и потенатоно se il meraTore divenTo tento miglioro a lareta divuol dire che runo ossia dan errore. misurala cuora di variabilinai Torale di y sprogava dalla dipendenza lindare di yda X . 22 = O /-) in assenza di dipendenza lineare di Y da x (i punTi OsservaTi si dispongono casualmante sul piano (x, 4) evidenzianoол вадамо поп еспеана!RETTA PARALLELA Qui asse X .. Q2 = 1 -> nova situazione.di perferra dipendenza lineare (i un OsSeRVaTi SOnO allinean su unaнета)[SQE = 0 e SQR = SOT] 0 < 02 < 1 Si pio dimosmare che: prû il lavoro di e° si avvicino a 1 minori sono le disTanze deipunOsservaTi dona reTa e migliore è l'cdatameno della MatTaregressione aidan 2= esencizio MILANO 28,BOLOGNA TRIESTE FIRENZE SASSARI PiL PRO CAPITE (X) Prod ry. urb. (V) 570384LIS 677515 100 40 57626.0 1 936 23 313,2 186802095 2 2626Stimare la neradi Mooressione che mente la relazione la quantadi Mitiuti urbani prodota (4) e il pil pro capire (x) X2_28.4 + 29,0 + 26 + 23,3 +13,2 =24 570 + 584 + 454+677+ SI5 г 1560 (xi -*) (Vi -T) 4.4 2 - 07 - 108 1024- 117 - 45 190- 212 -81486356, 1 (xi = * 2 19,3625 40.49146 64165,49 356.1 B1 = 356. 1' = 2,15 GX@E 165,49 B0 = y - B1Ti = 560 - 2,15. 24 = 560 - 51,6 = 508,4 • Calodo del coefficiente di daterminazione? Voloni stiman (previsni) di $ 2 Bo + Baxi / êi = yi - Ti | ei ? / 41 - T 85898 5 0.2S 9. S 13,3 176 10, -110 12166, 84,3118, 14042 -1 S 21,8 475, 24 - 23.4, 2 26860,72 29025116 164 18 409 25S28 24 756 87 z A56,87 276261 (vi -7)2 20.027Adatamauto molto basso Due eventi si cambinano con le operazioni insiemisrione o L'INTERSEZiONE tra dUe QuenTi A e Bo , Ossia A icon ossia qualiar che si verifica quando 6 neawanie sia sei veridi a o contempars" ANB = {x: XEA e XEB ] B o L'UNioNE tra dUe evenTi A e B AUB (ossia quel evento che si verta quando si verifica' almeno uno dei aue evern A ed ANB = SIXEA O X EB } A B La NEGAZiONE di un evenToAquando non si -, ossia A ( ossia quel evento che si verifica verifica A. ACA = AUA A A OA e 6 saManno due eventi incompatibilse AMB = D esempio: nel lancio dei dadi"'esce una faccia contrassegnarasupponiamo da un n° di definire l'eveno A come la negazione del eventovA, indicava con A è castierada evento31,3,53 Supponiamo di contrassegnarfaccia conrassegnata da - I inione tra questi due even, AUB, è cosino dan'everro 'intersezione tra A e B, A 1B , è cosminuira dell' evenro (23 EVENTO IMPOSSIBILE: à d'evento che non può mai vereficarsi, e essere definito ANA = BR8 = 0 | EVENTO CERTO: TUTTi i pOSSibili i i eventos che semidia Sempre erauern cauprende dell'esperimento. pioessere definito 5 = 22. - Due eventi si dicono INCOlIDATiBiLi se : A1B = 8 MURARE UN EVENTO: ApPROcCi APPROCCIO CUASSICO Doro in esprimente Ben recipiente seun evenTo. se fè il n° dei quelli possibili per i esperimerPALOREVOLI del evento wentre nё il пименоdi TUTTi I POSSIBU RisULTATi allora Si P (E) = fIn. perché rai gli n Misuran siano ugualmente possibili es: nel lancio di un dodo l'evenno " si otiene la faccia ceni asaregrare dal numero "aura probabilirapari a di veridicarsi poiche solTanto in1 casopuò uscire il numero 4 casil'insieme possibile dei mismran è pari 6 (casi passibili) DANAiONE : la Arocolalia re боно da надонто пальнинано davorevoliQui eventocasi possibili purché essi siano Tutti ugavenne possibili P(ED = casi davorendi casi sfavoradi Nei giochi di sante : probabilino classica SeTutia cianin gli eventi Sonoprobabilira esaupi dodo , uune , молета , lotteie , мошетте la probabilina di Un evento alomonTasI al nuvero di eventi elementari compongono toTale di evenn Unna -> 11 2334 P (esce il numero 1) = 216 APPROCCIO IDEQUENTiSTA : Dato un evento ben specificato RiPETIBILE la probalalira de e PERFETA è data dal si e presentato serie quando n -> o пае пиретите TOT. roue Gressedelle prove, I1-co1. NON È POSSIBILE ANAUTICAMENTE DEfiniRE il limune insplicino neva definizione 2. Non tutti gli esperimoni sono riperibili esempio: Lando di unamonaTa frequen 20 dimoneta relaTiva del evero testa in una serie di lana 1 0,5 Probabilità 100 n1000 (scala logaritmica) In questo caso caincide con la probabilira dassica DRiNCiPIO DELLEPROBABILITA COMPOSTE la probabilità che si verifichino due eventi A e 8 conTemporaneamente é: P (AMB) : P(A) . P(B/A) : P (B) . P(ALB) ossia la probalatira che si verifichi il primo per la probabiliro che si verifichi il secondo datoil picuo EVENTi INDIPENDENTi Due eventi A e B si dicono indipendani se il venficarsi di B nondel probabilirarobategicalisi di A di B P(B/A) = P(B) J D(AIB) = P(A) da cui: P (A1B) =P(ANB) P (B) P (AT P(AnB) = P (A) • P (B). L'uno non produce effetti sul'altro TEOREM Di BAYES PIAIB) + P(BIA) -+Bayes calcolaP BIA) usando informazioni PlAIBI auTraverso delLe iporesi esempio pratico Pl febbre / influenzar Pl influenza ( jebbre) Il teorema di Bayes consente di caicdare l'una dal autra Supponiamo che l'incidenza nor den influenza sia pari al' 11. Unjebbre ,Soggeto con l'inflenze na una probabilità dal 90%. di avere la Un поддетоsenza influenza ha i Si. di probabilira di avere la febbra. TeoremaAvere , di Rayes permette di sapere qual è la probabilira dil'influenza Si ho la febbre I= avere l' m/luenza 7 = QueRe la febore P(I) = 0,01 4. p (F/=) : 0,90 Attenziono: p( F/non I) è diversa da 1 - P (F/=) Qual è la probabilira di avere la jobbre? P(A) = P(F/ I) P(I) + P(F/[ ) P(E) Il e non = (avera lingl. e non Quere e' influ.) sono due aver incaupara ed esaustivi. P (F) = 0,90 .0.01 + 0,05. 0,99 = 0,0585 Il teorema di Bayes parcete di conoscere qual é la probabilira di avero l'njuenza dato che si ha la jebbre P(IIA) : D'INF) 2.P(FII) (I) , 0,099 z 0, 154 dF) P(#) 0,0585 APPROCCIO LOGICO INTUMINO A2 A1 Аз Partiziona Ai n Aj = ф e mora A1 U A2 U As = 10 B PlAY PrOBABILITA APRIORi O CAUSE P(A2} (NOTE) P (As)Ii Sono nore le de verosimiglianze? e Condizionate P (B / Ai) -> NOTE ., Non @ NOTO : DaTo che uno ha una corta malatia (A) hai un der. Sinonio Dato che miSonO Sueguato venuta quel Tipo di malanie Con la febbre (B) mi è P (Ai / B) = ? A(Ai (B) = P (Ai n B) DIMOSTRAZIONE P (B) B8 = (BN As) U(BMA2) U (BN A3) ((B) = P (Bn A1) + P (BRA3) + P (Bn A3) = P (A1) • P (B/A1) + P (A 2). P (BIA2) + P (A3) - P( B/ A3) Prob. di contrano da malattia DAi B. PIANO . P(G/AI) -> prob. nota che dato che ho qualo malatia mi è venuto quel ≥ SinTomoP (AI). P (B/Ai) n° degli msiemi che ho divido L) теолешаdella proprietaToTale Andialio a calcolare la media conderara aul Jatoche le possiali cause vanno da 1an probabilità a prioni -: Prob. che avvença indipendionemante dal eventoPI BIAi) = probabilira condizionateo verosimiglianze D/Ai /6) = probabilira a posterioni Esercizio Sulla base delle precedenti sperienze è noto che 4 : Studenti con preparazione sufficiente : PS. PS) = 0.AS PIP IS) (esino posinivo daro che ha una preparazione sufficieure). -) = 0,95 P (P / 5 ) = 0. 10 non hanno saula 1 perché non hanno l'evento condizionante 0,05 Si dorermini la adora una che uno studente che abbia superato l'esame P(S IP)=? S P(S) = P (S)= 0,25 0, aS P( P(S) 2 0. e (1 /3) = 0, 10 • Pi(SIP) 3 P(s). P(PIs) P (5) . P ( P/SH+ P (S) . (P (9/3) 0,7125 0,96 0,7375. 0.75 • 0 78 - 095 + 0,28 • 0,10 FUNZiONE Di PROBABILITÀ -) La f. di ProD. di una c.v X moTTe in relaziono i vaLori asSUnTicomMispondenti probabilitada xicon le L- D associa ad agni valore xi la probabilinai P(X= x:) Xilavori della v. C P(x) X1 P( x) X2 P(x2) . . P(x;) PRODOTTA: 1. P( x = Xi) > 0 2. {P (x = Xi) = 1 => O2P (X = Xi) 21 2- esempio moneta 112 1/4 in corrispondenza di ogni dela barra vernale ho un'autezza proporzionale alla 2 FUNZIONE DiRIPARTIZIONE -è un concetto identico alla frequenza relaTivaamularalamiabili diceva i n° diuniTa quello che stiamo sTamanche in densare randeo é vilecalcolare le probabilità probabilitai che la 00gV..C X • силикале ,ossia laossuma un valoreugualeо шпонеa un dato lavora P( X s xi.) + reni esempio della moneta FW) 1117 314 1/4 114 P(X = 0) = & Funzione a GRADIN 12 2P.(x) 1 |4 ) I114 1 -D A o prende la sua li di prob. a 1/4, nul 1|4saldino a a e ai salta a 1 ->* F(x) 1/63/4 -) è la probabilme 414 обстона аозній da un ni du nel lancio di 2ud quale 1 F(x) = { P( x) | PROPRIETA" : F(X) non decrascenre ossia x1 < X2 =5 F(xi) < F(X2) lim F(x) = 0 lim F(x) = 1 X ->1- X> Д HISURE SINTETiCHE DELLA DISTRIB. Di PROBABILiTA DI UNA V. C.DISCRETA VALORE ATTESO (EXPECTEO VAWE): aTTeso perché i MisITaTi non sono E(x): Xj . p(xj) ! Non c'è biscono di dividere pern прочана о скосовнета запо діа VARIANZA VOI = 2/xi - E(x) ) 3{. P(xi) DEVIAZIONE STANDARD SO (x) = JV(x) esempio: VC. numero di tesie no lancio di due manere P(x) E (x) = 2 xi . P(xi) = 0 . 0,25 + 1. 0,8 + 2. 0,25= = 1 2/4 12 1216 V (x) = > (xi - E (x1) 2" O(xi) = 114 = (0-1)? 0,25 + (1-1)? 0,5 + (2-1) 3. 0.25 = = 0,5 (SD(K) = V0,5 = 0,$ 10 Q 1) VARIABILE CASUALE CONTINUA Ly una V.c si dice CONTiNUA se può assumano tutTi i caLOMi di un dot. intervano di niveri reali 0.04 0.08 0.12 0.00 Densira" Consideriamo la ragazzi. La v.c. a • Sul l'asse delle x altezza suddivisa inca suddivide l'interv, Probabilità che • Sull'osse deney: densino 166,0 e 166,5 Si suddivide l'intervallo in N piccoli intervali Area compless Area calpessia degli N matTangoli è uguale a P (a e X 2b) : Area saTo la curia compresa tra a e lo. IL) cosi come non isragnamma la frequenza era l'area dal rest.! FUNZIONE Di DENSIDA La v.c. conTinua è defina dalla junzione di densina (x) 1) la funzione deve essere POSITIA. 2) L'area toT. sorTo la junziona deve essere = 1 f(x) - 91 X 409 P(O = X = b) = SI(x) dX -> è l'area che sta sopra l'inTerval (a, b) e sono la curva integrale in un punto non è definito 887 cariable casuale continua non viene mai chiesta la probabilina la variabile x assuma uno specico valore definie.wa viene chiesia che уко сооне , Рекске Асо біINTERVALLO DI VARIABILE CASUALE BiNOMiALE " CONTa di base uana lanicisio di bernali conee questa prova viene riperitaA vOLTE DIfeTTOso Prava 1 " NON DifeTTOSO In prove in Cui IN OGNi SiNGOLA PROVA ABBIAMO UNA BERNOULLi. Prova 2 e dijentosa " non difettosa 1 X~ Bin (n. 1) T -) rappresenta саріна qual guanTi SUCCESSi abojaLo in Aproc , infatti vogliano la probabilira che la mia variabile casuale X, assuma il valore x -> x assero valori da o fino ad n FUNZIONE P(X) = n'X!in - xI) ESerCiZiO In = 5. 1 = probabiliTa di successo cover difettosaT = 0,20 Qual è la probabilinai che 3 di quesre siano L› P (X = 3) = ? P(X =*) = int y! (n - x !) 5!PIX=3) = 31 5- 37 = 10 0,20 26.4. 3-2. 371 . 21 0,008. 0,64 = 0051 (1 - 0,90) 55-2 - 2 z • 0, 203 0.80 : al mas PIX3 3) Ls X 1) 0: 3 21 Si calcolano 1 alla volta e poi si somma o con la Funzione di ripartizione 1) P (x = 0) + P(x = 1) + P (x = 2) + P( x = 3) 2) 1 - [ P (x = 4) + P ( x = 5)] 1) - VALORE HEDIO Elx) = n. M. - VARIANZA V (x) = n. M (1-17) eS: E(x) = 5. 0,2 = 1 V (x) : 5 . 0,2 (1- 0,2) = 0,8 V. C BiNOMiALE: 1. è una var. c. DISCRETA, che può assimere tuñi, valoMi compresi VARIABILE CASUALE Di POISSON ->Si da genera le re e e den santo al circosCriTTi es: n° di incidenti perconso stradale che si possono e anidi setSu un cerTo semilano gli evente si ceventi si possono presentano 0 .volte possibile prefissare un limnre massimo teoMiCoASSUMERE UN' INFINITÀ NUMERABILE Di VALORi la distriluzione di probabilita indicata: × ~ Poisson (x) P(x) = X é -* X = 0,1, 2 XI.. Dipende da un solo parametro 1 -> coincida con la sua MEDiA e VARiANE E(x) = 2 V(X) = 1. la distribuzione è semore asimmeTrica cosniva tende al crescere di 1 0,40 DROPRIETA' 0.35 Poisson(1) 0.30 .. la samma di U c di Poissa 0,25 Poisson(3 indipendenni è anco a una 0.20 v.c di Poisson Poisson(7) 0,15 2 = 210,10 0.05 se io prendo 2vorab. di POissonCOn 2 = 2 2 = 3. 4 SIETE 16 I è ancora una posson esalpio 1XI e*2 04 15 0 X = 0,1,2,3 * ~ Poisson (2) 1s minuti in cuedia passano8 auTo, calcolare la probabilita cha passino 10 auTo A(X = 10) = 1 2=8 10p (X= 10) = 101 • _e 82 0,099 se pai chieda dicaldare in 30 minuni valorale mia 6 25 91x (25) = 2X=025 Junzione di Mipartizione P (X > 25) = 1 -5 2* X=0 X! 10 Q ESERCiZiO BaYeS. è 1 setimana, . So ora 2 "o restanti jra è nono ana una consezioneri cade tra 1 serrimana ha una probabilita 0,06 essere Quale che scociono tra è quale do 3 =prob. Qual é ladeteriorarà robabilinacade a 0,02che una scelta a caso risuto scoda tra 2 Sen A sei 3Seu 30 confezioni P(1S) =10 = 0,15 P (25) =50 = 0.620 p (D / 33) = 8 (58) = 38 : 0250 P( D / 15) = 0,05 1 (0/25) = 0.02 P(25 / D) = ? P(2500) P(D) P (25). e (0125) P (15). P(DI1S) + 6 PS) - P| DI25) + l(3s) + 8 (D | 35) D = (An 15) tU (Dn25) U (Dn3S) 5, Up P(15) . ((0 / 15) DiSTRIBUZIONE DI PROBABILITÀ PER VARIABILI CASUALI CONTINE RE, UNiMO CALi , L'ASSE Di SiMMETRiA = che divide la disTribo. in 2 parti uguag MEDIA = MEDiANA = MODA dx) Quando una variate è continua prob. FUNZiONE Di d (x) = GE (esprime la variabilira di una distrib.) adistanza tra l'asse (H) e il 9 di ha junzione CONTiNUA definita tutta l'ossedelle x +00) È un AsiNToTo per la V.C. Nar : Pano Di flEsso > punto in Qui la curva da concavadiventa convessa. - A 24 2 + 0 6330 dedinisce a nalatonionconcounsi distibuiscono i colori assunti unav. aleaToria conTi. in un deT. intervano. PuoI DiBTrio. di probo.. della v.C. Norde indicara con X ~ N (H ; 02) « la variabile si distribuiso secondo una NotaR » . è descriva daiparamerria: - madia (y)lanan20 (02) Per calcolaro la prob. P( X: a) useremio la FUNZIONE Di RIPARTIZIONE Fla) . j° 00 per calcolare P (a2b 2 c) F(b) = F(c) - F(a) a per calcolare P (X > c) F (X›C) = 1 - F (c) ASi Di DISTRIB. NORMALE 3 STESSA MEDIA, VARiANZA DILERSA 0=0,5 Minore variabilità 0.75 0.8 0,15 A paura di media auro diverse distrib che avranno un- incurvatura dipresa poichéMAGGiOR È lAVARIANZA' E PiL SCHiACCIATA SARA Maggiore variabilità LA QUQUAN(0;1 0=2 0=3 0=4 0.0 3 DIVERSA MEDiA 0.45 г SIESSA VARIANZA AparITà di T passo trovare inefinire comiabili per coni I 4Al aumenidire Sona MEGA, LACARIABILE TENDERÀ A SPOSTARSI VERSODESTOA DiSTRIBUZIONE NORMALE STANDARDIZZATA Parendo da una X ~ N (4, 52) con la trasformazione di standardizz. x = variabile alea понша -> SiOTTiene la DiSTRiB. STANDARO. NOONALE 2 ~ N(0:1) i paramerni sono: 1 FUNZIONE Di RIPARTiZIONE DELLA N. STAND. ф(2) permeTte di consolare lo secuplificare i calcoli dalla анееSotese dalla J. di densita ESCHaZi X ~ N (500 : 36) 1) D/X> 510) =? 2) P (4901x 2 506) =? 3) P (x 2495) = 2 SO% SOC 1) 2 = 1x - 4 = 5101- 500- = SI0 - 500= 1.64 dobbiamo prendere il valore nena Tande di 1,67 A(a) = 0,9525 P (7 > 1,67) = 1- 0,9525 = 0,0475 P (X>90) = 0,0475 dALE 1.67 P (URO 2 X < Sio) 0 (71 2 7 222) 1). namino conie 71 = 490 e 72=005 290 000 60 2. calado 31 = X-H = 400-500 = - 1,07 22. x-4 - 510 - 00 = 0,83 3. caldo Tarea campresa jacendo $(32) - I (21) = Q (0,82) - Is. TutTi i CaLoMi negariù si travano jacendo 1- & (1,67) P (490 < x <50) = 0, 7967 - [1- 0,9525] 2 0,767 - 0,0475 = 0,7492. 3)D (X <495) d/8 7= 495-500 = -0,83 40s 500 - 0,83 $ (-0,33) = 1 - Ф (0,83) = 1-07967: 0. esercizioLimporto dei canoni di locaziono una assegnan in un Quarti понтавтолоталоне medioseguendo una fangua caso, anouna o di 18. 6 € a) la pido che pagan un suito compreso tra 40 e 75€ b) и и " 50 e 100 € 2) и и Superiore a €10o d) i valore donaffi Quil'Bo'% delle Janiglie spende wono X ~ N (75; a) P(40 < × < AS) 40 75 ile91 = 40-7518.6 - 1,88 72 = 75 - 75 18,6 PIGO e X < 75) = 3 - d (1.88) = $0 - [ 1 - $ (1.88)] = 0.8 - 51 - 09699 = 0, 3 - 0,030 = 0.4A b) P (50 < x 2 100) 71: 60. 15 18. z. - 1,34 бо 100 22 =100-75 = 1, 34 186$(1130) - [1 - & (1,34)] = 0,9099 - [1 - 0,9099] = = 0,9099 - 0,0901 = 0,8193 c) P( X > 100) 7= 100 - 75 1,34 18,6 ф( 1,34) = 0,9099 P (X> 0,9099) = 1- J(7) = 1-0,9099 = 0,0901 d) 201 204 E (#) = 0,80 P ( X < x*) = 0,80 7* x*- + = 2* => ** 75 = 0,84 18,0 =) * =. 25 +/18 6•0,84) 2 90,62 e il valoredell'affitto per cui il 25%. delle Jamiglie spende mano. 125% P(X 2 x*) = 0,25 5 d (2*) = 0,25 non cë quindi vado Sule tavole prencere -74 0, 7S e poi cambio sEGUA - 2*. xt. M 2) x * -75 = 0,67 18, => * X*= 75 - (18,63. 0,67) = 62,58 DiSTRIBUZIONI CAMPIONARIE STATSTiCA DISCONTIVA: insicure di meTodi per ma gorasentaron e іптенрета но. in insieme dati con lo scopo di coscriverno le caraTteristiche. STATISTICA INFERENZIALE metodi che consentono di stimareUn ранашетоdella popolaz. e prendere decision sulla popolazione. .. CAMPIONE CASUALE soTtoinsieme della popolazione(alani cotanti selezionati casalmonte per un ' intervisa, consente di Ottenere misurari StatisTici con precisiono sufficientemente elevaTo , PARAMERRi: cosTanTi che descrivoro aspeñi carattensnci della distrio.INFERENZA STATISTICA -> il problema è quello di conavare la x e T L>don dannas se voi lamano a " cognan cola popraziona conosceroранашені PoPOLAziOne) CAMPiOna n POPOLAZIONE fiNITA: insIeme di L tutti i dipendenti di un'azienda) POPOLAZIONE INANITA: insieme di Tute la uniTapotenzialmente osservabili L tutti i beni che un processo produtivo è in grado di prodine, Estrazione casuale I parquetri da stimare Media (M) Varianza (62) Proporzione (T).e Si rennagina che la pop. venga distribuita con NormaleINFERESTA STATISTiCAPARAMETRICA -> processo di induzione di tipo QUanTaTO X Ci L'INGERREZZA del procedimentovien QUANTIFICATAINCERTEZZA: doviTo a2Fonti principale 1) VARIABILITÀ CAMPiONARIA : Tuti i possibli campioniSono diversi quindi Loro analisi produce risultati diversi solo campione? manica si dispone di un 2) ERRORi Di HigURAZIONE: in modi casi HipeTendo la midrazione della sessaentita di otengono valori divers nona prancasi dispone di ma sica misirazione xogni entike LA STIMAstuare: atuibuire un valora plausibile a un parame mo incognino. UN SINGOLO VALORE INTERVALLO DI STIMA = - quando un sana. dona pos @ stima.ro ATRALERSO UN INTERUALLO Di VALORi CON ESTREMI DATI DA UNA COPPiA di VALORi (a , b) STIMA PUNTUALE X -> V.c , rappresenta il camaTanoasserwano sulla distrib prob. e di forma rd la fienod'interess di qualcho parametro includiano : madia aritmetica L, e DiSCRETA => la sua d. di prob. e indicara con P (x; e) è CONTiNUA = la sua. di densira e indicara con f (x; 8) Dato che il paramento A non è noto, si dafinisce STiMATODE PARAMETDO ogni stanstica T = tl XI , X2 YnT Utilizzata par stuano € la stima del paramono di interesse ASSOLATODALLO e : +(x , xn ) è il VALORE STiMATOREin conrisporcienza di un posericolare compione osservato PROPRIEMA: DEGLi STIMATORi 1. CORPETTEZZA A vale che ( E() = 0Valore arreso al L› paramano da La DiSTORSIONE Di UNO STRATORE T (O BIAS) è giale a (B(I) = E(T) - 01 SeST) so allora in modio Se B(T) 20. T soTTosTima A DiSTORSIONE DI UNO STiMATORE TI e T2 STImaTOMi di e E (is) = 0 -> этатоне сонжатто dis E (52) 2 A -> II diSTOnTO dI 6 B(12) = E(+2) - O é la distorsione dirE(T,) E(T, © 20 2. EfFCIENZA -> d'altra parTe il valore medio di una coriabre c. è tanto più rappresentarivo deva distrib. quanto più picida è la dispersion dallo stimato de al Socolormedio ERRORE QUADRATICO HEDIO MSE (T) = E [LT - 0)2] -s assuma l'ennora che si cammette in madia utilizzando i рен STimare Tiene conto della c2e della distonsione di uno stimatone. 4SE (T) = VAR () + ( B(5)I ° . Se lo StimaTORe è correTTO => BlT) = 0 => HISE (T) = Var (T) EffiCiEnZA RELATIVA Dati 2 sTimaToriTI e- I2 , del parameno A,T1 € più efficiente di T2 . se e são se: HISE (TI) < MSE (T2). ' Cervo seplera to a gruensai non disori ei poseiso gato DI BASSA Più EfFiCIENTE та е т2 отішатоні с 0 Vor (+1) < Vos (12) -D All'esame dobbiamo diserrano 2 V C Nomali che hanno quindi mente aшета il valore medio perfetta. Al pOsTO di A =S E(T) = A DROPRIETA" ASINTOTICHE DEGLi STiMATORI L› valgono solo per campioni grandi, avvero per n-› ioSi usa la 3. CONSISTENZA IN MEDiA QUADRATICA/ ( Si sTila il DeGiotad error) Uno stimaTOre Tn e consistente in cedia quadratica se limHGE (In ) = Aut E (in - 0)2 = 0 si ha sdo se la una e n ->o la disTorsione tendonoa 0 al crescere di n. 4. ASiNTOTiCA lice ELin) = Al aumenTare dela nerosina campiona Mia la distorsiono tendo a o e quindi diventa sempre più preciso. esempio Un azienda che produce cereali per colazione unde conmollare le proprie confesicatendae seneramone media pesano aziendavolo 360conrollare che effetivamonte dia quella polle scarola X~ POPOLAZIONE (dOve X = paso) -> da X~N | M : 03) L) ignota Viene estato un compione , dove ogni variabilo che lo costruite è una che cenconoTEE(X „Xn) SinterizzaTe lo stiLaTOLequale Viene scelto seguendo le prorietà: _PerStimare la media della vedia aritmetica che Contoro scalcaicare ormainse edicieure e consisiénre X =1 Exn имодташо Sg presente della bisogna: . Sariveree il valore del peso in ogni elemono del campione n = 6 e i pesi sono 353 , 348, 345 , 350 , 340 , 355 (coup. 05.) - Calodo la media X = 1. 5 2090 = 348, 6 ( STiMA FUNTUALE). Allastimapuntuale bisogna Doganciare una misura di emone - › L' iNcons ZZ X + MARGINE DI ERGORE: Ho-)Manenediemone Allora vo o Od tribalinee n r " *= 340 compresa tra (343 : 353) Marcia= ~an, _ la Ounchozza dall'inTer è lo , suote tars Sondandizzande a gontine dona distrib.di I si OTTieno lo VC. t di Studenti. n-1 gradi di libertai T. 5; 14 T è compreso tra -+212 e + t2/2 -) i valori si ritrovano d (t2/2) ' tta/2) PIX . (1212 5) = M = * + (td12 5)] = 1 -. esempio X ~ N (M; 03) g2 non nota 352, 348, 348 350. 340. 355 Stima menvallane al 951. X = 348 => stima puntuale + t212 S In di M - )una retrone S= n-1 2 = 0,05212 = 0,025 252 -> (352 -34B)2- 16 348 -> (348 - 348)4 345 -> (345-34812- a 350-> 40 -> (340 -343)2- 64 355 ->(355-348)2=493142 S = 5 21 : 348 = 2,57 = J28,4 = (5,31) -> Stima puntuale della varianza della popolazione 5.3 = 348 + 5,56 = 342, 44 (2 =348 -5,56 = 353,53 1 - 2 = 951[342.44: 353,53] 13) POPOUAZIONE NON NORMALE Sebbene non si conosca la distribo del саматенаneI TEOREMA DEL LiMITE CENTRALE che quando.la nuorosiTai campionaria la media campionano sidistribuisce come unaV.C. NORMALE QuindisTa dardizzara/se ne grandna nontiate-) dato TLC X tendo a ~ N (O: 1) -› viene 7 = § - M tendo a ~ N (0.1) G/JA INTERNANO DI CONFIDENZA => [X - (21/2. 8) : X+ (2212. 8)] г. esempi DATI cOSO non hora e n grande Xi3403501358 Ni 2 = 907. = 0,90 sO 1060120 Essendo i grandee non conoscendoné la cadia né la = La riconduco T che ca una normale e ciò signyico che considero SUbITO 7212 . calcolo la x = 1 E xi. ni= 343 n1-2 = 1-0,90 = 0,10 =› 2/2 = 0,1012 = 0,05 => $0,05 = Devo calcolare X + (22/2 - [) ma ho bisogio di o: 57 = ni : 9,9 -> 5 = 3,14 = V9,9 n-1 *= (2412. 54) = 343 = 1, 64 11: 343 - 0,47 = 342,53 12 = 343 + 0,47 = 343,47 3.4VizO STiLLA DER INTERNALIO DELLA PROPORZIONE T Popolazione Bernauliana сонатена che •studia assuma duse sola modalira. Presenza / assenza di in X = 1 con 000 . T X = 0 con prob. 1 - M Como stima antuale di ir si usa la prop. campionaria P P = n°oss. camp. con attrib. di interesse n° came P 1 { xin POP. BERNOULiANA ( INTERVALLO APPROSSIMATO PER GRANDi CAMPIONi) Se né grande -> doTo il TUC X tende a ~ N/T : I( =-T)) -> Viene standaMdi72. como na normale = tende a ~ N (0. 1) esempio In un receneSandacon. Condotto su un campiona 60 casuale di 1000 individudegli intervistiani ha aftermanodila dolnebenzanella regione in chi vive 2)al livello. 2=percentuale 0,05 cosTruitO l'intervallo du confidanza au tale b) al liveno 2 = 0 vo verdicare se il MianTaro campiorario conferca icoresi n = 1000 2=0,05 p= 0,60 1-2 = 0,95 T = a) PrN (F ; I (1-M) ) P - 2212< -M (T < 2212) = 1-2 111 =P - 7d/2 12 = P+ 7212 . J0(1-0) : = 8.03 0.015 0,60 - 1,96 • 0.0.04 = 0,571000 0,60 + _20,63 b)1-2 = 0,99 2 = 0,01 t (0,005); n- 1 = 3,84 212 = 0,005 |2,03 - 5,84 . VOos3 M = 2,03 + 5,84 ULI Vgas) = 99 % (1,682 < 4 < 2,295) = 99 % c) Aupiezza = 2 . t212 ; n-1 più precido Amp. 90 = 2 . 2,35 .Jo.ois 2 . 2,35.0122 = 0,28 Ja Aup. 99 = 2. 5,84 . Voris 2. 5,84 .0.223 0,71252 "' Au ampio é l'intervallo e meno è accumaro Y MARGiNE Di EORORE » indica di guanno ristina coupionaria dal parameno incognino - MiNORE sTima den emore masgione é la precisiono della NUMEROSITA" CAMPIONARIA PER OTTENERE UNA DATA ORECiSIONE volendo derermnarecheasSiChrO . in OnTiCIDo la DIMENSiOnE campioratia cha dato procisioneSi usa la RELAZiOnE trOno ne l'ercore g б = 2212 - ) MARGINE esempo L'intervallo di confiden2a transazioni On eine Samato рен [S4,04 l'imporno cadio delle59 75) ipotizzandn = 30 03=40 , 1-2 = 0,95"'етонеé =€ Vdendo strataro " (alcolare (on formula) questewassino calsionario1€n = (tal2.9) = 1,96 è qualoqual lanumerosma 21 - 188.23 = 188 in erroneche des esmane ? VERIFiCA D'IPOTESi Un"ipotesi staTistica é un"anarmazione o una concerTura riguardano ранашето della popolazione SOTTOPORDE A TEST = Dvalutano la plausalira alla luce delle informaa campionarie POrESi NULLA (HO): coincide con atuale delle cose o con atTuale convinzioneriguardo adun colore 40:0 = 00 assunto. da un parametro. IPOTESi ALTERNATIVA (H1) iporesi opposta e compramenaro a te H1: 0 = 00 le iporesi possono essero • ipORsi del tipo A = Do oppuMo O = AL =› IROTESi SErALiCIT (A solo valoro del parametro) iporesi dal tipo A, Do BS70 o A+ 00 => IPORESi COMPOSTE FAISi 1) PER UN VERIAICA D'IPOTEST Di FOOMUCAZIONE DELE IPOIESI Ho • e He > 00 UNIDiREZIONALE DESTRO . H1 10 < 00 UNIDIREZIONALESiNiSTRO • H1 : 0 7 00 =) BIOIPEZIONALI FASE Di ESTRAZIONE DEL CAMPIONE (XI X2.. composTo da una succ di IN.C che sono id 3) sucampione dovrò appucano una STATisticiA tEST e OSSERVAZ. del Misurano 2) PRENDERE UNA DECISIONE e FisSARE un LiveLLo di ERRoRE ipoTesi (ACCETTABILE /NON ACCETTABILE) (L= UNENO Di SiaNFiCATiVITA" o SI aggnise l'area di ace e nolio ACCETO RIAUTO HO VERA Decisione comeraprob (1-2 D. SBAGLIATA ERDORE I sPECia Prob =d Ho non è vera O. SAGUATA ERRORE II Prob : B Decisiona CORRETTA ERDORE I SPECiE = Bi MIrUTa HO ma e poresi nulla e vera. P$ = 2 -> Mappresenta l'auspiezza dolia regione di Mijilro ERRORE II SPECIE = Si acceTTa HU la l'iporesi nulla ejalsa TEST PER LA MEDIA DI UNA DOPOLAZIONE (T? NOTAT 1) Si calinisse, in roenia di icopsi de parameTro della pop. che .M = MO 1s : U > MO H1 : M < NO H1 : u 7 MO 5555-9 secondo 2) Si estrae un campiora di n unina 3) Si specifica una STATiSTiCA DEST X ~N | 40 : (3) si passa alla STANDARDZZAZiONE 7 г X- . ~ N (0:1) 4) DefinizionadOUlO ZONA specificazione deiVALORI Q. aN ( HO ; (2) UNKARERAL DESTRO 2=0,05 2 -> prob. di commenere errore(2) 'Arca di ACCEIAS. 2c ( 22 -> accotto 2C > 22 -> Mijiuto L, Megiono di rifinTo yVALORE CRInCO. p- vale Se n è grande n= 180. la distribuzione stanisnica tesi puo edito approssimara da una v.C NORMALESTANd бото н , рогтс 2 = x - 4 il Misutato lo idantifichiamo S/Jn come 2a . al CONFRONTO si vede se 3c è maggiore o inferiore a 2a D_ - QUELLO Di SIGNAICATiVITA- OSSERUANO indica la proba che quanno stano sostegando dia correão esempio con un piccolo margine damore L'aderio alconTrano di un processo vuole stabilire se il mediodichiarano di 500 grdalle se sa cale tens QuesTO Si estrao , un compione casuale di 25 confezioni a si peso lorenendo un valoro della media pari 480. precedenn è noTo che la D è ari lo 35 7 e che il peso popolazioneSi distribuisce normalenne verifichi iporesinullaed un livello di Sienficariuna dei colare il calore del P - value associato utest (unid. Sinistro) SHo: 4 : 500 H1 : M < 500 DIENDiONO 2=0.01 20 =X-4 n= 25 1- 221-232 0 X =480 0? 35.7 480-5005974 5 = HA =16.7 1, 194 X = 4087 2c= 402. 500 597 / 525 = - 2,51 -251 2.37 p- value reijitero Ho. => I (-2,51) = 1 - $ (2,51) = 1 - 0904 = 0,006 si Mijita Ao se p-valule< 2 | u Utica lezione esercizio26:00 TEST PER UNA PROPORZIONE: BERNOULi la distribuzione di probabilirai è unaBernalli di parametro T i sistenu possono essere 3H9 Tito : NO 1 : M + NO < NO per n grande la statistica resi sañto Ho è una Norwale stand. 9 =X -No tende a - N (0 , 1). No (1- TTo) n x equivale alla P(proporzione campionaria) Esempio In uno studio nadi Us e stato selezionato un campione di 12s armacistial quale è staTe samministrato un questionario. daledaande riguandavaFica nazionale l'essere iscritto meno all'associa dei gatmacisni (ANA) con modalitoi di risposta SiOrOMan indagina amarne che il n° diDarmacisn iscritti è pari a 60 Ala dei dOS e assumendo che proporzione di ruccisi iscrittiQui AN noLa pop. e si distribuisce normalion to a) costruito la stima inT.scritti qui ANf nella pop. Pestello proporzione di D ngicenza" del degni b) - алое о соно di sn от ні "' Ne asio.di isCritti ugiale al Sor.contro e' altervativa che siaweggiore.infenore P~ NITT M (1-1) ) 1-2 = 0,99a) Sima x inTerú. n P ( - 2212 < 7212) = 1-2 2 = 0,001212 = 0,005 $(0,085) = 2,57 n P = 2212. SRLA-R) p = 7 = prop. campiorazio P= 60 = 0,48125 7 MARGiNE di errore 21 = 0,48 - 2,57.9.48.0.52: 0.48 - 0,11 = 0,37 e2S 12 : 0,48 + 2,57. 048. 052 = 0,48 + 0,11 = 0,59 b) verifia Ho : i = 0,5. H1 : MEO, S 2 P = 0,48 2=001 2(0.01) = - 2,32 - 92-2131 -0,447 1) calodareStanistica resi ACCERIAZIONE 9 =p - No Io (1-To) posso commonere II ERRORE L> specie = 0.48- 0,500,5. 0.5 125 2 - 0,02 2_ 0,44 7 0,0447 accetto mi' iporesi quandoè jalsa p- value P (Za < 2c) = P (2 < - 0,447) =ф (- 0,447) =1 . $ 0,447 = 2 1-0.67 = 0,33 > 1 detenclinaro la numerosia .ducuezz0H0 енноно nelle .campionaria nocessaria per Divello 1 - 2 = 0. siesse condizioni di indagino e al 2h =2212 2 -> margine di errore 0/2 = 0,055 n= =), =0,48 MASSiMA mOnezza 2,572 0,48 (1 - 9,48)(0,055)7 § S4S 0 : 2,51 O sI (0.055)° = 546
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved