Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

Metodi statistici per l’amministrazione delle imprese, Dispense di Metodi Statistici Per L'impresa

Eventi e probabilità. Esperimenti, regole di conteggio e assegnazione della probabilità. Relazioni di base della probabilità. Probabilità del complementare, dell’unione e dell’intersezione. Probabilità condizionata. Legge del prodotto. Eventi indipendenti. Teorema di Bayes. Variabili casuali discrete. Funzione di probabilità. Valore atteso. Varianza. Variabili casuali discrete notevoli. Distribuzione uniforme discreta. Distribuzione binomiale. Distribuzione di Poisson. Distribuzione ipergeometrica. Variabili casuali continue. Funzione di densità. Variabili casuali continue notevoli. Distribuzione uniforme continua. Distribuzione Normale. Approssimazione della distribuzione binomiale con la Normale. Campionamento e distribuzioni campionarie. Unità, popolazione, campione. Popolazioni finite e infinite. Parametro e statistica. Campionamento casuale semplice e altri metodi di campionamento. Stima puntuale. Stimatori e distribuzioni campionarie. Media campionaria. Proporzione campionaria….

Tipologia: Dispense

2022/2023

In vendita dal 25/03/2024

Luca_angel
Luca_angel 🇮🇹

15 documenti

1 / 66

Toggle sidebar

Spesso scaricati insieme


Documenti correlati


Anteprima parziale del testo

Scarica Metodi statistici per l’amministrazione delle imprese e più Dispense in PDF di Metodi Statistici Per L'impresa solo su Docsity! METODI STATISTICI INTRODUZIONE... La Statistica inferenziale da tutti i metodi per passare da un campione alla popolazione (se il campione non è ben calibrato rispetto alla popolazione si ha un risultato sfalsato). Tutto quello che faremo riguarda soprattutto la probabilità. . PROBABILITÀ: viene definita come una misura dell’incertezza. . Bisogna partire dando alcune definizioni: L’EVENTO é una proposizione che può avere 2 risultati o vero o falso. Alla base di ogni evento c’è un ESPERIMENTO CASUALE (esempio: lancio una moneta). Gli esiti alla base dell’esperimento casuale sono definiti EVENTI ELEMENTARI (o punti campionari). . Esempio 1 Evento: “lancio di una moneta ed ottengo testa” Esperimento casuale: è il lancio di una moneta. Punti campionari (risultati possibili): {testa, croce} . Esempio 2 Evento: “lanciando un dado esce un risultato dispari” Esperimento casuale: lancio del dado Punti campionari: {1,2,3,4,5,6} Evento espresso sottoforma di insieme: {1,3,5} DEFINIZIONI Spazio campionario: insieme dei punti campionari a cui un dato esperimento può dare luogo Evento: collezioni di alcuni punti campionari, quindi un sottoinsieme dello spazio campionario. . RAPPRESENTAZIONE Esempio lancio dado Spazio campionario/spazio degli eventi elementari (possibili risultati) Evento (risultato dispari) Come faccio a definire tutti i punti campionari? . Si possono utilizzare 2 metodi SCHEMI GRAFICI Diagramma ad albero REGOLE MATEMATICHE Calcolo combinatorio Esempio 1 : un produttore ha 3 clienti ma ne può contattare solo 2. Si descriva lo spazio campionario. 1ª fase: scelta casuale del 1º cliente 2ª fase: scelgo 2º cliente Ho 6 punti campionari perché in questo caso conta l’ordine (prima contatto un cliente poi l’altro) se l’ordine non costasse (A,B)=(B,A) CARDINALITÀ dell’INSIEME 5={1,2/3,4/5,6} 1 3 A 2 £ A-- {13,5 } > 5 6 agg 2 1 CLIENT A B C B (AB) a c (Af) B A (B.AI CIBI) ( A (cit) B (GB) 5-{IAB) :( A .ch/B.Al;lB.Cl;kiA);(GBl} 5=6 PER OGNI METODO: la probabilità di un qualunque evento si ottiene sommando la probabilità dei punti campionari che compongono l’evento. nº articoli venduti nº clientiEventi Esercizio 1: voglio calcolare l’evento A, ossia che il prossimo cliente che entrerà acquisterà almeno 2 oggetti Probabilità che il prossimo cliente che entri acquisti almeno due articoli. Esercizio 2: un’urna contiene 14 palline (5 gialle, 3 bianche, 6 nere). Pescando una pallina voglio calcolare la probabilità che sia gialla. Esercizio 3: un’urna contiene 14 palline (5 gialle, 3 bianche, 6 nere). Si estraggono 7 palline, senza riposizione (non rimetto dentro la pallina estratta = cambia la composizione dell’urna tutte le volte che estraggo). Qual è la probabilità di avere la seguente sequenza di colori A = {NNBBGGG} ? Conta l’ordine. Palline nere che posso estrarre il 1ª estrazione Palline nere che posso estrarre il 2ª estrazione Esercizio 3: un’urna contiene 14 palline (5 gialle, 3 bianche, 6 nere). Si estraggono 7 palline “in blocco” senza riposizione (non rimetto dentro la pallina estratta = cambia la composizione dell’urna tutte le volte che estraggo). Qual è la probabilità di avere la seguente sequenza di colori A = {NNBBGGG} ? Non conta l’ordine. Abbiamo usato le DISPOSIZIONI perché conta l’ordine. Abbiamo usato le COMBINAZIONI perché non conta l’ordine. - = {E} , t-4.t-5.EC} Et 0 54 Ez 1 76 P - =P E} + PELI 1- PES +PEG = 2%+2%+2%+2200=0,35 E } 2 42 E4 3 18 E5 4 8 EG + di 4 2 S' = {Et, Ez, . . . , E 14} G- = " usata PALLINA GIALLA " Pei =L = %, (METODO classico) P / G) = %, = 0,3571 Oppure . . . P G- = {Et , Ez, E 3. E4 , Es} = %, + %, + %, + %, + %, =# Numero tot . degli eventi > ) = 14.13.12 - . . . - 8 , ULTIMO TERMINE = N - ntt Esiti favorevoli all' evento - : > ' 2 PALLINE NERE in 1° e 2° POSIZIONE 6-5=30 > • 2 PALLINE BIANCHE in 3° e 4° POSIZIONE 3-2=6 - 3 PALLINE GIALLE in 5.È7° POSIZIONE = 5.4-3=60 EVENTO - = 30.6-60=10800 P - = 10800 = 0,00062 17297280 > ( 14.13.12.11.10.9 -8) • 14 ! Umero tot. degli eventi (È = z ; µ . >) ; = 3432 Esiti favorevoli all' evento B : ' 2 PALLINE NERE prese 2 alla volta) > § = 2%11=15 > 15.310=450 • 2 PALLINE BIANCHE > { = }! P B) = 4502 ! 1 ! = } 3432=0,1311 . 3 PALLINE GIALLE § = 5 ! 3! 5 -3) , / = 10 * IN BLOCCO IN UN COLPO = senza riposiziona e non conta ordine REGOLE DI PROBABILITÀ • Ogni evento è una collezione di punti campionari (è un sottosistema di ) • La probabilità di un evento è la somma delle probabilità dei punti campionari che lo compongono Graficamente utilizzeremo il Diagramma di Eulero-Venn (Abbiamo definito l’evento A) EVENTO COMPLEMENTARE: dato un evento A, il suo complementare (o complemento o negazione) è l’insieme dei punti campionari di S che non appartengono ad A. Lo indico così è vero quando è falso (e viceversa) INTERSEZIONE DI 2 EVENTI UNIONE DI 2 EVENTI Dati 2 eventi A e B la loro intersezione è l’insieme di punti di S che appartengono sia ad A che B contemporaneamente. Quando A e B non hanno punti in comune vengono chiamati incompatibili. Dati 2 eventi A e B la loro unione è l’insieme di punti di S che appartengono ad A a B o entrambi. Incompatibili Esrcizio: é noto che: • Il 65% dei clienti di un supermercato paga in contanti. • Il 10% dei clienti paga in contanti e utilizza buoni sconto. • Per chi utilizza buoni sconto é obbligatorio pagare in contanti. a) Quel’é la probabilità che il prossimo cliente paghi con carta di credito? b) Quel’é la probabilità che il prossimo cliente paghi con carta di credito o utilizzi buoni sconto? N.B poiché 65% e 10% sono frequenze stiamo usando il METODO FREQUENTISTA probabilità che il prossimo cliente paghi con carta di credito 5 5 A A 5 - - Pli + P - =p DIMOSTRAZIONE Pli =p - P - A B A B ARB - AB -- O > P 0=0 poiché PIS) -1 > 0=5 A B I P - UB =P A + PB - PIANI} IMPORTANTE A B AUB - AB -- O > 7- UB) -- PATPIB Si considerino i seguenti eventi : i ( = "cliente paga in contanti " . B-- " cliente usa buoni sconto " si sa che : 5 . >(c) = 0,65 C BCC . >(CNB) = 0,1 B È CONTENUTO a PICRIB =P / B) _ a ↳ ( = " cliente NON paga in contanti " PIE) - 1- PIC) - 1-0,65=0,35 b) ' ( EU B) =P(c) + PIB) - PIENI}) 5 = 0,351-0,1=0,45 C E B CAB = 0 Quindi P CAB - O Esercizio 1: in un certo anno. accademico si sono registrati i dati di ammissione ad un certo corso di laurea: • delle 500 domande di studenti provenienti dallo stesso Ateneo, 368 sono state accolte • delle 83 domande di studenti provenenti da altri Atenei, 54 sono state accolte. a) Quel’é la probabilità che una domanda venga accolta? b) Quel’é la probabilità che se uno studente proviene dallo stesso Ateneo la sua domanda venga accolta? PROBABILITÀ CONDIZIONATA DEF: dati 2 eventi A e B (A e B ) si definsce probabilità condizionata il seguente rapporto Osservazione: se è noto, allora REGOLA (o LEGGE) del PRODOTTO P(A) è detto PROBABILITÀ MARGINALE probabilità che uno studente abbia domanda accolta e provenga dallo stesso ateneo PROBABILITÀ CONDIZIONATA (probabilità che dato che lo studente proviene dallo stesso Ateneo, la sua domanda venga accolta) probabilità che la domanda proveniente da studenti di diversi Atenei venga accolta Esercizio 2: un urna contiene: 10 palline nere e 5 palline bianche. Si pesca una 1ª pallina: • se questa pallina é nera allora la scarto • se è una pallina bianca allora reimetto questa + 2 palline bianche Si pesca una 2ª pallina. probabilità che dato che alla 1ª estrazione ho avuto una pallina nera, alla seconda esca una pallina nera. probabilità che dato che alla 1ª estrazione ho avuto una pallina bianca , alla seconda esca una pallina nera. probabilità che esca nera indipendentemente dal risultato della prima estrazione c- 5 P - B =P - AB PIB) purché PIBKO > - B ) - AB =P - B - PB - - P " accolta " " non accolta " • _ = " domanda accolta" B " stessoA " 368 132 500 . B = " studente proviene da stesso ateneo " B- " altro a " 54 29 83 422 161 583 a 3 _ = 422=0,7238 oppure > 4- = 368+54 368 54 =P - nB) + PIANI) s 583 583=583+583 ] - AB = 368583=0,6312 b) B HARB) > B = 368 = 0,736 > oppure > ) B = > - AB) = 368 583 = 368 500 583 ° 500 583 ggg = 0,736 500 > B > B ) - B = > - AB = 54 54 83 > B 83=583 583--0,6506 Si considerino i seguenti eventi : i 1 = " 1 " pallina estratta nera " ' 2-_ " 2 " pallina estratta nera " 10 ESTRAZIONE P i = If = } = 0,6667 e PIÙ/ = §, --0,3333 20 ESTRAZIONE > P/ Nanna =P/ 2ns - PINI = 9 2 " 14 ' } = 0,4286 A (15-1)A > Nanni =P Nani • PINI) =)? . } =# A > 5+2 BIANCHE) P 2) =P/Nanni) + PINZANI) = } + % = 0,6242 Esempio 3: un certo sintomo può essere dovuto solo a due malattia A1 o A2. (non possono essere entrambi) • 20% di pazienti affetti da A1 presenta il sintomo • 75% dei pazienti affetti da A2 presenta il sintomo • 10% dei soggetti sani presenta il sintomo Se il Signor Rossi presenta il sintomo qua l’è la probabilità che sia affetta da A1? Nuova informazione: • Malattia A1 ha un’incidenza del 30% sulla popolazione • Malattia A2 ha un’incidenza del 10% sulla popolazione • Se il soggetto non ha ne A1 ne A2 allora è sano ENUNCIATO DEL TEOREMA DI BAYES Dati: • Evento B • K eventi incompatibili ed esaustivi A1, A2,....,Ak Sappiamo che : - 3 = " sintomo presente " . > B -1=0,2 ' > B - 3=0,1 - J B -2=0,75 • -3 = " paziente sano " 3- 1) = 0,3 3 -2=0,1 >(A) = 1-(0,3+0,1)=0,69 Brat - in B > AMB)=P/ Blas) - Plan) - 0,2-0,3=0,6 an ANI -1 A, > Braz Aznps > AdB) =P/ B / A) • PIA) - 0,75-0,01=0,0075 - 2 A-2h15 -13 - 3 A} MB > ADB) =P/ BIAD ' Plan) - 0,1-0,69=0,069 13nA} AshÈ • ] -1 B) = > -1dB = 0,06 PIB) 0,1365=0,4396 P /B) = Plain B) + PLAZAB) + PIASA B) = 0,1365 • 3 _ , B) = > -2dB = 0,0075=0,0549 PIB) 0,1365 > LO FACCIO PERCHÉ SONO INCOMPATIBILI • ] -3 B) = ] -3dB = 0,069 PIB) 0,1365=95055 A" 1- 5a K K 1-6 i = , - i = 0 Ai - 5 i -1 AZ A } A? P Brat PIBIAI) - PlaitPIAI B) = K j PBAÌ . > A; > ( Bat - P Alt . . - t > Blart . . .+ PBAK - PAK =P/B) VARIABILI CASUALI Una variabile casuale (V.C.)X é la descrizione numerica di un’esperimento, cioè associa un valore numerico ad ogni punto campionario. Esempio: in un gioco si lanciano 1 moneta e 1 dado. Il gioco è il seguente: • si vincono 50 centesimi per ogni punto in più del 3 • si perde 1 euro se si ottiene testa Sia X la V.C. che descrive il guadagno realizzato Le variabili casuali si distinguono in 2 gruppi: . • VARIABILE CASUALE DISCRETA: se assume un numero finito (o infinito ma numerabile) di valori. Esempio: lancio della moneta 5 volte e conto quante teste escono (numero finito di valori) Esempio: lancio della moneta finché non esce testa (numero infinito numerabile) . • VARIABILE CASUALE CONTINUA: assume tutti gli infiniti valori di un intervallo o di più di un’intervallo. Esempio: tempo che ci mette una lampadina prima di fulminarsi in una produzione di lampadine. (Tempo variabile casuale continua) VARIABILE CASUALE DISCRETA Una V.C. discreta è l’equivalente probabilistico di una distribuzione di frequenza relativa di un carattere quantitativo discreto. Per descrivere la distribuzione di probabilità occorre elencare i valori che essa assume e la corrispondente probabilità. Può essere fatto attraverso: • Tabella (come nell’esempio) • Funzione matematica FUNZIONE DI PROBABILITÀ Esempio: sia X una V.C. che assume valori da 1 a 3. La sua funzione di probabilità (F d P) PUNTI CAMPIONARI VALORE ✗ ✗ Freq . P/ ✗ = ×) TI -1 -1 3 3112 T2 - 1 -0,5 1 1/12 13 -1 0 4 4112 1-4 -0,5 0,5 2 2/12 1-5 0 1 1 1/12 TG 0,5 1,5 1 1/12 Ci 0 12 1 (2 0 (3 O C4 0,5 (5 1 (6 1,50 = ✗ Plex) > ✗ = ✗/ =p / ✗/ = ✗+1 10 0 110 1 210 2 310 3 4 10 1 Affinché una funzione matematica sia una funzione di probabilità devono valere due condizioni contemporaneamente: devono valere entrambi Esempio: gli n valori di V.C. devono avere tutti la stessa probabilità. Questa V.C è associata al punteggio del lancio di un dado (onesto) VARIABILE UNIFORME DISCRETA valori facce del dado RAPPRESENTAZIONE GRAFICA DELLA V.C UNIFORME DISCRETA VALORE ATTESO di UNA V.C. DISCRETA: valore atteso E(X) di una V.C. discreta è l’equivalente probabilistico della media Esempio: un venditore ambulante sa che il suo guadagno nelle vendite di bibite dipende dalle condizioni atmosferiche della giornata. In particolare sa che: • Se fa caldo guadagno 90€ • Se fa fresco guadagni 40€ • Se fa freddo guadagno 20€ Valutando le condizioni atmosferiche, il venditore realizza che: • P(caldo) = 0,5 • P(fresco) = 0,1 • P(freddo) = 0,4 Che guadagno si “aspetta” di avere il venditore? La V.C associata al guadagno é la seguente: Il venditore si aspetta un valore atteso di 57€ PROPRIETÀ DEL VALORE ATTESO • P/ ✗ =D -0 .pl/t-Xl=1 ✗ >( ✗ = ✗ =L 11=1,2, . . . / n PIAN P / = 0,167 _ . . . . . . 1 16 2 16 3 16 4 16 5 16 6 16 1 2 3 4 5 6 ✗ µ = - = # g. × . > A- ✗ 3 ✗ =D 20 0,4 E ✗ = 20-0,4+40 -0,1+90-0,5=57 40 0,1 90 0,5 1 Minix) EH) maxlx) = atbx El' -_ atb - EH) 2- = àtb EH) -_ a. E ' + b. EX VARIABILE CASUALE DI POISSON . É una V.C legata a un conteggio in un dato intervallo di tempo o spazio. . Si supponga: • Un evento abbia la stessa probabilità di manifestarsi in tutti gli intervalli con la stessa ampiezza • Il fatto che un evento si verifichi in un intervallo é INDIPENDENTE dal suo verificarsi in un altro intervallo (non sovrapposto al primo). Se si verificano queste 2 opzioni allora di parla di ESPERIMENTO o PROCESSO DI POISSON. nº di volte che un evento si manifesta in un intervallo Caratteristiche della V.C di Poisson: Il paramento viene calcolato conoscendo quante volete ci si attende mediamente di conoscere l’evento nell’intervallo di tempo considerato. Esempio 1: per programmare il servizio di un call-center si considera che: • il processo con cui arrivano le chiamate nuove può essere descritto da un processo di Poisson. • mediamente si hanno 2 chiamate ogni 10 minuti. a) Quel’é la probabilità che in 10 mimuti mi arrivino 3 chiamate? b) Quel’é la probabilità che in 10 minuti mi arrivino alemno 3 chiamate? c) Quel’é la probabilità che in 15 minuti arrivi al massimo 1 chiamata? VARIABILE CASUALE IMPERGEOMETRICA . É un esperimento Bernouliano (con esito dicotomico) ma la probabilità del successo varia da prova a prova e le prove sono INDIPENDENTI. . Ci riferiamo a dei problemi di estrazione campionaria con le seguenti caratteristiche: • N elementi di partenza r hanno una certa caratteristica N-r non hanno quella certa caratteristica • Si pescano n elementi senza reimissione e senza rilevare l’oridne (campionamento di blocco). . • X conta il numero di elementi tra gli n estratti che presentano la caratteristica considerata. = ~ Poisson ✗ ' = ✗ = ✗/= Ì. È " ✗ = 0,1 , 2 . . . n ✗ ! E ✗ = Var ✗ = ~ Poisson /A-2) intervallo : 10 minuti a P /✗=D = 2 " - è ' con ✗ = 0,12 , . . ., n P/ ✗ =3) = 2} ;?_? 0,1804 P/ ✗ =D = %!! l' = ✗ ! > P / ✗ 73 = 1 - P / ✗ E 2) = 1- PIX-OY-PIK.pt P ✗ = 2) = 1- %?? %!! %? " = 1-0,6767=0,3233 C RAGIONANO sulle MEDIE > 2:10 = Xy : 15 > Xy = 2 , =3 > YN Poisson ✗=3 ✗ = no di chiamate in 15 minuti PY : y) = %? " con y = 0,1 , 2, . . ., n PNEI =P/Ko) + Pfy = 1) = 3? @ → 3 ' - e ' } 0! + µ . = 0,1992 Esempio: in un azienda lavorano 20 operai, di cui solo 7 hanno un’esperienza pluriennale. Per un turno notturno si estraggono 5 operai. a) Quel’é la probabilità che tra gli operai scelti 2 abbiano un’esperienza pluriennale e 3 no? b) Quel’é la probabilità che ci sia almeno 1 operaio esperto? VARIABILI CASUALI DISCRETE (riassunto): . • V.C UNIFORME • V.C INDICATORE • V.C BINOMIALE • V.C IMPERGEOMETRIA • V.C POISSON VARIABILE CASUALE CONTINUA . Le V.C CONTINUE assumono tutti i valori all’intero di un intervallo. . La FUNZIONE DI DENSITÀ (é la formula matematica) Esempio: per programmare una rete di assistenza si considera la seguente VC X • X = distanza tra il centro di assistenza e il luogo dove è richiesta l’assistenza in km a) Quel’é la probabilità che la prossima richiesta si trovi a una distanza compresa tra 10km e 20km? b) Quel’é la probabilità che la prossima richiesta si trovi ad una distanza tra 30km e 40km? c) Quel’é la probabilità che la prossima richiesta si trovi ad una distanza esattamente di 20km? r . N - r ~ / Percy . Nien p ✗ = ✗ = ✗ n - ✗ ✗=p, . . .ME/xt-n.fyVarx=n.fy 1- f. N - nn - 1 I v. B ar ✗ IPG E Var ✗ BIN > dato che N - n 1 N - 1 Dati : N --20 f- 7 N - F- 13 A- 5 ✗ = " no di operai con esperienza pluriennale " X~t-pergn-20.r-7.tn:5 7! 13 a % . ¥-2 21.5 ! - 3:10 ! = 0,3874P/ ✗ = 2) = = 20 20 ! 5 51.15 ! 7 ! 13! b P ✗ =p = 1- P/ ✗=p = 1 - È • "È =p _ 0! ? ! - 5:10 ! = 1-0,083=0,9170 20 20 ! 5 5 ! 15 ! PIX -- X) -_ In Indlp) Binln, p) Ipergln.mn) ✗ f. ✗ SHI ✗ IN 0 - ✗ +o > PAEXEB lxldx -1 fabflxldx -- Prat ✗Eb) a b ✗ • 91×1--4^-5 541<-50 N.B: poiché la funzione di densità é costante su tutto l’intervallo, allora la probabilità di intervalli di stessa ampiezza è identica. V.C UNIFORME CONTINUA Vale per tutte le V.C continue V.C UNIFORME CONTINUA Vale per tutte le V.C continue É il punto centrale del campo di esigenza di X VARIABILE CASUALE NORMALE . É una variabile che si applica a fenomeni continui e sistematici. É una delle V.C più importanti della statistica inferenziale. • Il grafico è centrato su (che è anche il suo punto di massimo) • È V.C. una perfettamente simmetrica • é anche la mediana di X • determina sia l’altezza che il suo appiattimento Questa è chiamata FUNZIONE DI RIPARTIZIONE a Skin Pr = IOEXEZO = [ di =L, /20-10=1%-0,222 > AREA del Rettangolo 145 - • • NB > PIIOEXEZO) =P/104<20) Ì io Io io × > b Pr = 304€40 = [↳di =L, /30-40=1,05--0,222 c Pr / 11=201--0 AREA NULLA 8×1=1 AEXEB Pr ( < ✗<D= d- 'b- a b.a acccdcb PIX -- ×) - O +o Var /xp / b-a)2 EH) -- atb µ varlxt-f.at/-nYdx 2 SAI i, @ - Ioa (✗ - up ✗ qualsiasi ✗ " NIM ; qz EH)-_ µ Var /✗1=02 @ = DEVIAZIONE STANDARD µ : a b M tra _ ✗ b-- Prato - Pr ✗ < a Pr / ✗ Ex - - Flex ) -_ [fltldt Esercizio: é noto che il 25% dei clienti di un supermercato paga i propri acquisti con carta di credito. Consideriamo una giornata con 300 clienti. a) Quel’é la probabilità che 60 dei clienti paghino con carta di credito? APPROSSIMAZIONE DELLA VARIABILE BINOMIALE CON LA NORMALE Se n è molto grande nella BINOMIALE, é difficile calcolare la probabilità Useremo il risultato dell’approssimazione Se n é molto elevato, la distribuzione BINOMIALE si può approssimare con la NORMALE con media pari al valore atteso della binomiale e varianza pari alla varianza della binomiale. Se n è molto grande Osservazioni: • Cosa significa n elevato? • Questo risultato è molto importante, è un caso particolare di TEOREMA DEL LIMITE CENTRALE Applico il METODO DEL FATTORE DI CORREZIONE PER CONTINUITÀ: vado a trovare un intorno piccolo di 60 e calcolo l’aria, automaticamente calcolo la P (X = 60) NBinln.pl Pr/ ✗=D=/ "✗ piu - p) " " ✗ Pr ✗ < t = p ✗ =L E- o Blnln, p) Z " Bin /n.pe/N--n.p a un.pe/oEn.pl1-p)Var=n.pl1-p) n + o un.NO?-n.pI1-p) n 30 n.pt/5enl1-p)75-- " ho clienti che paga con carta di credito " NBM / n' 300 :p --0,25 P ✗ = 60 = 3%) . 0,25601-0,25300-60 Allora calcolo : Dato che n --3001>30 EHI -- n - f- 75 ' h - P --300 . 0,25=75 e h /1- D) = 300/1-0,251=225 > 5 varkt-h.PH- D= 300-0,25-0,75=56,25 ✗ IN / M -_ 7,5; 0=56,25) ✗ TENDE A DISTRIBUIRSI COME UNA NORMALE > ✗ = 60=0 REGOLA della NORMALE Pr ✗ = 60 → Pr /59,5 < ✗ < 60,5 Pr / ✗ < 60,5) - Pr /✗ < 59,5 Pr 2- < 60,5 -75 _ Pr z < 59,5-75 56,25 56,25 Pr -2<-1,9338)- Pr /2- < -2,0667) Prlz-1,93)- Prlz -2,071=0,0268-0,0192--0,076 INFERENZA STATISTICA . Devo definire • UNITÁ STATISTICA • POPOLAZIONE : é l’insieme di tutte le unità statistiche. • POPOLAZIONE FINITA: contiene un numero limitato di casi e deve esistere una lista che contiene informazioni per identificare univocamente le unità (es. popolazione in italia: persone residenti in italia è finita, la lista è quella anagrafica del comune). • POPOLAZIONE INFINITA: numero di unità contenute é virtualmente illimitato (es. lancio una mometa e non mi fermo finché non esce croce). • CAMPIONE: é un sottoinsieme della popolazione. • CAMPIONE PROBABILISTICO: quello dove ogni unità rientra a far parte del campione secondo un criterio di casualità e la probabilità di inclusione del campione é nota a priori. (es. ISTAT quando estrae un campione, estrae un campione probabilistico e ogni persona ha la probabilità di essere estratta che si ha priori). • CAMPIONE NON PROBABILISTICO: non esiste una probabilità a priori di inclusione del campioni. Vengono usati dei criteri di convenienza . (es. rispondendo a un indagine online, il campione é non probabilistico). CAMPIONE CASUALE SEMPLICE (CCS) . Sì estrae un elemento alla volta da una popolazione finita (deve esistere una lista) e per ogni estrazione tutti gli elementi rimanenti (nella popolazione) hanno la stessa probabilità di estrazione. Possono essere Quando la popolazione è infinita, non posso avere una lista, ma si costruisce un campione casuale facendo si che gli elementi estratti siano tra loro indipendenti e che poi riproducano la medesima distribuzione di probabilità della popolazione. . • Nel caso di una popolazione finita l’indipendenza si ottiene attraverso un campione casuale semplice con riposizione • Quando N molto grande l’estrazione con remissione produce risultati simili al campionamento causale senza remissione Esercizio: un supermercato ha intenzione di lanciare una nuova campagna promozionale in cui ciascun cliente a fronte di una spesa promozionale riceve un buono: 10€; 20€ e 30€ Prima di lanciare la campagna promozionale viene svolta un’indagine campionaria per determinare la spesa media (spesa u) erogata mediamente a ciascun cliente che accede alla campagna promozionale. a) Quali risultati ci attendiamo dal campione? CCS CON REMISSIONE CCS SENZA REMISSIONE Prima di rispondere facciamo delle ipotesi su come sia la struttura della popolazione Valore F. Assoluta F. Relativa 3 = 1.000.000 10 300.000 °' } µ = 11×1=3 20 500.000 0,5 g. = , j . = ;= , jfrj = 100,3+200,5+30-0,2=19€ 30 200.000 0,2 1.000.000 1 Supponiamo di estrarre un CCS di ampiezza 2 Il primo elemento del campione riproduce la medesima distribuzione della popolazione X1 è una V.C che indica il valore del buono per la prima unità estratta La popolazione è molto grande (quindi la possiamo assumere come infinta), gli elementi sono indipendenti perché applico un CCS con remissione (N.B quando N è molto grade CCS con remissione e senza sono uguali) Ora consideriamo i 2 elementi del campione congiuntamente Sintetizziamo i dati con la distribuzione di probabilità della media campionaria = popolazione h = campione n --2 • ✗ i. " 1° elemento del campione " { ✗1. ✗ a} PRIMO ESTRATTO quali sono i risultati potenziali e quali sono le probabilità? ✗ i PIN) 10 0,3 20 0,5 30 0,2 3 1={10/20,30} EH = Xii .pt/1=Xri)-- 10 -0,3+200,5+30-0,2=19 i =L • 2-_ " 2° elemento del campione " SECONDO ESTRATO 2 PIU 10 0,3 E/✗2) -19€ 20 0,5 30 0,2 1 PROB . CONGIUNTA MEDIA SUI CAMPIONI MEDIA di tutti ✗ 1 / ✗2) > ( MMN) * = È / " + ✗2 Faccio PIM.PK perché indipendenti POSSIBILI RISULTATI 110,10) 0,3-0,3=0,09 10 (10,20) 0,3-0,5=0,15 15 (10,30) 0,3 . 0,2=0,06 20 ( 20,10) 0,5-0,3=0,15 15 ( 20,20) 0,5-0,5=0,25 20 ( 20,30) 0,5<0,2--0,1 25 (30110 0,2 . 0,3=0,06 20 (30,20) 0,2 . 0,5=0,1 25 ( 30,30) 0,2-0,2=0,04 30 Valori Prob / ✗ 10 0,9 15 0,30 > ✗=/5 =] ✗1=10 NXZ --20 VIA -10 AH -10 SONO INCOMPATIBILI 20 0,6+0,6+0,25=0,37 =P 1×1=101×2--20) + P /✗«20nA -101--0,15+0,15=0,30 25 0,11-0,1=0,2 30 0,4 1 El ' = ✗ i.pk/Ti-- 10-0,09+15 -0,30+20-0,37+25 -0,2+30-0,4=19 Elk)-_ M Var / F) = ( È - E / xD? PIXIE =/10 -19)? 0,09+(15-19)? 0,301-(20-10)? 0,37+(25-10)? 0,2+(30-10)? 0,04=24,5 Var /✗1=24,5--4,9497€ STIMATORE DELLA PROPORZIONE CAMPIONARIA . Sulle unità campionarie verificheremo la presenza o assenza di una determinata caratteristica. Per ogni unità avremmo un esperimento Bernouliano: • SUCCESSO = presenza della caratteristica • INSUCCESSO = assenza della caratteristica . Il parametro della popolazione lo indiciamo con P ed é • sia la probabilità che l’unità presenti la caratteristica • sia la proporzione delle unità che sulla popolazione presentano quella caratteristica In un campione indico con X il numero di unità campionarie che possiede la caratteristica . La proporzione campionaria è é uno stimatore della vera proporzione P CARATTERISTICHE di P Le formule per P sono simili a quelle viste per X . Ora consideriamo una popolazione Bernouliana: Esercizio: si vuole stimare la proporzione P di frutti di seconda scelta prodotti nell’anno in corso da un’azienda agricola. Si estrae un campione di 400 frutti (n = 400) dei quali 177 risultano di seconda scelta. . a) Quel’é la stima di P? per questo lo stimatore P è uno STIMATORE CORRETTO e NON DISTORTO STANDARD ERROR direttamente proporzionale inversamente proporzionale Presenza caratteristica Assenza caratteristica Distribuzione campionaria di Dato che sappiamo che la distribuzione binomiale può essere approssimata con la VC normale se n è grande, allora anche P si distribuisce come VC normale. b) Se si sapesse che P = 0,45 quale sarebbe la distribuzione di P? Verifichiamo le condizioni Dato che le condizioni sono verificate ] = ✗ n a E) = ) b ar p = PH -P n PH - P) c Var / I = PH- P) n n n = i ✗ in Ber P i 1 i = , O d n =3 > =p NBM /Mp (n . ] S Se /Mi . ] > s allora sa p; Piff) 511 A-ORE > > = ✗ 400 quindi avendo ✗ = 177 > = %} = 0,4425 E p =p = 0,45 (n - 3=400 . 0,45=180 ar /È =P / 1- D= 0,4511 -0,45 = 0,000619 (n . / 1 - p) = 400/1-0,45=220 h 400 Var /È = 0,000619=0,0249 51 (0,45; 0,0219) * * È tende a distribuirsi come una normale con valore atteso 0,45 e standard error 0,0249 c) Se si sapesse che P = 0,45 quale sarebbe la probabilità che P si trovi nell’intervallo (0,39; 0,51)? STIMATORE DELLA VARIAZIONE CAMPIONARIA . Il paramento di interesse nella popolazione è Un’idea semplice é quella di proporre uno stimatore di come se valutassi la varianza della popolazione (Analogo a quello studiato in statistica descrittiva) Si dimostra che Quindi non è uno STIMATORE CORRETTO per TEOREMA DEL LIMITE CENTRALE . Se abbiamo n variabile casuali X1, X2, ..., Xn sono IID (Indipendenti e identicamente distribuite) allora per allora Da questo discendente Lo stimatore corretto (non distorto) per é VARIANZA CAMPIONARIA CORRETTA questo è corretto STIMATORE MEDIA CAMPIONARIA Se n è molto grande ALTRI METODI DI CAMPIONAMENTO . • CCS con ripetizione • CCS senza riposizione o in blocco già visti CAMPIONAMENTO CASUALE STRATIFICATO Popolazione di partenza suddivisa in STRATI (gruppi). Da ciascuno strato viene estratto un campione casuale semplice, che forma poi il campione finale. CAMPIONAMENTO A CLUSTER O GRUPPI Popolazione divisa in gruppi, ciascun cluster è una piccola “riproduzione della popolazine”. Il cluster è molto eterogeneo. Come funziona 1. Identifico cluster 2. Estraggo dei cluster 3. Analizzo tutte le unità all’interno del cluster 7 0,39 P < 0,51 Pr 0,39 -0,45 Ì - P 0151 -0145 > Pr -2,4096 Z 2,4096=2 - ( 2,41 -1--20,9920-1=0,9840 0,0249 pin - p) 0,0249 - n ' NB > vado a standarizzarla poiché attraverso la verifica delle condizioni ho visto che si distribuisce come una normale à à n §? i. , ✗ i - 2 n E 52 = nn-1.gr È gz 02 SI 1 " ✗in-1 i -1 E 52 = @2 n +0 S = It zt . . . + In i hanno media M e varianza 0 ' San n.njn.gr 5 " ✗ i h = in n Tu vi.µ 02 n in § =L - S = "¥ = M ar § =L, Vars = fp.co?n=0=n CAMPIONAMENTO DI CONVENIENZA É un campionamento non probabilistico. Magari non ho la lista delle unitá e per questo non è noto a priori la probabilità di estrazione per ciascuna unità. . CAMPIONAMENTO DI GIUDIZIO (o CAMPIONAMENTO RAGIONATO) Non é un campione probabilistico, ma è il ricercatore che seleziona le unità del campione a suo giudizio. Viene chiamato anche campionamento per testimoni chiave o focus group. . CAMPIONAMENTO SISTEMATICO É un metodo per selezionare casualmente gli elementi di una lista. Esempio: • popolazione N = 1200 unità • campione n = 15 unita Calcolo il passo di campionamento 1. Genero un nuomero casuale da 1 a 80 (per esempio 7) 2. La prima unità estratta del campione sara l’unita numero 7 3. Faccio passi sistematici di lunghezza pari al passo di campionamento fino alla fine (nel nostro caso a 80 la seconda unita sarà 87, poi 167 ecc.) INTERVALLI DI CONFIDENZA . Un intervallo di confidenza afferma che verosimilmente il paramento si trova in un intervallo che spesso viene costruito come STIMATORE PUNTUALE MARGINE DI ERRORE Esempio: un produttore è interessato a valutare, prima di spedire una partita di cavi a un cliente, quale valore si può dichiarare per la sua resistenza al carico (x). Per questa variabile si assume che . Estraendo un campione n= 10 porzioni di cavo si è ottenuta una stima della media campionaria Anziché fornire la stima puntuale all’acquirente, il fornitore preferisce offrire un intervallo di confidenza che incorpori anche il possibile errore dello stimatore. Lo stimatore di interesse è X. Poiché X é una normale. a) Quanto vale lo standard error? b) Qual’é il margine di errore che si ha nel 90% dei casi se si stima con Nn = 1200=80 15 +80 +80 > 87 ' 167 1200A 2 3 , 4 , 5 6 ? | i 1111 I 1 1 Il 1 I ~ MIO?4 informazione nota da precedenti analisi 2=207,8 quintali ~ info > nn /M ; 0,4) Var / I = 0,4=0,6324 µ ? E e- il margine di errore . Si avra ' > 7 {n - ME MTME} --0,9 Devo trovare ME . STD = 2- = £ - M corn Pr { ti - ME - M z Mtme -M } --0,9 Prf_ ME0,4 E IÌ, } --0,90,4 0,4 > b) Si costruisca IC per c) Supponiamo di volere un IC di ampiezza 0,6 con un livello di confidenza di Quanto deve valere n? Questa maggiore incertezza nei risultati campionari, porta ad un cambiamento nel: • SE (Standard Error) dove è sostituito da • Percentile della normale N (0;1) sostituita dalla T di STUDENT IC al 99% é più affidabile perché sbaglio solo dell’1% IC al 95% é più informativo perché più vicino (i due estremi) al valore di n è un intero quindi prendo sempre quello più grande In generale vale che Caso 2: NON nota (varianza della popolazione non è nota) Devo stimare con Dato che uso al posto di c’è un’incertezza maggiore perché sto usando i dati del campione e non quelli della popolazione con T di STUDENT è variabile causale continua simmetrica é centrata in 0 valore atteso è 0 cambia in base ai gradi di libertà (gdl) legati a n - 1 Tavola della T di STUDENT • va da 1 a 100 da 100 in poi valori sono tutti uguali • quando N molto grande > 100 possiamo usare l’ultima riga della T di student e prendere il percentile normale • Esempio 4,88 -2,575 8,52=4,4056 Icqgg : 4,4056 ; 5,3544 250 C 4,88+2,575 8,52=5,3544 Aic = ES- El = 5,3544-4,4056=0,9488 250 1- ✗ = 0,95 / ( 1-✗ = È ± Zaz . 0 1-0=0,95 > 0=0,05 { = 0,025 n - 0,025 > cerco nelle tabelle 0,975 > C'è quindi collego 1,9 con 0,06 > 2-0,025=1,96 ( e- Un valore noto) 4,88 -1,96 8/52=4,518 250 ICQS-5 : 4,5182 ; 5,2418 IC 4,88+1,96 8,52=5,2418 Aic = 5,2418-4,5182=0,7286 250 • -1cal 95 . . = 0,7236 - -1cal 99 . . = 0,9488 µ 1- ✗= 0,99 AK = 2. 2- % . no Nn= 2. 2- % -0 A,, n = 2 ? Z? È = 2? 2,575? 8,52 = 627,699 - 1C ' 0,62 n - 628 % 2 . @ = h = [ 2 > ME ò 02 SE 1 n - 1 = , ✗ i _ 2 5 0 ' @ 2 ④ 52 A- 10 to , 05 > devo cercare gdl ( gradi di libertà) > n - 1--10-1=9 sulla tabella 9 e 0,05→ 8,833 n -10 tqot gd / = 10 -1 > cerco riga 9 e colonna 0,01 > topi --2,821 A- 1601-0,05 > gdt-159.to/O5-- 1,645 Esercizio: per valutare la produttività di uno stabilimento, occorre stimare il tempo medio impiegato da ciascuno operaio per produrre un certo semilavorato. Per un campione di n = 24 operai si sono rilevati i tempi impiegati per la produzione, ottenendo i seguenti risultati Si calcoli l’IC al 99% per IC diventa IC sarà uguale a prima ma al posto di z ho t e al posto di ho OSSERVAZIONI • Intervallo di confidenza è esatto (non prendiamo l’approssimazione) se e solo se • Se la popolazione non è NORMALE si può usare l’intervallo “approssimato” se e solo se n è grande (n>50) • Quando i gdl superano 100, la T-stuedent è molto simile alla normale • Valgono le stesse regole per determinare n. Quando n non è noto e non è noto, allora utilizzo: - studi precedenti - studi pilota a un pre-campione Prì- tiè . :<mail.tk?.sn-- 1- ✗ O 52 EI ES - ic-ES-EI.AIC-xi-tEI.s-I-tii.saic-z-II.sn n n M 24 l' =p i = 418,5 24 i. , ✗ I' = 7388,33 µ A- 24 ~ ? O'= ? > applichiamo i:c peru quando 0 ' non è noto collego 23 con 0,05 Ica- ✗ = ± tè ! - 5 1-0=0,99 ✗ = 0,01 2=0,005 TÌO 2,807 n 24 ( stima della MEDIA) > i " " 418.5=17,435 / × 24 = 24 24 5 / STIMATORE) s' = ^ ×, - I = formula diretta 24 -1 i =\ (Yi - y 2 formula indiretta . ary = ' " yiy ' =L Yi ! | ' n = Vary Miei > metodo indiretto per Varly) = carattere quantitativo . n . ar , = n . in yiz . 2 = n . -1Nyiz-n.yz-yii.tn?--Yi-Y=n.Varlyl--lYi-Y=S2=Yi?nyan.yFORMULA INDIRETTA Torniamo alla VCX sa = ✗ I'- nx ' n - 1 gz = Xi' - NX ? 7388,33-24.1743752 = 90,7362 h - ^ 24 -1 23 = 3,945 16,2994 Et IC : 1-4=0,99 > 17,4375+-2,807 . 3,945 > IC 24 18,5755 ES ~ M ; È NOTO @ 2 Esempio: per programmare nuovi servizi, una Regione vuole stimare il tempo medio impiegato dai passeggeri per raggiungere l’aeroporto di una grande città. Si sa che: • Si vuole un margine di errore pari a 5 minuti • Si vuole un livello di confidenza al 95% • Verosimilmente nessuno impiega più di 120 minuti INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE . Nel caso di una proporzione P , lo stimatore è X = nº di unità nel campione che hanno la caratteristica oggetto di studio Dato che lo Standard Error (SE) non é noto (P é il Parametro della popolazione) occorrerà stimarlo se n è grande quindi In generale per gli stimatori vale M UTILIZZIAMO n = 2- ✗ = ? 02 ME 2 • 02 NON è noto poiché non c' è n usiamo Z e non t > n = 2- %)? 0 ' • N NON è noto MEZ So che : MA ✗ ( ✗1=120 min MINIX) = 0min 0 > PER STIMARLO dobbiamo utilizzare il RANGE Range = (n) - (1) g: RANGE Max min 4 g. = 120-0=30 4 1-✗ = 0,95 4=0,05 f- = 0,025 2- g- = 2-0,025=1,96 > con Fstudeut oppure con tabelle della normale ma con 2- di 0,975 > ( Pr/ 2- < 2-1=0,975) h = 1,96 ' . 30' = 138,2976 52 n' = 139 > PRENDO SEMPRE L' INTERO successivo perchè mi assicura che il margine di errore sia < 5 minuti ) ) = n =/ P =P Var p = PH- P) n e SE = PH - P) n - > E f. , . h > 50 ME = Zaz . 1511 - È n IC 1- ✗ : È ± Zaz . 1511 -Ì n i t.ME STIMATORE 2) RISCHI ED ERRORI 3) REGOLA DECISIONALE Realtà Decisione H0 vera H0 falsa Rifiuto H0 Non rifiuto H0 Errore di 1ª specie Errore di 2ª specie é il più grave LIVELLO DI SIGNIFICATIVITÀ: il massimo valore della probabilità di errore di 1ª specie che l’utente è in grado di sopportare (nell’esempio era 0,01) Rifiuto H0 se STATISTICA-TEST 4) APPROCCIO CRITICO devo conoscere la soglia “Sotto H0” se no non si può fare il test. Nell’esempio essendo > 0,01 non rifiuto H0 Questo è l’APPROCCIO DEL P-VALUE se TEST SU UNA MEDIA DI POPOLAZIONE NORMALE (varianza non nota) . I test di questo tipo possono essere a una coda 2 code coda superiore coda inferiore Nell’esempio le ipotesi erano IN GENERALE Statistica-test quando “Sotto H0” “Sotto H0” = quando H0 è vera almeno in termini di uguaglianza L’approccio del valore critico ci porta ad una regola decisionale Rifiuto H0 se Rifiuto H0 Non rifiuto H0 APPROCCIO DEL VALORE CRITICO da * a > VALORE CRITCO - 400 O p -400 c Ho = 0,01 > LIVELLO di SIGNIFICATIVITÀ 6,25 6,25 10 10 > STATISTICA-TEST > VALORE OSSERVATO dalla STATISTICA TEST p -400 1,0119 Ho = . . . - - 0,1562 6,25 P- VALUE 10 P - Value ✗ P - Value ✗ 1 2 3 Ho : M - 400 Ho : µ = No Ho : MENO te : M > 400 H1 : ll > No H1 : M > Mo m -- Mo ( e- vero Ho) Ì - MO NN / 0,1 Ì - no o G n p Ì - Mo c Ho = ✗ : > INCOGNITA nell'ESEMPIO [ = 2- a c- deve essere un valore positivo f- NO > 2- ✗ : APPROCCIO DEL P-VALUE P-Value = Regola decisionale se Rifiuto H0 Non rifiuto H0 APPROCCIO DEL VALORE CRITICO APPROCCIO DEL P-VALUE P- Value = Regola decisionale se Rifiuto H0 Non rifiuto H0 • Statistica-test posso sempre dire che In questo caso varcare la soglia significa essere minore di c pretesto per rifiutare H0 Regola decisionale se Rifiuto H0 Non si vuole determinare la soglia, ma la soglia il valore osservato Per spiegare usiamo un esempio: Un produttore di bulloni dichiara un diametro dei bulloni pari a 5,0 mm. Il nostro produttore si basa su un campione di 16 bulloni che estrae ogni tot. tempo. La decisione che può prendere : • produzione non idonea —> azione: interruzione produzione (solo se si è sicuri che la produzione non è idonea, ma poiché il controllo é solo su un campione il produttore potrebbe sbagliare) • produzione idonea —> azione: non interruzione (se questo errore continuerebbe a produrre bulloni non conformi senza accorgersi e questo potrebbe provocare problemi) Cosa è più grave? p - Mo Oss-Mo Ho =p . - Foss - No 0 0 - O n n n P - Value ✗ P - Value ✗ 2 ① : M - - No HO : il > NO HO : m Mo H1 : Meno - no ~ 0,1 Sotto HO con i ) - Mo c Ho = ✗ q ( = - 2-✗ c è NEGATIVO C - Mo - - × con questo valore sarà negativo p - Mo Foss - Mo Ho = - Foss - Mo o 0 - O n n n P - Value ✗ P - Value ✗ 3 Errore più grave: interrompere la produzione quando questa non deve essere interrotta diametro medio dei bulloni diametro dei bulloni Regola decisionale (basata sulla statistica-test) Statistica - test: In questo caso non ci interessa capire se è un altro numero diametro (ci interessa solo se è =5,0) Si parla di IPOTESI BILATERALE (o 1 o l’altro) “Forma” della regione critica (mm) oppure Valori di soglia (mi dicono se il valore è molto positivo molto negativo) C1 e C2 devono rispettare questa condizione Potrebbero essere visti come 2. elementi uniti (somma dei 2 elementi) probabilità = 0,01 Regola decisionale se oppure Rifiuto H0 Applicazione della regola (devo avere un valore osservato della media campionaria) Ho varcato la soglia (2,576) Rifiuto H0 Approccio del P-value Essendo Rifiuto H0 CASO DEL TEST A 2 CODE • Statistica-test Rifiuto H0 se oppure M = Ho : M --5,0 -1 : M¥5,0 = N M;Ò= 0,09 . I - NO = Ì -5,0 NN 0,1 0 0,09 n 16 i Ì -5,0 o Ì -5,0 O 0,09 0,09 16 16 p Ì -5,0 c, oppure Ì -5,0 Cz Ho = 0,01 0,09 0,09 16 16 / 0,99 ( 0,05 yqos (2--2-0,05=2,576 ! Ci = -2-0,05=-2,576 Ci C Ì -5,0 - 2,576 Ì - IO 2,576 0,09 0,09 16 16 Loss --5,22 5,22-50=1-2,9333 interruzione produzione bulloni 0,09 16 > Ì -5,0 -2,9333 oppure Ì -5,0 2,9333 Ho = 2 1- ' 12,93) = 21-0,9983=0,0034 0,09 0,09 - 16 16 ✗ PV 0,01 0,0034 - 0 : M -- Mo H1 : MENO - NO a N 91 Sotto Ho n . - NO 0 - Mo o o o n n TEST SULLA PROPORZIONE Statistica - test: Rifiuto H0 se Esempio: • p = popolazione di elettori a favore di un partito • Precedenti elezioni: p = 0,2 • Decisioni impopolari • Campione di 10.000 elettori 1823 sono a favore Esiste evidenza empirica di un calo del consenso sulla base di un testi di livello ? Statistica - test: Approccio del valore critico Approccio del P-Value Rifiuto H0 se Decisione: Decisione: ✗ ~ Bernoulianap Ho :p Epo Ha :p > po À - P - a lo;D Sotto HO PH -P) n . À - P za Pin -P) n ✗ = 0,075 Ho :p -0,2 tu :p< 0,2 . È - Po = È -0,2 a. N / 0,1) Sotto HO Poll - Po) (0,2)/0,8) n 10000 - p È -0,2 10,2)/qg) ( HO = 075 , > 0,07, - (£9075 = 01925 ' 11,441=0,925 0,075 - 10000 ' . È -0,2 -1,44' . C 10,211018) = -1,44 £01075 10000 Poss = 1823 10000 = 0,1823 0,1823-0,2=-4,425 > RIFIUTO HO 10,2)/0,8) 10000 ] P - 0,2 (o,»/ag -41425 Ho = Il-4,425=1- i /4,425 = no 10000 ✗ = 0,075 > ✗ PV → RIFIUTO HO - " 3 " 3 Esempio Incremento di produttività dovuto ad un nuovo turno di lavoro • Tempo impiegato a produrre un pezzo • Osservati 10 operai che hanno lavorato con il vecchio e il nuovo turno. INFERENZA SU 2 MEDIE Popolazione 1 Popolazione 2 1. Campioni accoppiati (appaiati) a. Stima puntuale di Standard Error di b. IC per STIMATORE PUNTUALE MARGINE DI ERRORE (Standard Error) (Percentile) Esempio n nn ; 04 INTERESSE MI - Ma ~ M2; Òz TEMPO TEMPO OPERAIO vecchio nuovo DIFERENZE 1 9,98 9,88 +0,10 2 9,88 9,86 +0,02 3 9,84 9,75 +0,0g c- 1- 0,084 4 9,99 9,80 +0,19 I'D= 0,00712 5 9,94 9,87 +0,07 6 9,84 9,84 0 7 9,86 9,87 -0,01 8 10,12 9,86 +0,26 9 9,90 9,83 + 0,07 10 9,91 9,86 +0,05 11 12 . . . . 1h N = In - 2h = DI D2 . . . Dn 21 22 . . . . 2h > DN = ✗12 - ✗22 DI = ✗11 - ✗21 Un - M2 . ) = ^ " n " i= , Di = 1 " miei ✗ti - X2 ; = 1 " ni , Mi - fi , li = / 1- 12 - SD? 1 " " - 1h , Di - D 2 - = SD n MI -MZ - ±t%% n -1 gdl d- = +0,084 I'D= 0,00712 + 0,1444 IC per Un - Ma al 95 . . = 1-0,0841=2,262 0100712 10 = +0,0236 c. Verifica di ipotesi Esempio Un nuovo layout dei prodotti di un supermercato ha aumentato la spesa media dei clienti? Campione di 5 clienti osservati: • prima del nuovo layout • dopo il nuovo layout sulla base di questo vengono fatte ipotesi Test sulla coda DX Test sulla coda SX Test su 2 code Spesso • Statistica-test • Statistica-test N.B. può sembrare un unico campione, ma in realtà sono 2 accoppiati Test sulla coda DX Spesa media con il nuovo layout Spesa media con il vecchio layout Vogliamo dimostrare che • Statistica-test Decisione: Non rifiuto H0 (Nuovo layout non efficace) Rifiuto H0 se Approccio del P-Value Cerco sulla T-student 0,7436 con gdl=4 ma non c’è il valore, il più vicino è 0,941 con P= 0,2 quindi Decisione: Non rifiuto H0 MI - M2 0 : Un - Ma DO Ho : Mi - Ma DO DO -0 0 : Un - Ma _ DO 0 : Un - Ma 0 0 : Un µ, Ho : MI - Ma DO Ho : Mi - Ma 0 Ho : M1 M2 0 : Un - Ma -_ DO Ho : Mi - Ma # Do 0 : Un - Ma _ 0 0 : MI _ Ma > distribuzione T- Studeut Ho : Mi - Ma 0 Ho : V1 Ma = - Don Zn-1 Sotto Ho SD 0 : Un - Ma __ 0 0 : Un = Ma n Ho : Mi - U2 # 0 Ho : Mi # U2 = - O ~ In-1 Sotto Ho % SPESA SPESA CLIENTE PRIMA prima DOPO - PRIMA 1 35,6 42,40 +6,80 2 28,45 28,65 +0,20 3 65,00 62,10 - 2,90 4 34150 30150 -4,00 Ho : MI - Ma 0 5 10,50 20,70 +10,20 H1 : Mi - Ma 0 MI = µ , Uz , Ho : M1 M2 > SI PARTE DALL' IPOTESI NULLA Ma = H1 : M1 M2 74 È -0 n Ton-1 > Ó v34 Ò 2,132 SD SD 0,05 SD " 5 5 2,182 D= . . . . . . = +2,06 SÌ = . . . . . . = 38,378 toss = 2,06 = 0,7436 > 38,378 5 74 P-value 0,7436 0,941 - P- due 0,2 0/7436 > 9--0,05 ✗ PV Esempio: Quanto spendono in più al mese i single per l’acquisto di prodotti surgelati? Determinare quanto spendono in più attraverso un IC al 95% Per l’analisi si estraggono 2 tipi di campioni indipendenti • 15 single: media campionaria = 35,8€ e varianza campionaria = 17,08 • 7 non single: media campionaria = 27,6€ e varianza campionaria = 12,38 Spesa media popolazione dei single Spesa media popolazione dei non single Esempio: In una ricerca su vuole dimostrare che le aziende in crisi sono soggette a un tasso di rotazione più alto. Le aziende in crisi tendono ad avere un tasso di rotazione del personale più alto? Test con 13 aziende in crisi: • media campionaria = 0,172 • deviazione standard campionaria = 0,055 12 aziende sane: • media campionaria = 0,09 • deviazione standard campionaria = 0,058 Assumiamo varianze uguali Tasso medio di rotazione della aziende in crisi Tasso medio di rotazione della aziende non in crisi Statistica test Approccio del valore critico Rifiuto H0 se MI V2 Mi = µ 2 = 1708 +12,38 = 15 7 = 13,75713 gdl %, < + 1g 12¥82 > 712 [% = (-0,025--2,162 135,8-27,6) ± 2,162 17,08+12,38 = M'8808 15 6,5192 ✗ = 0,05 MI ha) MI = Ho : Mi - Ma 0 H1 : µ, _ µ, o > "° :# ' MZ TEST su Mr = H1 : Mi V2 CODA DX gdl = 13+12-2=23 20 METODO ypz = (12/0,055)=+111) /0,058 ) = 0,0032 12+11 ( È - È -0 = È - È -0 ~ 323 Sotto HO Sp ' + Sp ' Sp ' 1 + ^ MI V2 MI ha ✗ = 0,05 723 :-(È = -10,05=1,714 *abbiamo usato ✗ e NON { ✗ché e- CODA DX (anche quando è SX ) mentre se e- su 2 CODE usiamo E E- È -0 spz 1 + 1 ^ ' -714 toss = " 172 - "09 = 3,6210 3 /FIUTO 0,0032 Fg +% MI V2 INFERENZA SU 2 PROPORZIONI Popolazione 1 Popolazione 2 Dalle 2 popolazioni supponiamo di estrarre 2 campioni indipendenti 1º campione 2º campione • Stima puntuale di P1 - P2 Stimatore: Standardizzazione STIMATORE PUNTUALE MARGINE DI ERRORE (Standard Error) (Percentile) • IC per P1 - P2 • Verifica di ipotesi su P1 - P2 Statistica test: Prima definisco Ha senso applicarlo quando le 2 medie campionarie rappresentano la stessa cosa e va a sostituire Rifiuto H0 se Esempio: gli uomini e le donne gradiscono in modo diverso un certo prodotto? Campioni: 10700 uomini 1665 gradiscono il prodotto 11000 donne 1943 gradiscono il prodotto Proporzione di uomini che gradisce il prodotto Proporzione di donne h e gradisce il prodotto ~ Bernouliana Poi 17 - Pz n Bernouliana Pz Pn Pz 7 P2 EPÌ - È = - (À - E /È = 7 Pz Var PÌ - È = Var È + Var È - Zcov È, È) = Pitt - H) + Pzlt - Pz) MI hz = O poi - Pa - Pn - Pz nn / 0 ; 1) Mena ELEVATI PIU - Pitt P2 /1 - Pz) nn NZ È - È ± - × È/ 1- È) + È/ 1- È) 2 MI hz =P Ho :/7-13=0 Ho : 17 = Pz ) H1 : M - Pz # O µ, :p, # p, g test su 2 CODE P = NÉ + maÈ nntnz 7 e Pz (pi - pi) - O = IN - È) - 0 e ' lo;^) sotto Ho 1511 - À + Eh - F) nn n, F" - i pf, + n? 117 - È) - O - ✗ a 1511 - i ^ + ^ MI ha poi = Ho : Pi -- Pz H1 : Ps =/ p, ✗= 0,01 Pz = Statistica test: Approccio del valore critico Rifiuto H0 se Decisione: Approccio del P-Value Approccio dell’intervallo di confidenza TEST CHI-QUADRATO condizione “teorica” (essendo sotto ipotesi nulla fino a prova contraria si considera vera) non vale la condizione “teorica” Frequenze Frequenze osservate (che ho riscontrato nel campione) Frequenze teoriche o attese (che mi attendevo se la condizione fosse stata vera) Statistica test: Andrò a sviluppare SOLO TEST SU CODA DX (perché solo valori grandi portano ad un evidenza empirica) Distribuzione di C sotto H0 1Pa - È) - O a N / 0 ; 1) sotto Ho 1511 - i ^ + ^ 10700 11000 - 2-% I - I > - 0,005 Z 2,576 7=166510700=0-1556 3=194311000=0,1776 15=(10700110/1566)+(110001/0,1776) = 1665+1943 = 0,1663 107001-11000 104001-11000 zoss = 0,1566 -011663 = 4,1469 RIFIUTO HO 0,166311-0,1663) ^ 10700+11^000 * PV=P Z 4,1469 Ho =P Z -4,1469 oppure Z 4,1469) Ho = 21 - i /4,15) 70 * se 0=0,01 PV ✗ RIFIUTO HO i i - 4,1469 4,1469 1- ✗ = 0,99 > 2-✗ < = 2,576 - 0,0080 0,1556 - 0,1776 ± /2,576 '°' / 556"-0' /556) + 10,1776111 -0,1776) = - qgggg10700 11000 RIFIUTO HO perché lo OEIC ✗ché Ho : Ps =P, → Ho : Pa - Pz --0 . -0 : 1- 1 : Oi 1 ti • (= Oi - ti 2 i Ei ' > Distribuzione Chi quadrato I , ↳ RICHIAMI SULL’INTERPOLAZIONE N coppie di valori a seconda che il punto sia sopra sotto la retta + i punti sono vicino alla retta e + sono vicini, + il residuo è piccolo Metodo dei minimi quadrati: raffronta con ordinata teorica del punto , che l’ordinata che si ottiene per quel punto proiettato sulla retta. e l’ordinata del punto se fosse stata sulla retta. Quello che cerchiamo di fare non è tanto sapere se il residuo è < o > di zero, ma il suo ordine di grandezza: Problemi 1) Y non dipende esclusivamente da X 2) Dati campionari Soluzioni 1) Modello per la popolazione Media ma media in più Esempio: consumo famiglie dipende dal reddito X e da un’altra componente MODELLO DI REVERSIONE LINEARE SEMPLICE contiene tre semplificazioni: . 1) variabile X è controllabile posso fissare i valori . 2) X impulso che do e vedo la risposta Y corrispondente che dipende dall’errore che i media sia annulla (c’è una convergenza della risposta verso la risposta media) . 3) la risposta media può essere modellata in modo lineare, cioè attraverso una retta con due coefficienti Componente simmetrica Componente casuale ✗1 ; ya ) / ✗ 2 ; yz . . . XN ; Yn . . . - ' _ ' ' yi - yi > RESIDUO Ordinata teorica 0 > y Yi Yi n a- " ✗ i -E) (Yi- Y = covlx, y) mini= , Yi - y ; = mini = , Yi - to - ✗ 1 ✗ i = ✗1 = i = ' n gyx, i = , /✗ i -E) 2 questa somma deve essere considero la somma totale dei residui ✗ ottenere il t piccolo possibile una misura complessiva dell'andamento della retta o = y - £, [ • al quadrato x togliere il problema del segno 2 1 ' y = ✗0 + ✗1 . y = h / ×) + E > COMPONENTE di ERRORE CASUALE : quantifica la presenza di variabili =/ ✗ che possono essere osservate o non osservabili E . > = valore atteso y a) = h / 1) > perché le u che appartengono a quella fascia ✗= X tendono a convergere verso un' unico valore medio che dipende solo da ✗ Y = h /✗) t { E = O > quindi > ✗ è controllabile , infatti fisso un valore ✗ { è controllabile , ✗chè una volta fissato ✗= × , la media è 0 valore della ✗ ✗ = 30+31✗ + E con media (E) = 0 = po + 31L + E ' _ ' ✗=L) = 130+312 - = ( E / =L) = 0 > h \ È LINEARE E 30 e 31 2) abbiamo N coppie di valori: • elementi delle copie si pensano come variabili note (le fisso io) • elementi sono variabili aleatorie: si estraggono casualmente statistiche e si oss. solo quelle e non l’intera pop. Stimatore di Stimatore di Esempio Campione: n = 5 famiglie X = reddito disponibile annuo (migliaia €) Y = consumo annuo (migliaia €) Osservazioni 1. Formule alternative . 2. Bontà d’andamento: + la retta è lontana e + è inaffidabile per fare previsioni Coefficiente di correlazione lineareCoefficiente di determinazione 2 µ ✗1,91 ) / ✗492 . . . XN ; Yn n n n n ^ 1 FISSATO PRELIMINAREAMENTE Yt Yz Yn RISULTATO DI UN PROCESSO Aleatorio : da sottopopolazione estraggo casualmente tu e osservo il valore di Y A ✗1- ✗ Iyi-5 bo -- J - bitbi = 1×1 - E) = * sostituisco y con ' a B , = ✗1- ✗ ( Yi - i Bo = F- BIX Rimane piccolo XCHÉ NO Aleatorio 1×1 - E) 2 i Xi Yi li -E Yi - Y li - IT ✗ i -1 yi -9 1 40,2 35,8 -15,4 -16,4 237,16 +252,56 2 100,6 88,2 45,0 36,0 2025 +1620 3 83,2 78,5 27,6 26,3 761,76 +725,88 4 g 33,5 33,0 -22,1 -19,2 488,41 +424,32 20,5 25,5 -35,1 -26,7 1232,01 +937,17 278 261 0 0 4744,34 +3959,93 > SEMPRE ' [ = 278 g = 55,6 b, = 395%93=+0,8347 STIMA COEF . ANGOLARE MEDIE 4744,34 261=52,2D= 5 bo -52,5 - 0,8347 55,6=5,9707 > STIMA INTERCETTA REITA ccd CAMPIONARIA Num : ri - T) / yi - 9) = Xiyi - nly Den : ✗ i -2 ? li ' .nl ? Dai CAMPIONARIA y ; - y ' = Yi - Yi ' + y - y = con yi -- bottini SST SSE SSR 72=5513 Sst = 1 - SSE y , SST Esempio (continuazione) INFERENZA SUI PARAMETRI DEL MODELLO Assunti sulla componente di errore STIMA DELLA VARIANZA DELLA COMPONENTE D’ERRORE Stimatore non distorto di misura l’attitudine del carattere Y a cambiare misura l’allontanamento della retta dai punti (+ grande, e + la retta è distante quindi peggiora adattamento) misura la capacità della retta piegare quei punti (+ è grande + spiega la dipendenza dietro i punti e + buon adattamento) Supponiamo di avere Le assunzioni che facciamo possono interessare l’una l’altra o entrambe ' SST = DCVTOT . ' SSE = Dev RESIDUA . SSR = Dev SPIEGATA i Xi Yi Yi Yi - Yi Yi - Yi ' 5- 5 ' Iyi - y )' 1 40,2 35,8 39,3456 -3,5456 12,5713 165,2356 268,96 2 100,6 88,2 89,7615 -1,5615 2,4383 1410,8663 1296 3 83,2 78,5 75,2377 +3,2623 10,6424 530,7356 691,69 4 33,5 33,0 33,7533 -0,7532 0,5673 340,2844 368,64 5 20,5 25,5 22,9021 +2/5979 617491 858,3669 712,89 278 261 0 32,9686 3305,4888 3338,18 SSE SSR SST 12=3305,4888 3338,18 = ①9902 > Buon ANAMENTO Ip = 50 Jp = 5,97071-(0,8347/150)=47,5239 > consumo MEDIO STIMATO SINGOLA FAMIGLIA con REDDITO 50.000€ > avendo un' alta affidabilità posso fissare un nuovo valore di ✗ che non rientra tra quelli osservati e vedere il consumo previsto dal modello . = 1301-312 + E li = xj ' Di -- 130+13121 . + {i • yj-potptxj-G.IE/Ei=0-xi fissato 2 Var { i = 02 -Xi fissato 3 Ei Il Ej -Xi # Lj fissati > INDIPENDENTE,,,µm,,,,,$ - ✗ FISSATO i --130+131×1 ' + Ei Ei -- Yi - 130-131×1 . Ei = yi-bo-bixi-y-yi-yi-yif-SSL-gz.SE02 = ar { i n -2 E per la previsione Esempio Media di y Singolo valore di y IC x la media della singola famiglia STUDIO GRAFICO DEI RESIDUI Stima delle componenti di errore che non riesco ad osservare Forma del modello non adeguataVarianza non costanteModello adeguato ' pttxzsip - c ' pttxzss 2 1=5,9707+0,8347/1 213--50 Ip -5,9707+0,8347501=47,5257 migliaia di € 1 d' p =/3,3150 ^ 150 -55,612 5+4744,34 = l'5068 ICO , 95 : 47,5257+-13,182) /1,506g) = 573203 42,7311 2 59,1126 Ssn = (3,3150 1+1 (50-5%6)<=3,6416 Ho,95 : 475257+-13,182) / 3,6416) =5+4744,34 35,9388 ii. 30+314+4 Ei - Yi - po - pili {i = ' i - ' i RESIDUI g- 5 g. 5 g. 5 r - • , i • - " _ ' - ' £9 o i _ " . . - zio . . . . . gg , i i . . . - ¥ , _ . . . . . . . i . . ¥ ' . . . . . . ¥ " . . . . . ' , " ✗ ✗ ✗ CARTE DI CONTROLLO Controllo statistico della qualita SPC (“Statistic Process Controll”) Ci sono processi produttivi che producono su larga scale, esempio beni di largo consumo, che devono rispettare standard qualitativi, il produttore ha tutto l’interesse di rispettare questi standard ma per questioni di costo non può testare tutti i prodotti, in quanto qualvolta possono essere test distruttivi che non permetterebbero la vendita. Quindi ci si basa su campione di pezzi prodotti cercando di capire se il processo produttivo alla base funziona. . Gli strumenti usati mirano a mantenere ordine tra i dati statistici per controllare la qualità dei processi, tra questi ci sono le carte statistiche. Variabilita che può essere Variabilità naturale Variabilità dovuta a fattori specifici Esempio: non posso pretendere che in tutte le confezioni della tutella ci siano 500 gr ma potrebbeesserci una varianza naturale che sposta questo valore di poco, ma se questa variabilità è eccessivamente elevata potrebbe essere dovuta a fattori specifici, esempio una distrazione di un opraio. Quindi se vediamo che ci sono questi fattori specifici possiamo integendire andando ad eliminarli Le carte di controllo considerano Se c’è solo variabilità naturale si dice che il porcesso è sottocontrollo Se ce una variabilira docuta a fattori specifici si dice che il processo è fuori controllo nº progressivo del campione Valore osservato della statistica scelta Punto sopra la UCL = segnale di fuori controllo. Non dice che il porcesso è fuori controllo, ma è un’evidenza empirica che permette di rifiutare l’ipotesi nulla. A livello operativo conviene interropere la prouzione e verificare . Struttura analitica della carta bisogna cercare di capire Limiti di controllo Upper Control Limmit Control Line Lower Control Limit Processo sotto controllo HO Processo fuori controllo) Ht - o -1 i UCL • . CL LCL : : : 7M > [ = • = STATISTICA = W) e arv • AITORE di ESPANSIONE UCK Ew) -1 Varlw CL = = W ( = - W - Varw Esempio Scelte da effettuare . 1) Fattore di espansione 2) Numerosità campionaria 3) f di campionamento Esempio continuo Limiti di sorveglianza Esempio (continuazione) Fornisce il numero atteso di campioni da estrarre per avere il primo segnale di fuori controllo Lunghezza media delle sequenze Tempo medio al segnale Tempo atteso prima del segnale di fuori controllo Esempio • M = diametro dei bulloni prodotti ( mm) - Ho : µ = 4,2 H1 : M¥4,2 - Campioni di 15 bulloni estratti ogni 15 minuti . ✗ = diametro bullone ( mm) in n n; 02=0,52 VALORI di Ì STATISTICA : ✗ . E / I ) = M = 4,2 sotto Ho 4,7589 UCL Var ✗ / = 02=0,52 n 15 = 0,0347 - 4,2 CL carte 3- Sigma LIMIT di CONTROLLO . UCL = 4,2 t 0,0347 = 4,2 + (3) 0,0347 = 4,7589 ( ( = 4,2 . . 3,6411 LCL LCL = 4,2 - (3) 0,0347 = 3,6411 N° CAMPIONE 1=2-42 n h > prob. di errore : prob . che dato un processo FC , si abbia il segnale) 1 . P segnale processo non è fuori controllo = P W LCLU W UCL Ho =P errore di 10 specie = a > statistica • allora ✗ . |} ' - P nessun segnale processo è fuori controllo = P / LCL W UCL tu =P errore di 20 specie =3 Se si pone =3 carte 3-Sigma qual' è il valore di ✗ corrispondente? ✗ =P ✗ 3,6411 U Ì 4,7589 ll = 4,2 = 1 - P 3,6411 ✗ 4,7589 µ = 4,2 STANDARDIZZO > 1- P 3,6411 -4,2 z 4,7589 -4,2 = 0,52 0,52 15 15 = 1 - P - 3 Z 3 = 1- i 3- ' -3 = 1- [3-1-1--3=2-2--3--21 - [3 = 21 -0,9987 = 0,0026 > valore di ✗ con i. =3 > usato - ✗ calcolare LCL , UCL.CL VALORE OSS . UW = E / W + ' var W della statistica SCELTA LWL = EIW - ' Varw UCL UWL Upper Weaving Limit CL LWL Lower Weaving Limit Lcl Riprendendo l'esercizio fatto precedentemente, ponendo l'= 2 e calcolando UWL e LWL Otteniamo prob = 0,0456 ° PROGRESSIVO del CAMPIONE 2 ARL = f p =P segnale 3 ATS = > h ✗ ARL Carta 3- Sigma (=3 > ✗ = 0,0026 h --10 ARLO = ^ = 384,612385 ATSO = 10-385=3850 minuti 0,0026 Esempio Si estraggono campioni di numerosità n = 5 bulloni ogni h = 20 minuti. Si dispone di m = 21 campioni preliminari. (Non confondere n con m) • = diametro bullone (mm ✗ ~ (n; à) . Si estraggono campioni di n = 5 bulloni ogni h -- 20min. . Si dispone di m = 21 campioni preliminari = = 2099,246 = 99,9641 È = 15.26=0,7267 21 21 CARTA I CL = Ì = 99,9641 UCL = È t AZÌ = 99,9641 + 0,577 . 0,7267=100,3834 LCL È - AZÀ = 99,9641 - 0,577 . 0,7267 = 99,5448 → il Grafico carta I: il 1° punto corrisponde alla media campionaria, tutte le medie vengono unite con la spezzata. N . B NON devono esserci punti fuori le linee di controllo. CARTA R CL = È = 0,7267 UCL = DAI = 2,114 . 0,7267 = 1,5362 LCL =D } È = 0 . 0,7267=0 Grafico carta 3 : il 1° valore rappresenta il range del 1° campione Tutti i range vengono Uniti attraverso la spezzata. STIMA DELLA CAPACITÀ DEL PROCESSO Tipicamente il produttore e l’acquirente negozino i valori standard che devono essere soddisfatti nei prodotti che devono essere venduti (esempio richiesta che il diametro dei bulloni rientri in un certo intervallo). Limiti di specifica: un prodotto rispetto a tali limiti se la variabile oggetto di studio rispetto a tali limiti Probabilità di produrre un pezzo conforme ai limiti di specifica Esempio (continuazione) Probabilità di produrre un pezzo conforme ai limiti di specifica? L’alternativa a questo metodo è l’utilizzo del Process Capability Ratio (Cp) Process Capability Ratio (Cp) Se il rapporto è < 1.2 allora il processo non è accettabile perché i prodotti possono fuoriuscire dei limiti di specifica. Esempio (continuazione) Osservazioni: 1. In alcuni casi vi è la presenza di “limiti di specifica unilaterali”. Nell’esempio del bullone a senso che il diametro rientri in un intervallo, ma per altri prodotti questo non deve per forza. Esempio nel caso della produzione di un cavo, può essere chiesto il minimo peso che questo può sopportare, quindi ha senso solamente un limite di specifica inferiore. USL = Upper Specification Limit LSL -- Lower Specification Limit 1 P LSL ✗ USL = ? la variabile ✗ deve stare entro i limiti con ✗ n n; Ò ti > il -- È 0 0=1 da LSL = 99,8 USL = 100,2 È = 99,9641 = ti È = 0,7267 dz con n = 5=2,326 Ò = R = 017267 da 2,326 = 0,3124 P 99,8 ✗ 100,2 =P 99,8-99,9641 - 100,2-99,9641 =P - 0,5253 Z 0,7551 = I /0,75 - il-0,52) = 0,3124 0,3124 i / 0,75 - 1- I / 0,52 = 0,7734 - 1-0,6985=0,4719 2 ^ Cp = USL - LSL 60 = = M - 30 M Mt30 0=0,3124 (p = 100,2 -99,8 = 0,2134 6. 0,3124 Cu = USL -µ LIMIT di SPECIFICA UNILATERALI 30 CE M- LSL 30 2. Processi produttivi non centrati sui limiti di specifica Nel 1º grafico sono pari a 62 e 38 Nel 2º grafico, la media del processo produttivo non è più centrata nell’intervallo ed è infatti più grande di 50. La mancata centratura, nel momento in cui diviene un fenomeno che è sempre più rilevanti, può portare anche a non rispettare le caratteristiche imposte dei limiti di specifica. . Nei grafici, Cp è sempre 2 perché l’ampiezza della distribuzione e dell’intervallo rimangono uguali. Quindi Cp è indicatore affidabile nel momento in cui la distribuzione accentrata nel valore centrale dell’I imposto dei limiti di specifica se il processo centrato, ossia se più Cp è < Cp > inadeguatezza del processo produttivo rispetto ai limiti di specifica Spesso si distingue tra carte di controllo Per variabili: controllo viene fatto il suo carattere di tipo quantitativo Per attributi: controllo su caratteri di tipo qualitativo, come colore o gusto CARTA PER FRAZIONI NON CONFORMI CARTA P Prezzo Conforme Non conforme proporzione dei pezzi non conformi prodotti proporzione campionaria numero pezzi non conformi del campione CARTA P Limiti di controllo Statistica: Visto che la statistica è una proporzione campionaria, che dipende dallo stesso parametro che si vuole controllare ci sono 2 alternative Carta con valore di riferimento Carta senza valore di riferimento campioni preliminari su cui sistemano le caratteristiche di questo parametro (N.B carte P usate soprattutto con la produzione di servizi) µ ± o Cpk = Min Gu ; CL ' Cpk = (p > µ = LSL + USL 2 i Cpk Cp : > misura la capacità potenziale > misura la capacità effettiva - ) = . ) = - D= P=D n E À =p var è = Plfip) . ) UCL =p + 3 PM- P) n ( CL =p LCL =p - 3 PM-P) n ] Po M P > f- = 1 m m , - = , È CARTA PER Nº PEZZI NON CONFORMI CARTA C e U Sono usate per produzioni su ciclo continuo. Alternativa alle carte P si usano carte non basate sulle proporzioni di pezzi non conformi, ma sul n ºdi pezzi non conformi. Limiti di controllo Statistica: nº pezzi non conformi nel campione Alternative per p se c’è il valore di riferimento se ci sono i campioni preliminari Unità di riferimento nº di non conformità nell’u di riferimento nº atteso di difetti medio in 1 u Pezzi che anche se hanno difetti vengono venduti ma hanno qualità bassa N.B non confondere la carta per il nº/frazione di non conformi con le carte per le non conformità CARTA C • Campioni di ampiezza = 1 (1 sola di riferimento) esempio: a intervalli di ti regolare viene estratto 1u casualmente Limiti di controllo Statistica: Visto che la carta dipende da C alternative per C se c’è il valore di riferimento se ci sono i campioni preliminari Esempio • Siliconi allo stato liquidò: Estraiamo 1u di riferimento ogni 30 minuti rilevando il numero di impurità presenti • 15 campioni preliminari • D= DNBININ, p E / D) = np art D= npn - p) UCL = npt 3hPM-p) f- po • p = J (L -- n . p t.CL = np - 3hPM-p) = n Poisson (c) EHI -- var/ × ) = C 1 - ✗1) = Var ✗1) = C . 21 = È STIMA di c UCL = Ct 3 C ( CL = C ( = Co C. = c- LCL = C- 3 C con [ = 1 M mj= , CI µ di riferimento = 100cm} C- = , = 3,5333 - UCL = 3,5333+3 3,5333 = 9,1724 - CL = 3,5333 - LCL = 3,5333 - 3 3,5333--9,1724=-2,105810 possiamo risolverlo con 3 approci punti : valori osservati dalla statistica CARTA U • Campioni di n unità di riferimento (può essere anche non intero) Media campionaria che non viene chiamata ma Limiti di controllo Statistica: Visto che la carta dipende da C alternative per C se c’è il valore di riferimento se ci sono i campioni preliminari Esempio Bianchetto a nastro (u di riferimento 9 mm) • 4 u di riferimento estratte ogni due ore di produzione • 12 campioni preliminari Se il punto di fuori controllo dipende da una variabilità specifica si elimina quel campione e si ricostruì ricostruisce la carta. Quindi potrò usare la carta per previsioni future ✗ 1 , ✗2 , . . . ✗n g- = ✗i + Xzt . - t ✗n n u • Ù E / U ) -- C Var / Uk § ( UCL = (+3 C h CI = C ( = Co→ c-- J LCL = C- 3 C n Ù = 17,00 = 68 12 g. 12 = 14167 UCL= Ct 3 C = 1,4167 + 3 1,4167 = 3,2021 h 4 CL -_ 1,4167 t.CL --1,4167 - 3114167 = - 0,3687=0 > ( possiamo risolverlo con i 3 approcci) 4
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved