Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

Appunti di statistica terzo parziale prof. Venturini, Appunti di Statistica Economica

Statistica inferenzialeAnalisi datiStatistica DescrittivaProbabilità e statistiche

Appunti di statistica terzo parziale prof. Venturini

Cosa imparerai

  • Qual è il significato di p-value e come si calcola?
  • Come si calcola l'intervallo di confidenza al livello di 90% per la differenza delle medie di due popolazioni normali?
  • Quali sono le ipotesi alternative?
  • Quali sono le situazioni possibili in una prova delle ipotesi?
  • Quale ipotesi nulla si testa nel documento?

Tipologia: Appunti

2020/2021

Caricato il 17/09/2022

vinooo
vinooo 🇮🇹

4.4

(10)

16 documenti

Anteprima parziale del testo

Scarica Appunti di statistica terzo parziale prof. Venturini e più Appunti in PDF di Statistica Economica solo su Docsity! STATISTICA TERZO MODULO Determinazione dell’ampiezza campionaria n CASO A: I.C. di livello per , popolazione normale, nota Supponiamo di voler estrarre un campione di dimensione n* tale per cui la precisione della stima che si otterrà sia pari a ME* Esempio: (continua) Qual è la dimensione del campione che ci consente di raggiungere tale valore del margine di errore? CASO D: relativo a I.C. di livello (approssimativamente) per p, di una popolazione bernoulliana. ME = ME* = In questo caso, si può utilizzare un approccio “conservativo” (worst case scenario) Esempio: (continua) Qual è la dimensione del campione n* che consente di ottenere una precisione nella stima di p pari a -2 campioni indipendenti Estraggo un primo campane dalla prima popolazione E poi ne estraggo un altro dalla seconda popolazione nx e ny non sono necessariamente uguali -Per stimare la media utilizzo stimatore -Per stimare utilizzo -Per stimare la differenza tra le due medie, utilizzo la differenza tra i due stimatori Valore atteso della differenza =differenza dei valori attesi (Stima puntuale margine di errore) Esempio: Usando i dati di esempio disponibili su Bb si calcoli l’intervallo di confidenza di livello 95% per la differenza tra le medie dell’ammontare speso nelle due popolazioni di clienti femmine e maschi. A tal proposito si assuma che le due popolazioni siano distribuite in modo normale con varianze pari a X = ammontare speso dalle femmine Y = ammontare speso dai maschi G)I.C. di livello per la differenza tra le medie di due popolazioni normali con varianze non note ma uguali (ipotesi non molto ragionevole in realtà) Campioni indipendenti. -2 popolazioni -Parametro -2 campioni indipendenti -Stimatore Per stimare la varianza comune delle due popolazioni si utilizza nel caso G lo stimatore Pooled -> (aggregare) Esempio: Le varianze non sono note e sono uguali. Si calcoli l’I.C. di livello 95% per la differenza tra le medie dell’ammontare speso delle due popolazioni. A tal fine, si consideri che = 1464.9667 94.8611 (i) H0 : (semplice) vs. H1: (composta) (ii) H0: vs H1: (iii) H0: vs H1 : bilaterale : le due ipotesi considerano valori diversi (i) H0: vs H1 Esempio: Si vuole decidere se investire o meno in un determinato settore industriale. In particolare, si deciderà di investire se la media dei profitti dell’intero settore, sarà maggiore di 2M euro A tal fine si estrae un campione casuale di n = 10 aziende dal settore per cui risulta una media campionaria dei profitti pari a Si decida se sembra essere conveniente investire nel settore utilizzando un test con livello di significatività Inoltre, si assume che i profitti nel settore sono normalmente distribuiti con varianza nota pari a Soluzione “euristica” Primo scenario: supponiamo che (H1 corretta, più + grande il valore, più sarà convincente la decisione finale) Secondo scenario: Estraiamo un campione di un altro settore: (H1 non corretta) Terzo scenario (scenario intermedio): Estraiamo un campione di un terzo settore: (è più grande di 2, ma è meno convincente del valore del primo scenario. Soluzione “completa” H0: vs H1: Riprendo primo scenario Ma non basta che la media campionaria vada nella direzione dell’ipotesi H1, perché anche 2.5 va nella direzione di H1, però 8 e 2.5 hanno affidabilità diverse sul convincerci che H1 sia corretta. Quindi la media deve andare non solo in direzione di H1, ma deve andarci anche in maniera sufficientemente convincente. Non è sufficiente che sia a destra del 2, ma dev’esserlo sufficientemente, tenendo conto del fatto che il valore 2.5 ha un’incertezza intorno. Rifiutare H0, quindi significa non solo osservare un valore maggiore di 2, ma anche che sia maggiore di un certo valore soglia che dovrà essere più grande di 2 Quindi: A) (i) H0: vs SI rifiuta H0 se Poiché Sulla base del campione che ho estratto, non ho raccolto prove sufficientemente convincenti per decidere se investire nel settore Si rifiuta H0 se: (scala standardizzata di ) Quando è minore di Esercizio: (continua) A) (i) P-value = P( ) = (standard.) = P( ) = P( ) = 1 – P( = 1 – 0.6255 = 0.3745 Quindi, poiché il P-value è pari a 0.3745, ovvero un valore maggiore di -> non si rifiuta H0 P-value > Definizione generale di P-value P-value = probabilità di osservare un valore dello stimatore uguale o maggiore (quindi nella direzione di H1) rispetto a quello osservato, assumendo H0 sia vera. A) (ii) H0: vs H1: Si rifiuta H0 se: A) (iii) H0: vs H1: (Test bilaterale) Si rifiuta H0 se (con excel il P.value è di 0.3733, ma non è possibile calcolarlo) Poiché P-value Non rifiuto H0 B)(ii) H0: Si rifiuta H0 se B)(iii) (test bilaterale) Si rifiuta H0 se: Oppure se Oppure se C)Test sulla media di una popolazione qualsiasi con non nota e campione grande (n > 25) Teorema centrale del limite (i) Si rifiuta H0 se (ii) Si rifiuta H0 se p-value = (iii) (test bilaterale) Si rifiuta H0 se: D)Test sulla probabilità di osservare un “successo” P per una popolazione bernoulliana (np (1-p) >9) Teorema centrale del limite -Popolazione -> -Vogliamo fare inferenza su P -Si estrae un campione casuale (x1, x2, …, xn) -Proponiamo di utilizzare lo stimatore Proporzione campionaria Teorema centrale del limite (i) Si rifiuta H0 se p-value = Esempio: un’azienda che produce microprocessori vuole stimare la proporzione di pezzi difettosi nella sua produzione. In particolare, vuole verificare se l’ipotesi nulla che tale proporzione sia minore o uguale al 7%. A tal fine, si estrae un campione casuale di pezzi dalla produzione di n = 150 pezzi nel quale si osservano 15 pezzi difettosi. Si effettui un opportuno test ad un livello di significatività Caso D (i) n = 150 Soluzione 1 (soglia critica) Poiché Tasso di difettosità troppo alto Soluzione 2 (p-value) P-value = P-value = Potenza di un test (-> si utilizza per determinare l’ampiezza campionaria) CASO A (i) Si rifiuta H0 se (ii) SI rifiuta H0 se (iii) (Test bilaterale) Si rifiuta H0 se Esempio: si vuole valutare l’efficacia di un corso motivazionale sulle vendite per un campione di n = 6 agenti di commercio Agente Vendite 3 mesi prima Vendite 3 mesi dopo di = xi – yi 1 212 237 25 2 282 291 9 3 203 191 -12 4 327 341 14 5 165 192 27 6 198 180 -18 Si vuole verificare (ipotesi alternativa) che la media delle vendite dopo il corso sia aumentata. Si usi un CASO E (i) SOLUZIONE 1 (soglia critica) Poiché SOLUZIONE 2 (P-value) Poiché P-value -> Non rifiuto H0 CASO F Test sulla differenza tra le medie per due popolazioni normali (con varianze note) Campioni indipendenti (i) Si rifiuta H0 se (ii) Si rifiuta H0 se (iii) Si rifiuta H0 se CASO G Test sulla differenza tra le medie per due popolazioni normali (varianze non note) – campioni indipendenti -Stimatore Con Media ponderata per le numerosità delle due varianze campionarie (i) Rifiuto H0 se TEST UNILATERALE (ii) Si rifiuta H0 se (iii) SI rifiuta H0 se Oppure se Oppure se Capitolo 13 Test sulla bontà di adattamento Test di indipendenza tra due variabili aleatorie Test sulla bontà di adattamento Esempio: un sondaggio condotto su un campione casuale di 60 individui ha rilevato le seguenti preferenze per il brand di uno smartphone: Brand Preferenze AA 15 BB 28 CC 17 Tot 60 Si vuole verificare con un test se i dati sopra descritti indichino una distribuzione uniforme delle preferenze per i 3 brand nell’intera popolazione. (Distribuzione teorica) H0: nell’intera popolazione la distribuzione delle preferenze è uniforme Vs H1: nell’intera popolazione la distribuzione delle preferenze è diversa da quella uniforme Distribuzione teorica Distribuzione uniforme delle preferenze (sotto H0) Brand Frequenze assolute osservate Oi Probabilità sotto H0 Frequenze assolute attese (sotto H0) distribuzione uniforme Ei AA 15 1/3 20 = 60 * 1/3 BB 28 1/3 20 CC 17 1/3 20 Totale 60 1 60 Risultato inutile Distribuzione campionaria della statistica test sotto l’ipotesi nulla Condizione: vale questa affermazione, sotto l’assunzione che tutte le Ei 5 [Distribuzione di probabilità chi-quadrato] H0: la distribuzione nella popolazione è {P1, P2, …, Pk} Vs H1: la distribuzione nella popolazione è {P1, P2, …, Pk} Si rifiuta H0 se Esempio (continua): poiché e Si conclude che non ho evidenza forte che la mia distribuzione non sia uniforme.
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved