Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

Statistica descrittiva, Appunti di Psicometria

Appunti di teoria e svolgimento esercizi (2017). Chiari e semplici

Tipologia: Appunti

2018/2019

Caricato il 29/05/2019

daniela_poli
daniela_poli 🇮🇹

4.2

(14)

23 documenti

Anteprima parziale del testo

Scarica Statistica descrittiva e più Appunti in PDF di Psicometria solo su Docsity! STATISTICA PSICOMETRICA Prof. Vezzoli Caratteri QUALITATIVI • sconnessi: scala nominale, posso valutare solo se due unità sono uguali o diverse (equivalenza) • ordinati: scala ordinale, posso valutare l’equivalenza e l’ordinamento tra le unità Caratteri QUANTITATIVI • discreti: numero intero • continui: numero decimale Tabelle di frequenza totale delle fi% è SEMPRE 100! n = numero totale dei soggetti ! Le frequenze cumulate e percentuali (Fi e Fi%) si possono calcolare per variabili almeno ordinali (non posso calcolare le frequenze cumulate per variabili sconnesse!!!!) Fi = Fi-1 + fi Fi% = Fi%-1 + fi% xi fi fi% M 15 25 F 45 45 TOT 60 100 due scale di misura: - ad intervalli equivalenti (equivalenza, ordinamento e differenza) - a rapporti equivalenti (equivalenza, ordinamento, differenza e rapporto) fi% = (𝑓𝑖𝑛 ) 100 frel = 𝑓𝑖𝑛 xi fi fi% Fi Fi% 1 22 27,5 22 27,5 2 34 42,5 56 70 3 24 30 80 100 TOT 80 100 ultima riga Fi = n ultima riga Fi% = 100 ➢ Esempio di un possibile commento: “il 70% del mio campione ha al più/al massimo la modalità 2 (e la restante percentuale del mio campione ha al minimo la modalità 3)” Se ci sono molte modalità distinte si usano le CLASSI; solitamente aperte (=valore escluso) sull’estremo inferiore e chiuse (=valore incluso) su quello superiore; devono essere disgiunte ed esaustive. es. 0 3 (valori della classe: 1,2,3) Se le classi hanno ampiezza diversa, la rappresentazione grafica cambia! Si deve calcolare la DENSITA’ DI FREQUENZA di = 𝑓1 𝑎𝑖 ampiezza della classe (estremo sup – estremo inf) Se l’ultima classe non presenta un intervallo definito ma è, per esempio, “oltre 50”, per convenzione scrivo l’ampiezza della classe precedente. Rappresentazioni grafiche ▪ Caratteri sconnessi: diagramma a torta o a rettangoli separati ▪ Caratteri ordinali: SOLO diagramma a rettangoli separati ▪ Caratteri quantitativi discreti: diagramma a BASTONCINI ▪ Caratteri quantitativi continui: ISTOGRAMMA (barre attaccate!!!) Sulle ascisse metto: Xi Sulle ordinate metto: fi, fi%, di (se le ampiezze delle classi sono diverse) - se moda, mediana e media coincidono la distribuzione è simmetrica - se la media è maggiore della mediana (moda<mediana<media) c’è asimmetria positiva - se la media è minore della mediana (media<mediana<moda) c’è asimmetria negativa INDICI DI VARIABILITA’ o dispersione si possono calcolare solo su variabili quantitative • CAMPO DI VARIAZIONE o range: differenza tra valore MAX e MIN della distribuzione di frequenza osservata Variazione = XMAX - XMIN (l’intervallo contiene il 100% delle osservazioni) La calcolo quando non ci sono valori anomali. E’ un indice poco informativo, poiché ignora tutto ciò che accade nel mezzo. ! Se V=0, allora XMAX = XMIN • DIFFERENZA INTERQUARTILE (D.I.): differenza tra terzo e primo quartile (pongo la mia attenzione sull’intervallo centrale, cioè sul 50% delle osservazioni ORDINATE, e ignoro tutto il resto) ! Non posso mai dire che la variazione è zero (anche se Q1=Q3), poiché mi concentro solo su una parte dell’intervallo D.I. = Q3 – Q1 Distribuzione simmetrica Distribuzione asimmetrica positiva Distribuzione asimmetrica negativa • VARIANZA: è il quadrato dello scarto quadratico medio NON PUO’ ESSERE NEGATIVA!!!! S2 = M(X2) – X2 1) Faccio il quadrato di tutti i valori (Xi) 2) Faccio la media dei valori ottenuti (cioè li sommo e li divido per n) 3) Faccio la media dei valori Xi e la elevo al quadrato 4) Faccio la differenza tra la media dei valori al quadrato (punto 2) e il quadrato della media (punto 3) ! Con le classi devo usare il valore centrale (cXi) per calcolare la media Maggiore è la varianza più i casi sono dispersi attorno alla media ≠ minore è la varianza più i casi sono concentrati attorno alla media (distribuzione normale) • DEVIAZIONE STANDARD: scarto quadratico medio 𝐒 = √𝐒 𝟐 = calcolo la varianza e la metto sotto radice • COEFFICIENTE DI VARIAZIONE: utile per sintetizzare il rapporto tra media deviazione standard; si usa per CONFRONTARE DUE DIVERSE DISRIBUZIONI! CV = S/M (S è la dev.st. e M è la media) ➢ Esempio: azienda1 = 84 ± 7 (il primo numero è la media e il secondo la dev.st.) azienda2 = 68 ± 6 Quale azienda ha maggiore variabilità assoluta? AZIENDA1 (7>6) Quale azienda ha maggiore variabilità relativa? Devo calcolare CV!!! CV1= 7/84 = 0,083 CV2= 6/68 = 0,088 CV2 > CV1 AZIENDA2 ha maggiore variabilità relativa ! Solitamente negli esercizi quando si chiede la “variabilità” si intende quella relativa STANDARDIZZAZIONE Standardizzare vuol dire ricondurre una misura ad una forma confrontabile con altre misure; un solo punteggio non è informativo! Si devono considerare la SCALA DI MISURA (di solito scale a intervalli o a rapporti, i punteggi vengono riferiti alla media e alla varianza)e il CONFRONTO TRA DIVERSI PUNTEGGI (per confrontare misure ottenute con strumenti diversi è necessario riferirle ad una scala di misura comune o standard). Quindi standardizzare vuol dire RIFERIRE LA MISURA AD UNA SCALA STANDARD DI CUI SONO NOTI I PARAMETRI (MEDIA E VARIANZA) Con la standardizzazione posso confrontare due prestazioni dello stesso soggetto entro due diverse distribuzioni e confrontare le prestazioni di soggetti diversi in differenti distribuzioni. “SCALA STANDARD” o “Z” ha come media zero e come varianza uno M = 0 ; S2 = 1 (quindi S=1) Zi =( Xi – X )/S ➢ Esempio: due bambini fanno due test di intelligenza e nel primo ottengono rispettivamente i punteggi 80 il primo bambino e 100 il secondo, mentre nel secondo test ottengono 115 il primo bambino e 120 il secondo. Il primo test ha come valore medio della POPOLAZIONE 90 e come S2=25, mentre il secondo test ha come media della POPOLAZIONE 110 e come S2=25 . QUINDI: test1 M=90 e S2=25; test2 M=110 e S2=25 sogg1 test1: 80; sogg2 test1: 100 sogg1 test2: 115; sogg2 test2: 120 !!! Senza standardizzare non posso confrontare le performance dei due soggetti nei due diversi test Uso la scala standard con M=0 e S=1 Test1: Z1=(80-90)/5= -2 ; Z2=(100-90)/5= 2 Test2: Z1=(115-110)5= 1 ; Z2=(120-110)/5= 2 Il soggetto2 ha avuto la medesima performance nei due test (“stessa intelligenza”), anche se prima di standardizzare sembrava migliore nel test2. N.B. prima di standardizzare il test di intelligenza era misurato su una scala ad intervalli equivalenti, dopo la standardizzazione su una scala a rapporti perché ho introdotto lo zero assoluto. ➢ Esempio 1) 2) 3) Esempi di calcolo 24,73 trovato facendo 40*68 (le freq. marginali di riga e di colonna associate al valore 25) e dividento il risultato per n (n=110) 0,27 trovato facendo 25 – 24,73 (freq. reali – freq. teoriche della prima cella) Per verificare se due variabili sono connesse tra loro si deve calcolare l’indice CHI- QUADRATO di PEARSON X2 = Σi Σj 𝑪𝒊𝒋 𝟐 𝒇𝒊𝒋 (chi-quadrato = (contingenze)2/freq. teoriche) A B 20 30 fi. 7 25 15 40 9 30 20 50 11 13 7 20 f.j 68 42 110 A B 20 30 7 24,73 15,27 40 9 30,91 19,09 50 11 12,37 7,64 20 68 42 A B 20 30 7 0,27 -0,27 0 9 -0,91 0,91 0 11 0,64 -0,64 0 0 0 1) Costruisco la tabella a doppia entrata (inserisco le freq. congiunte nelle varie celle, calcolo le freq. marginali di riga e di colonna) 2) Costruisco la tabella delle frequenze teoriche (le marginali devono essere uguali a quelle della prima tabella) 3) Costruisco la tabella delle contingenze (le marginali devono essere tutte pari a zero) DEVO NORMALIZZARE L’INDICE 0 ≤ X2 ≤ 1 se le freq. osservate = freq. teoriche, quindi indipendenza stocastica (minima connessione) se massima connessione (h e k sono il numero delle modalità di X e Y) INDICE NORMALIZZATO X2N = 𝐗𝟐 𝐧∗𝐦𝐢𝐧[(𝐡−𝟏)(𝐤−𝟏)] ➢ Esempio (continua l’esempio delle tabelle della pagina precedente) X2= (0,27)2/24,73 + (-0,27)2/15,27 + (-0,91)2/30,91 + (0,91)2/19,09 + (0,64)2/12,37 + (-0,64)2/7,64 = 0,1646 n=110; h=2; k=3 h-1=1; k-1=2; il valore minimo è 1 X2N= 0,1646/110*1=0,0015 quasi indipendenza stocastica • CORRELAZIONE Relazione lineare tra due VARIAB. QUANTITATIVE le coppie di punti tendono a disporsi lungo una retta COEFFICIENTE DI CORRELAZIONE LINEARE DI BRAVAIS-PEARSON per calcolarlo serve la COVARIANZA. Si costruisce un grafico a dispersione (in ascissa va la variabile indipendente, cioè la X) e in esso si rappresentano i punti, creando nuvole di punti. Si creano quattro nuovi quadranti, poiché si devono traslare gli assi (nuova origine nel punto (Xi;Yj), Xi è la media delle X e Yj è la media delle Y). I nuovi punti sono Xi – X e Yj – Y. Gli scarti del I e III quadrante hanno segni concordi, mentre quelli del II e IV quadrante hanno segni discordi. Per mantenere l’informazione sul segno degli scarti moltiplico (Xi – X)*( Yj – Y) Quindi I e III quadrante hanno segno positivo e II e IV negativo. covariazione [La covarianza è indice di concordanza che sintetizza le N covariazioni con la loro media aritmetica: è la media dei prodotti degli scarti di ogni variabile dalla propria media aritmetica.] COV(XY)= [𝚺𝐢𝚺𝐣(𝐗𝐢𝐘𝐣)] 𝐧 - X Y La covarianza può assumere tutti valori reali: COV(XY)>0 i due caratteri tendono ad assumere valori concordanti indicando una tendenza alla linearità positiva (retta crescente) COV(XY)<0 i due caratteri tendono ad assumere valori discordanti indicando una tendenza alla linearità negativa (retta decrescente) ➢ Esempio 1) Ho una tabella con i valori Xi e Yj e devo rappresentare graficamente i punti 2) Calcolo la covarianza e per farlo devo costruire rima una terza colonna (Xi*Yj) 3) COV(XY)= [𝛴𝑖𝛴𝑗(𝑋𝑖𝑌𝑗)] 𝑛 - X Y creo una terza colonna (Xi*Yj), sommo tutti i valori di questa colonna e divido il valore ottenuto per n, poi ad esso sottraggo il prodotto delle medie di Xi e Yj 4) La COV può essere maggiore o minore di zero; ma che informazione fornisce questo dato? Devo SEMPRE normalizzare l’indice 5) Calcolo il coefficiente di correlazione lineare di Pearson: r = 𝐂𝐎𝐕(𝐗𝐘) 𝐒𝐱𝐒𝐲 (S: dev.st. campionaria ed è sempre positiva!) -1 ≤ r ≤ 1 è il numeratore a darmi il segno! Se r = 0 i punti sono sparsi nel quadrante, non c’è relazione lineare tra le variabili, c’è INCORRELAZIONE Se r = 1 correlazione lineare perfetta DIRETTA (alti valori di X e bassi di Y o bassi valori di X e alti di Y) Se r = -1 correlazione lineare perfetta INVERSA (bassi valori di X e bassi di Y o alti valori di X e alti valori di Y) Quando uso r? Nei test-retest, quando calcolo il coefficiente di equivalenza di due test paralleli, quando devo valutare l’attendibilità della capacità valutativa dei due giudici, per rilevare la consistenza interna di un questionario. REGRESSIONE Insieme di procedure statistiche che consentono di usare le info che si hanno su una variabile per predirne un’altra. RETTA DI REGRESSIONE: y = a + bx + e intercetta (punto in cui la retta incontra l’asse y, cioè quando x=0) coefficiente angolare (inclinazione della retta) errore La stima di a e b avviene mediante un criterio matematico: criterio dei minimi quadrati. Questo è basato sulla minimizzazione di una funzione di perdita tra i valori realmente osservati e quelli teorici. y = α + βx
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved