Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

Misurare mediante i test, Appunti di Psicometria

Appunti professor Chirumbolo in teoria e tecnica dei test psicologici

Tipologia: Appunti

2020/2021

Caricato il 20/01/2021

aridio
aridio 🇮🇹

4.7

(3)

4 documenti

1 / 15

Toggle sidebar

Spesso scaricati insieme


Documenti correlati


Anteprima parziale del testo

Scarica Misurare mediante i test e più Appunti in PDF di Psicometria solo su Docsity! Teorie e tecniche dei test Misurare mediante i test: misurare= stabilire una certa corrispondenza (basata su determinate regole) tra certe proprietà dei numeri e certe proprietà degli eventi/oggetti. Grandezze fisiche (estensive)=> scomponibili in parti e direttamente misurabili; dotate di unità campione; facilmente pensate in termini numerici (es: peso, lunghezza…) Cosa si misura in psicologia (manifestazione empiricamente osservabili dei costrutti psicologici attraverso un processo di scaling): LATENZA (intervallo di tempo che intercorre tra uno stimolo e il verificarsi di uno specifico evento=> tempi di reazione nei test cognitivi) FREQUENZA (numero delle volte che si presenta un determinato evento (es: n. di risposte di un certo tipo in un test) DURATA (quantità di tempo in cui un singolo comportamento viene mantenuto) INTENSITA’ spesso nei test frequenza assunta come indicatore di intensità del comportamento stesso (es: test QI con tante risposte corrette) PROPRIETA’ DEI NUMERI 1. Nominare (scala nominale)=> variabile categorica, operatori =; operazioni: frequenza. 2. Ordinare (scala ordinale)=> variabile ordinale; =,<,>; 3. Sommare e sottrarre (scala a intervalli equivalenti)=> variabile discreta 4. Dividere e moltiplicare (scala a rapporti)=> variabile continua Ogni scala ha le proprietà anche di quelle gerarchicamente inferiori, ma non il contrario ITEM elementi minimali di un test (indicatori del costrutto latente, ossia variabili osservate) TEST variabili latenti o costrutti Diversi item per diverse caratteristiche psicologiche da misurare -Gli item possono essere rappresentati da affermazioni rispetto a cui il soggetto esprime il proprio grado di accordo, o da descrizioni di comportamenti di cui indicare la frequenza con cui vengono agiti (TIPICO DI TEST DELLA PERSONALITA’ O SCALE DI ATTEGGIAMENTO, test di comportamento tipico o di tipica performance, che non prevedono risposte giuste o sbagliate) -Gli item per la valutazione di abilità cognitive (test di massima performace) sono rappresentati da problemi da risolvere, stimoli da elaborare, quesiti che hanno più alternative di risposta tra cui una sola è giusta -Esistono item rappresentati da stimoli non verbali, come nei test di personalità proiettivi In genere le risposte agli item in genere vengono combinate tra loro (di solito in maniera additiva) per ottenere un punteggio complessivo che intende riflettere la quantità di una determinata caratteristica oggetto di studio nel soggetto Ogni item può prevedere: - Semplice giudizio di assenza/presenza (scelta dicotomica) - Una gradazione della risposta (scelta ordinata) - Scelta quasi continua Grado di liberà concesso del soggetto nella risposta: a scelta alternativa (dicotomica o multipla), più adatti a raccogliere punteggi standardizzati (quindi confrontabili tra diverse prove, Ss o gruppi di Ss); penalizza il pensiero creativo a risposta libera (permette di valutare altre caratteristiche, come la capacità di fare collegamenti, la profondità,originalià ecc) Formato degli item: verbali (scritti o orali)=> richiedono risposte, scritte, orali o psicomotorie visivi classificazione test psic 1. In funzione del mezzo: test carta e matita (tipico questionario su carta, anche se ora spesso avvengono in digitale); test strumentali (richiedono la manipolazione di strumenti, oggetti, disegni…) 2. In funzione del modo: test individuali (somministrati ad un individuo per volta)=> es strumentali sono solo individuali; test collettivi (a più soggetti contemporaneamente); test verbali (sia istruzioni che risposte verbali), non verbali (sia istruzioni che risposte con grafici, diagrammi, gesti); test di velocità (prove facili ma tempo limitato, difficoltà nel risolverli tutti in tempo), test di potenza (prove di difficoltà crescente dove raramente le prove difficili sono risolte) 3. In funzione dell’area psicologica da misurare: test cognitivi (di massima performance= si chiede di dare il massimo), valutano abilità raggiunte o potenziali. Il punteggio in genere è dato dalla somma delle risposte corrette fornite); -TEST DI LIVELLO composti da batterie di test, ossia da più scale di misura correlate che si integrano e misurano abilità cognitive. Possono dare un punteggio unico tot e/o punteggi parziali. Scopo: rilevare se il sogg manifesta carenze o maggiori quantità di tot caratteristiche confrontando i risultati con quelli della pop di riferimento degli individui della stessa età. Ne fanno parte test di intelligenza. -TEST DI SVILUPPO fanno più riferimento a un modello teorico che guida l’interpretazione dei risultati ottenuti. Es: test sviluppo cognitivo in riferimento a Piaget -DI PROFITTO misurano il livello di competenza e di conoscenza di un argomento specifico (es: test invalsi) -ATTITUDINALI includono una serie ristretta di prove cognitive selezionate sulla base dell’obiettivo che si vuole raggiungere. Possono valutare una sola attitudine o essere composti da batterie di test per multiple attitudini. Usati spesso per predire (potenzialmente) il successo nell’ambito di un lavoro, nei corsi di formazione o di rendimento scolastico. test non cognitivi (di tipica performance, o di comportamento tipico. al sogg è richiesto di descrivere in che misura un certo comportamento o caratteristica lo descrivono); TEST DI ATTEGGIAMENYO, DI INTERESSI, DI PERSONALITA’=> mirano a delineare un profilo psicologico descrivendone i tratti di personalità normale o patologica(proiettivi: stimoli ambigui, più o meno strutturati. Si presuppone che il sogg rifletta su di essi sentimenti ed impulsi propri, meccanismo di difesa della proiezione; e non proiettivi- standardizzati: il sogg risponde relativamente a se stesso, riflettendo su di sé) Risposte alfa: indicative di un certo attributo Test cognitivi: risposte alfa: corrette beta: non corrette; non cognitivi: no risp corrette/errate (altri criteri di correzione dei test) stima ottenuta, poiché di possono avere tante stime differente in base alle possibili suddivisioni del test. 4. Metodo della coerenza interna: studio del grado di accordo tra più misure dello stesso costrutto teorico (cioè tra gli item). L’attendibilità è dunque stimata utilizzando l’informazione contenuta nell’item (varianza, cioè variabilità tra gli item) costrutti latenti= variabili. Più varianza abbiamo, più info abbiamo. Affinché ci sia buona coerenza interna, bisogna che gli item siano adeguatamente correlati fra di loro: maggiore sarà l’intercorrelazione degli item, maggiore sarà la loro omogeneità, dunque maggiore sarà l’attendibilità del test che formano. Aspetto dell’attendibilità: interscambiabilità degli item. Formula KR-20 di Kuder e Richardson (per item dicotomici) INSERISCI FORMULA. Alfa di Cronbach (per item politomici, cioè con risposte alternative) tiene conto della varianza, e quindi dell’info, contenuta in ciascun item. Come se ogni item fosse una forma parallela. Per test non cognitivi con item poolitomici 5. Attendibilità dell’esaminatore o inter-siglatore: La percentuale di concordanza tra valutatori (p= rapporto tra casi in cui gli osservatori sono d’accordo e numero tot di fatti osservati) r= 2p-100/100. Poi si usa Spearman Brown per ottenere rtt. Attendibilità come coerenza interna: limiti. I coefficienti di attendibilità in questo caso presuppongono che gli item di un test siano indicatori di uno stesso costrutto (alfa: test monofattoriale o monodimensionale, unico costrutto latente) Però questo presupposto non è necessariamente verificata: esistono casi empirici di test non monodimensionali (insiemi di item multifattoriali) che ottengono coefficienti alpha elevati. La dimensionalità di un test mediante tecniche di analisi fattoriale. La coerenza interna non è garanzia di monodimensionalità (es ansia depressione. Correlati tra loro ma sono costrutti latenti differenti). 8/10/2020 Alpha di Chronbach è utile con test unidimensionali, ma non è indice di unidimensionalità. Analisi fattoriale: serve a studiare la dimensionalità di un test. La correlazione interna aumenta all’aumentare del test (per cui basta un’intercorrelazione media tra gli item se il test è lungo) Item ambiguo/doppio/fattorialmente complesso: risulta essere indicatore di due costrutti distinti. Come individuo questo pessimo indicatore, che inficia l’attendibilità e la validità? Es: ansia di tratto – depressione (spesso correlati) item ambiguo tipo: non riesco a dormire la notte. Interpretazione dei coefficienti di attendibilità: >= .90 ottimi Tra .80 e .90 buoni Tra .70 e .80 discreti Tra .60 e .70 sufficienti (spec. Se il test è composto da pochi item, se il test è lungo l’attendibilità- intesa come coerenza interna- ne risente in questo caso)  lunghezza del test importante Coefficienti < .60 inadeguati Coefficienti modesti possono andar bene per scopi di ricerca o nelle fasi iniziali della costruzione di un test, ma per prendere decisioni su individui servono coefficienti + elevati. Come individuare un buon item? ITEM ANALYSIS Importanza di quegli item che alzano l’attendibilità. Coefficienti alfa del test se l’item è escluso: si calcola alfa di Chronbach considerando un certo item come escluso, e procedendo ad eliminarli tutti uno per volta (permette di valutare adeguatamente il peso dell’item all’interno del test). Se il coefficiente è più basso: l’item contribuisce ad aumentare l’attendibilità Se è identico: non contribuisce (tendenzialmente si tiene perché maggiore lunghezza test, maggiore attendibilità) Se è più alto: va tolto, così da elevare l’attendibilità Coefficiente di correlazione item-totale: si valuta la correlazione tra l’item specifico e il punteggio totale del test (escluso però quell’item in particolare dal totale) Mentre il coefficiente di attendibilità ci informa sull’attendibilità del test, il coefficiente di correlazione item- totale ci informa sull’attendibilità dell’item. Coefficienti item- totale <.30 sono ritenuti bassi e riducono attendibilità e coerenza interna del test L’item va correlato con il punteggio tot – item esaminato oppure usare una formula di correzione del coefficiente item-totale Indice di discriminazione dell’item: a che livello l’item discrimina tra le differenze individuali che si ricavano dalle risposte dei soggetti. Item discriminativi compongono test discriminativi LUNGHEZZA DEL TEST E ATTENDIBILITA’ Tendenzialmente la lunghezza aumenta il coefficiente di attendibilità, ma solo se gli item sono omogenei o paralleli, e se essi sono buoni indicatori del costrutto/i. Se si tolgono item non buoni, ad esempio, l’attendibilità aumenta. Con la formula “profetica” di Spearman Brown si può stimare il coefficiente ottenuto allungando il test di n item (presuppone che gli item aggiunti siano omogenei o paralleli) In questo caso la formula è rntt (stima del coefficiente di attendibilità): nrtt/1+(n-1)rtt N= rapporto tra n item ipotetici e n item esistenti Rtt= coefficiente di attendibilità della versione esistente Esempio applicazione formula: test con 15 item e rtt=.80, se aggiungo 5 item qual è rntt? Rntt= 15/20x.80//1+(15/20-1).80 1.333 x .80/ 1 + (1.333-1).80 1.066/1.266= 0.84 Dunque l’alpha di Chronbach aumenterebbe, e il test sarebbe più attendibile. Test di 22 item, rtt: .85. aggiungendo 6 item rntt? Rntt: 22/28x .85//1+(22/28-1).85 0.785x0.85/1+(0.785-1).85 0.667/0.817= 0.81 sbagliato, era 28/22 (viene .88) Perché passare da .85 a .88 non è funzionale? Perché .85 è già buono, e si allunga troppo il test. La formula inversa può rivelarci il n di item necessari per ottenere un dato livello di attendibilità n = rntt (1-rtt)/rtt(1-rntt) se ho rtt di .85 con 30 item e la voglio di .90 quanti item paralleli devo aggiungere? n= .90(1-.85)/.85(1-.90) 0.135/0.085=1.59 N item finale/n item iniziale  n(nitem iniziale)= n item finale 1.59(30)=47.7 (circa 48) Quindi 18 item da aggiungere Esercizio: rtt:.81 con 15 item. Voglio .85 n? n= .85(1-.81)/.81(1-.85) 0.161/0,121= 1.33 1.33(15)=19.95 (+5 item) Correlazione e attendibilità: l’attenuazione Correlazioni tra costrutti latenti (ciò che si correla di fatto sono i sintomi, le manifestazioni empiriche= indicatori) e tra due misure di costrutti Gli errori di ciascun indicatore non devono correlare tra loro, a correlare deve essere la parte vera Correggere l’attenuazione CONTINUA SU QUADERNO (1 PAG) MANCA LEZIONE VENERDI’ 12/10/20 Per item analysis bisogna valutare: difficoltà, discriminatività,?. Proprietà degli item dicotomici Sono variabili dicotomiche nominali gli item che indicano diverse qualità di una proprietà (maschio o femmina) Sono variabili dicotomiche cardinali quelli che indicano la presenza di una proprietà (vero o no) Occorre fare riferimento agli indicatori della distribuzione dei punteggi, come media e ds. Z esprime il punteggio in termini di distanza dalla media rapportandola però alla ds che assume così il ruolo di unità di misura. Z esprime la posizione del sogg al di sopra o al disotto della media in termini di deviazione standard. Standardizzazione necessaria quando: 1.vogliamo avere un’idea della posizione che un soggetto occupa nell’ambito di un gurppo Media 25 ds 3, mario prende 20. Standardizzio punteggio di mario: Zi= Xi-X(con stanghetta sopra)/S= 20- 25/3= -1.7. Mario è quasi 2 ds sottola media 2.vogliamo confrontare le prestazioni di due soggetti nell’ambito di una stessa misura Media 26 con ds 4. Marco ha preso 18 e Anna 30. Marco: 18-26/4= -2 Anna: 30-26/4=1 3. vogliamo confrontare due prestazioni dello stesso soggetto nell’ambito fi due misure diverse Luca prende 7/10 ad un test e 18/40 ad un altro Il primo(x) ha media 5 e ds 2; il secondo (y) ha media 25 e ds 6 Standardizzando vediamo che Luca ha ottenuto un punteggio nel test x che si discosta di ?? Formula di trasformazione in bse alla scala usata Y= a+bz oppure Y= xconstanghetta+sz A (media) e b (dev standard) Paola ha ottenuto il punteggio di Z= 0.68 T=50+10(-0.68)= 50-6.8=43.2 Sten= 5.5+2(-0.68)=5.5-1.36=4.14 Stanine= 5+2(-0.68)=5-1.36=3.64 QI=100+15(-0.68)=100-10.2=89.8 Se la distribuzione dei punteggi grezzi di un test non ha un andamento normale: punteggi normalizzati, procedura: determinare il rango percentile (i percentili sono 99) corrispondente a ciascun punteggio grezzo e quindi cercare il corrispondente punteggio z per quel rango percentile nella tabella della distribuzione normale standardizzata. La normalizzazione è critica quando la distribuzione dei punteggi grezzi si discosta molto dalla normale. 22/10 Analisi fattoriale: indica una serie di tecniche statistiche il cui scopoè quello di studiare la struttura letente di un insieme di dati (riassumere e semplificare le relazioni tra un insieme di variabili individuando le dimensioni latenti ai dati). In altre parole, ridurre un numero elevato di variabili osservate q in un set ridotto di nuove variabili k detti fattori (dove k<q) in modo che -siano una sintesi delle variabili originarie -ne riproducano la maggior parte possibile d’informazione (di varianza) Il punto di partenza dell’ AF è costituito fa una matrice di correlazione R tra le variabili osservate (O ANCHE DI COVARIANZA) L’obiettivo è quello di spiegare tali correlazioni attraverso l’esistenza di fattori sottostanti dei quali le v.o. sarebbero delle combinazioni lineari. Tali fattori sono i processi psicologici latenti che si ipotizza di strovino alla base delle risposte dei soggetti (abilità cognitive,trati di personalità,atteggiamenti) Lo scopo è ridurre la complessità della realtà e la semplificazione e chiarificazione dei modelli interpretatii psicologici. L’analisi fattoriale i usa per la costruzione e la validazione di strumenti di misura Criteri generativi, es: indicatori, es: Costrutto (es: disposizione all’ottimismo)  affermazioni ottimistiche  mi riesce facile rilassarmi  Negazione di caretteristiche generali pessimistiche  se sono abbattuto non mi riprendo facilmente L’obiettivo dell’AF è ricavare la matrice delle saturazioni fattpriali in modo che il N fattori considerati per riprodurre la matrice di correlazione deve essere nettamente inferiore rispetto al n variabili osservate. Esistono diversi metodi dell’esplorazione dei fattori dell’analisi fattoriale esplorativa (AFE) -famiglia di tecniche -analisi componenti principali (ACP) non è una vera AF -Analisi dei fattori comuni (AFC) Nell’AFE l ricercatore, che non conosce il numero dei fattori e le sue caratteristiche, mira a studiare la struttura latente senza stabilire rigidamente a priori quale sarà il risultato finale (CFA) Passaggi AFE: Verificare l’adeguatezza delle variabili in analisi -livello di misura (matrice di correlazione opportuna) - normalità delle distribuzioni e linearità delle relazioni - presenza di outliers 2. verificare la fattorializzazione della matrice R(deve essere positiva definita) 3. scegliere la tecnica da utilizzare per estrarre i fattori 4. scegliere quanti fattori ritenere (o “estrarre”) Il punto di partenza dell’AFE è una matrice di correlazione (R) o una matrice di covarianza. Il punto di arrivo è una matrice di saturazioni fattoriali (che contien euna misura della relazione tra le variabili osservate e i fattori latenti) (S) R= AA’ !!!!!!!!!!!!! Nell’ACP la prima componente estratta è quella combinazione lineare di variabili che riproduce la maggiore proporzione possibile di varianza totale La seconda componente è quella combinazione lineare di variabili che riproduce la maggiore proporzione possibile di varianza residua (rimasta dopo aver rimosso la var. spiegata dalla prima componente) Così via dino alla fine. L’ACP estrae tanti fattori quante sono le variabili iniziali fino a ripsodurre il 100% della varianza dei dati Cj=b1j x1 + b2j x2 ….. ecc Attraverso l’ACP si ottengono diverse info sulle variabili osservate: 1. Comunalità (varianza spiegata nella variabile della soluzione fattoriale; somma delle saturazioni al quadrato di ogni variabile) 2. Autovalori (porzione della varianza totale spiegata dal fattore; è la somma delle saturazioni al quadrato di ogni C. Nell’ACP la somma d tutti gli autovalori riproduce la totalità della varianza 3. Saturazioni fattoriali (bij) (peso della variabile nella determinazione della componente, ossia correlazione item-fattore 23/10/2020 L’ACP non è una vera analisi fattoriale, ma fronisce le basi per la stima della comunalità nell’ACF Se l’ACP mira a spiegare quanta più varianza possibile delle variabili osservate, al contrario l’AF mira a spiegare la varianza comune tra le variabili, ovvero la loro correlazione. Dunque l’AF punta ad eliminare la varianza delle singole variabili che non interessa in ambito psicologico, per analizzare solo la varianza comune tra le variabili. Nell’AFC si procede come nell’ACP, solo che nella matrice di correlazione tra le variabili ( R) si avrà, nella diagonale, le stime delle comunalità delle variabili osservate invece che gli 1. ???? ANALISI COMPONENTI PRINCIPALI: componenti come variabili che spiegano la complessità dei dati ANALISI FATTORI COMUNI: fattori come processi latenti che spiegano la connessione tra le variabili Nell’estrazione dei fattori si procede spiegando sempre nuove quote di varianza che procedendo decresce progressivamente (dunque la quota di varianza spiegata da ogni singolo fattore estratto diviene via via sempre più piccola e insignificante) ANALISI FATTORIALE, LA ROTAZIONE DEGLI ASSI: La rotazione fattoriale ha lo scopo di semplificare l’interpretabilità di una soluzione fattoriale, senza modificarne le fondamentali proprietà matematiche Decidere quale rotazione adottare: -ortogonale DA FINIREEEEEEEEEEEEEEEEEEEEEEEEE MANCA LEZIONE 26/10 E 29/10 30/10 Teoria di risposta all’item Assunzioni: Monodimensionalità e indipendenza locale sono collegate. Il test misura una sola abilità/tratto. C’è una sola dimensione dominante. Se si mantiene costante il livello del tratto latente (cioè per tutti i ss che hanno uno stesso livello di abilità teta)  gli item sono indipendenti. l’indipendenza locale è verificata: Se è vera l’assunzione di unidimensionalità Se lo spazio latente è completo (tutte le dimensioni che influenzano la performance sono considerate)
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved