Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

Statistica Descrittiva: Teoria delle Variabili Quantitative, Appunti di Psicometria

Una introduzione alla statistica descrittiva, con un focus particolare sulle variabili quantitative. Vengono spiegati concetti come assert, teoria, congesso, costrutto, statistica descrittiva e inferenziale, variabile, metodo della sottrazione, operazionalizzazione, livelli di misurazione, campione, popolazione e campionamento. Inoltre, vengono presentate formule come frequenza relativa, frequenza percentuale, modalità, media, rango e quantile. Il documento include anche esempi e limiti tabulati per illustrare le applicazioni pratiche.

Tipologia: Appunti

2022/2023

Caricato il 02/01/2024

caprettiali
caprettiali 🇮🇹

1 documento

1 / 21

Toggle sidebar

Documenti correlati


Anteprima parziale del testo

Scarica Statistica Descrittiva: Teoria delle Variabili Quantitative e più Appunti in PDF di Psicometria solo su Docsity! LEZIONI DI PSICOMETRIA MODULO 1- INTRODUZIONE Metodo sperimentale—> Si divide in fasi: raccolta dati (osservare un fenomeno) + (porsi delle domande) + fare delle ipotesi (cercare di spiegare il fenomeno osservato)+ verificare l'ipotesi (facendo esperimenti)+ analizzare i dati raccolti + trarre delle conclusioni. Ipotesi= affermazione da verificare deve essere riconosciuta empiricamente. Criticità: scontrarci con una realtà che non vediamo (ansia e intelligenza o altro vanno misurate ma non abbiamo strumenti per misurare) Compito dello psicometrista= costruire strumenti per poter misurare queste situazioni invisibili. Asserto= è un’ affermazione che ha valore di verità Teoria= insieme di asserti collegati tra loro Concetto= idea astratta/rappresentazione mentale di un qualcosa di tangibile Costrutto= concetto/i riferito ad un individuo (esempio sentimenti) STATISTICA DESCRITTIVA E INFERENZIALE - Descrittiva: ricercare, cerca di descrivere in maniera accurata i dati raccolti dal ricercatore - Inferenziale: permette di fare una stima. Validità interna= aiuta a comprendere quanto lo studio è veramente affidabile ed è legata al piccolo gruppo studiato Validità esterna= quanto i risultati ottenuti possono essere trasferiti all’esterno del piccolo gruppo studiato In una ricerca troviamo: I. Ricercatore II. Soggetto RICERCATORE (legati alla sua formazione) - Propensione del ricercatore - Errore di genere: valutiamo un uomo come una donna e viceversa - Errore di tendenza centrale: quando il ricercatore valuta un individuo basandosi solo su parametri normali e si dimentica che esistono anche gli estremi 1 sono entrambi una minaccia - Effetto inerzia: manteniamo la valutazione iniziale del soggetto sempre costante, si basa sulla valutazione iniziale che poi viene mantenuta nel tempo - Effetto pigmalione: profezia che si autoadempie, avviene quando minaccio uno studio e mi sto basando su un pregiudizio iniziale (differenza= con l’inerzia valuto e continuo a mantenere costante la valutazione, in questo invece non lo valuto proprio) - Effetto alone: errore che possiamo compiere perché la struttura cognitiva (in maniera anche inconscia) può influenzare lo studio SOGGETTO - Desiderabilità sociale nelle risposte: rispondiamo come la società vuole sentirsi dire (per contrastare ciò esiste l'anonimo) - Regressione verso la media: quando un soggetto ha delle prestazioni o molto elevate o molto scadenti quando andrà a ripetere la prestazione questa si avvicinerà ad una prestazione media che lui compie esempio bambino che ad un compito prende una volta un voto elevatissimo, la seconda volta e altre si avvicina verso la media ma non ripeterà mai l'eccellenza. - Effetto equazione personale: tendenza che si ha nei confronti di se stessi= essere drammatici, cattivi verso noi stessi (meccanismo interno che ci fa avere delle risposte nei nostri confronti molto cattive). Una ricerca può essere influenzata anche dai contesti : fattori contestuali (es guerra) Il ricercatore quando va a fare uno studio vuole costruire un meccanismo per cercare di prevedere il fenomeno che sta studiando quindi va a costruire: un MODELLO. MODELLO: metodo/rappresentazione grafica che cerca di prevedere come si comporterà un determinato fenomeno. Il modello non rappresenta una verità assoluta, ma una previsione probabilistica (non succede mai quello che prevede il modello, è tutto su base probabilistica). Il modello è una previsione teorica: può essere migliore o peggiore e mai rappresenterà la verità assoluta Ci sono modelli che hanno più bontà di adattamento, che sono più buoni ovvero che si avvicina di più alla previsione (ciò che realmente accade) Cerchiamo sempre un modo per poter prevedere il fenomeno che vogliamo studiare, questo modello che non rappresenta la verità assoluta ma che è sempre probabilistico ha 2 caratteristiche fondamentali: SOGGETTIVO: osservare il fenomeno in maniera differente (realtà dipende dal ricercatore) la verità è observer dipendent PARSIMONIOSO: nel modello includiamo solo quei dati (info) che riteniamo necessari, includiamo solo quello che ci serve. (ridurre ai minimi termini) 2 Popolazioni finite/determinate= composte da un numero determinato di unità Popolazioni infinite/indeterminate= composte da un numero indeterminato di unità Campioni= sono un sottogruppo della popolazione che deve necessariamente avere delle determinate caratteristiche (eterogeneo e rappresentativo) Eterogeneo= unità diverse tra loro ma con almeno una caratteristica in comune Rappresentatività= il sottogruppo deve rappresentare fedelmente la maggior parte/l’intera popolazione NB—> N= popolazione; n= campione Parametri= valori che descrivono la popolazione Statistiche= valori che descrivono il campione Campionamento= procedura che permette di estrarre il campione da una popolazione Campionamento non Probabilistico= non casuale Campionamento Probabilistico= casuale, scelte affidate al caso—> rispetta 2 teorie: - Equiprobabilità= stessa possibilità di entrare a far parte del campione - Indipendenza d’estrazione Si divide in: casuale semplice, sistematico, stratificato ed a grappolo 1. CASUALE SEMPLICE Processo molto lento, facile da utilizzare perché estraiamo in modo casuale una ad una le unità che comporranno il campione (esempio: la tombola) 2. CASUALE SISTEMATICO Solo la prima unità viene scelta in modo casuale semplice, le altre sono scelte tramite il Passo di Campionamento (K) Esempio: K= 3 5 Punto di partenza 3. CASUALE STRATIFICATO Il ricercatore suddivide una popolazione eterogenea in strati/classi omogenee, e l’estrazione avviene da ogni singola classe creata dal ricercatore. 4. CASUALE A GRAPPOLO Vengono estratti gruppi di persone con dei vincoli naturali o artificiali -le classi o gruppi hanno numerosità differenti, quello a grappolo risolve in parte la criticità dello stratificato perché qui stiamo prendendo tutti. MODULO 4- FREQUENZA E ANALISI MONOVARIATA/BIVARIATA La statistica descrittiva descrive dettagliatamente una distribuzione di dati, attraverso l’uso di grafici, curve di frequenza e tabelle. La frequenza è quante volte un dato si ripete all’interno di una distribuzione. Il ricercatore può decidere di fare un’analisi monovariata, bivariata o multivariata, studiando una, due o più variabili. Analisi descrittiva: posso studiare la frequenza contando quante volte una unità si ripete all’interno di un campione. Esempio: Modalità/MARCHE AUTO: F A R A O F FO F A F A n=10 FORMULE Frequenza relativa= Frequenza %= Modalità Fi Frel F% F 3 3/10 = 0,3 0,3 x 100= 33% A 4 4/10= 0,4 0,4x100= 40% R 1 1/10= 0,1 0,1x100= 10% Fo 1 1/10= 0,1 0,1x100= 10% O 1 1/10= 0,1 0,1x100= 10% TOT 10 1 100% Fi /n Frel * 100 6 somma= n somma= 1 somma= 100% N.B. la frequenza percentuale ci da una maggiore informazione. Esempio ho come Fi 50 fiat di due autosaloni ma in uno la popolazione è di 100 macchine nell’altro è di 60, attraverso la percentuale capisco meglio in quale autosalone ho maggiore possibilità di acquistare una fiat. (In un autosalone sarà del 50% mentre nell’altro sarà del 90%). GRAFICI DA UTILIZZARE Dalle tabelle possiamo creare dei grafici, i più adatti alla statistica descrittiva sono gli aereogrammi ( diagramma a torta) o il diagramma a barre. L'aereogramma è utile solo se le unità sono poche, mentre il diagramma a barre anche quando ci sono diverse unità (le barre vanno disegnate distanti tra loro perché non hanno nulla in comune, sono pur sempre delle categorie). STATISTICA DESCRITTIVA, VARIABILI QUANTITATIVE Variabile quantitativa—> si possono applicare gli stessi metodi delle variabili qualitative (quando i dati sono qualitativi continui= si fa una classificazione in classi) Classe—> intervallo di valori con limiti inferiori e superiori. Quando creiamo delle classi, cerchiamo e vogliamo continuità. Nella costruzione delle classi vanno rispettate due condizioni: Esaustività ed esclusività - Esaustività= devono contenere tutti i valori presenti nello studio - Esclusività= il dato può appartenere esclusivamente ad una classe Esempio: studiamo il numero di scarpe portato n=15 7 0 10 20 30 40 Fi F A R FO O 10% 10% 10% 40% 30% F A FO R O MODULO 5- INDICI DI TENDENZA CENTRALE Parliamo di un ramo della statistica descrittiva. L’analisi della tendenza centrale indica una tendenza più rappresentativa. Gli indici sono: moda, mediana, media. I. MODA - E’ un dato che nella distribuzione si ripete con maggiore frequenza - La moda non si calcola, si individua - Quando c’è un solo dato con frequenza maggiore si dice UNIMODALE; quando ce ne sono due si dice BIMODALE; se non c’è un dato con maggiore frequenza si dice AMODALE (quando le frequenze sono uguali) NB: è l’unica che si può calcolare su scala nominale, basta osservare quante volte si ripete il dato, con quale frequenza. II. MEDIANA - Indice utilizzato su scala ordinale, è il centro della frequenza e di una distribuzione, divide la distribuzione in 2 parti uguali; La mediana è poco sensibile alle osservazioni esterne. - 1° step= ordinare i dati in modo crescente o decrescente (rango) Esempio: Età 19 20 25 30 40 43 48 1 2 3 4 5 6 7 Con i dati DISPARI Formula per la POSIZIONE della MEDIANA= —> in questo caso= (7+1)/2= 4 (posizione della mediana) Con i dati PARI Esempio: 10 12 14 17 20 25 Centro=15,5 che corrisponde a * 1 2 3 * 4 5 6 POSIZIONE della MEDIANA= (6+1)/2= 3,5 Mediana dei dati= somma dei dati/2= (14+17)/2= 31/2= 15,5 (n + 1)/2 10 mediana= valore centrale III. MEDIA Ci da più informazioni di tutti gli indici di tendenza centrale, rappresenta il baricentro di una distribuzione di dati, si fa la somma di tutte le unità presenti in n e si divide per n. Σ x/ n E’ molto influenzata dagli estremi LE PROPRIETÀ DELLA MEDIA: 1. La media è sempre compresa tra un valore massimo e un valore minimo di una certa distribuzione di dati 2. Se trasliamo, cambiamo, modifichiamo i valori di una distribuzione in modo lineare, anche il valore della media traslerà cambiando la costante (criterio di traslazione) 3. Lo SCARTO dalla MEDIA: distanza dalla media, qualcosa che va tolto Come si ottiene? Si prende un valore/punteggio singolo e ad esso si sottrae la media= x-M Esempio: 8 10 12 M= 10 Scarto= 8-10= -2 10-10= 0 12-10= 2 La somma degli scarti dalla media vale sempre 0. 4. La sommatoria degli scarti dalla media elevati al quadrato è sempre minore rispetto alla sommatoria degli scarti elevati al quadrato di un valore diverso dalla media Esempio: 10 20 M= 15 Scarto= 10-15= -5 20-15= 5 —> elevati al quadrato= 25+25= 50 LE CURVE DI GAUSS Posso creare un ISTOGRAMMA sul quale costruire una curva GAUSSIANA per rappresentare la media, questa curva può essere simmetrica o asimmetrica. - SIMMETRICA: a forma di campana, le distribuzioni normali sono simmetriche, l'altezza della curva rappresenta la frequenza e la frequenza più elevata è al centro. Proprietà: - È unimodale - Moda, mediana e media sono congruenti e ricadranno nel picco della nostra curva - E’ simmetrica rispetto la media (+ informativo) - E’ infinita 11 - La curva è ASINTOTICA (la curva si avvicina sempre più all'asse delle x ma non lo toccherà mai) - L’area al di sotto della curva vale l'intero cioè 1 , più il punteggio è lontano meno è frequente. INDICE DI CURTOSI= analisi della distanza, serve a capire come deve essere la curva e indica l’altezza della curva e la pesantezza delle code. Curtosi > 0 la curva è LEPTOCURTICA, Curtosi= 0 è NORMOCURTICA, Curtosi < 0 la curva è PLATICURTICA. - ASIMMETRICA:quando la mediana e la media non coincidono Nel caso in cui la media>mediana la curva sarà positiva/destra Nel caso in cui la media<mediana la curva sarà negativa/sinistra MODULO 6- INDICI DI DISPERSIONE La dispersione analizza quanto i dati tendono a distanziarsi dall’indice di tendenza centrale di riferimento. SCALA NOMINALE Non avendo dei numeri non si studia la dispersione ma l’eterogeneità ossia quanto i dati sono differenti fra loro. —> Eterogeneità= verificare quanto i dati sono diversi dalla moda SCALA ORDINALE Indici di posizione: 1. Rango= posizione che un valore occupa all’interno di una distribuzione di dati 2. Quantile= divisione di dati in parti uguali (esistono i terzile, quartili, quintili, decili, percentili) Esempio: Posizione Quantile= (n+1)*J/K J= quartile richiesto K= numero di parti 12 1 5 7 10 13 17 20 1 2 3 4 5 6 7 3. DEVIAZIONE STANDARD= s —> è la radice quadrata della varianza Esempio: Varianza= 14 (quadratica) Deviazione standard= √14= 3,74 —> Definizione: indica quanto in media i dati si disperdono attorno alla media —> questi tre indici si chiamano ASSOLUTI perché sono sempre positivi NB: c’è un solo caso in cui la deviazione standard è uguale a 0, cioè quando i valori sono tutti uguali Esiste anche un indice di dispersione relativo che assume i risultati tra 0 e 1, serve a comprendere quanto è forte la dispersione nella distribuzione e si calcola s/media. —> nella regola della traslazione la media varia ma la deviazione standard non cambierà mai. GRAFICO Esempio: QI 100±15 1= 115 2= 130 3=145 -1= 85 -2= 70 -3= 55 —> più alta è la curva e più i valori sono frequenti, nella media REGOLA EMPIRICA DEL CASO: tra -1s e 1s ricade sempre il 68% dei dati tra -2s e 2s ricade sempre il 95% dei dati tra -3s e 3s ricade sempre il 99% dei dati. (Per questo se un dato ricade -2s e 2s è pericoloso. Dal 95% al 100% manca il 5%, che suddiviso su i due lati è 2,5%, la probabilità che esca del dato è estremamente bassa ecco perché risulta un rischio). 15 —> COEFFICIENTE DI VARIAZIONE= viene utilizzato per capire quanto è forte la dispersione in una determinata distribuzione Formula: Deviazione Standard/ Media NB: in una traslazione cambia la media ma non la deviazione standard LA STANDARDIZZAZIONE La standardizzazione è una procedura statistica che permette il confronto tra punteggi di due test differenti con il fine di unirli sulla scala standardizzata appunto per dare “un senso” ai dati. Questo processo serve a capire dove si colloca il punteggio al di sotto della curva e quanto distante risulta dalla media, per capire se è pericoloso o meno. Serve a capire a quante deviazioni standard rispetto alla media si trova il punteggio. Per poter calcolare la standardizzazione abbiamo bisogno di due parametri di riferimento: media e deviazione standard. Formula: Z= (x1-x)/ deviazione standard x1= punteggio grezzo x= media Esempio: QI 100±15 A=90 E=64 —> sono punteggi grezzi che hanno significato solo se comparati con 100±15 Z90= (90-100)/15= -10/15= 0,75 —> non è pericoloso perché è vicino alla media. Z64= (64-100)/15= -36/15= 2,4 —> si trova a meno due deviazioni standard e mezzo quindi risulta pericoloso e va verificato attraverso nuovi test. NB: I punteggi z sono sempre positivi quando il punteggio grezzo è maggiore della media, sono sempre negativi quando il punteggio grezzo è minore rispetto alla media e sono sempre uguali a zero quando il punteggio grezzo coincide con la media. PROPRIETA’ - La media dei punteggi Z è sempre uguale a 0 - Varianza e deviazione standard= 1 CRITICITA’ - Il punteggio può risultare negativo e molto piccolo, risulta quindi difficile e brutto da comunicare 16 —> per risolvere questo problema: si migliora la comunicabilità dei risultati trasformando i punteggi Z in punteggi T, che a differenza di quelli Z sono sempre positivi Come si ottengono? —> trasformando la media in 50 e la deviazione standard in 10 La formula sarebbe M+σ⋅z ; si può calcolare però attraverso la sottrazione o l’addizione in maniera molto più semplice sommando σ e togliendo le deviazioni standard dalla media. La scala t parte da 10 e arriva a 90, contiene il 99% dei dati. Abbiamo la variabile x ha m=10 e σ=2. Quale valore t si trova a z=-2? Risposta t6. Perché da 10 andiamo indietro di 2 σ 17 Regola della somma P(aUb)= Pa+Pb Regola della somma P(aUb)= Pa+Pb- (a ∩ b) Gli eventi congiunti sono quegli eventi che possono verificarsi entrambi , possono essere dipendenti o indipendenti. Per calcolare gli eventi congiunti si fa la regola del prodotto P(a ∩ b) = Pa x Pb Es: la possibilità di avere un figlio maschio 1/2, al secondo parto è sempre 1/2, quindi su due parti è 1/4 ma non sono dipendenti. Nella tombola la possibilità di estrarre il 17 è 1/90 , pesco il primo numero ed esce il 12, ora la possibilità è 1/89 quindi 1/90 x 1/89. Ho una scatola di 30 palloncini 10 rossi, 10 blu e 10 verdi. Ne voglio prendere o uno rosso o uno blu , 10/30+10/30 =evento disgiunto Ne voglio prendere uno rosso e uno blu , 10/30 x 10/29 = evento congiunto. Fai attenzione un evento congiunto non vuol dire che sia mutuamente escludentesi. 20 Seguendola regola della somma teoricamente dovrei fare 3+4 / 6 ma 7 è maggiore rispetto all’intero. Come è possibile? Considero solo una volta i risultati che si ripetono 4 6 3 5 2 21
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved