Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

Principi di inferenza statistica, Sbobinature di Psicometria

I principi di inferenza statistica, ovvero l'insieme di metodi basati sulla teoria della probabilità per condurre a conclusioni plausibili sulla variabile casuale associata ad una particolare caratteristica di una popolazione. Vengono descritte la teoria della stima di parametri e la teoria della verifica di ipotesi, con particolare attenzione ai test statistici e alle regole decisionali. Viene inoltre introdotta la teoria della misura di affidabilità o attendibilità. una panoramica generale del tema, ma non approfondisce particolari tecniche o applicazioni pratiche.

Tipologia: Sbobinature

2020/2021

In vendita dal 30/11/2023

semola_
semola_ 🇮🇹

4.6

(17)

13 documenti

Anteprima parziale del testo

Scarica Principi di inferenza statistica e più Sbobinature in PDF di Psicometria solo su Docsity! PRINCIPI DI INFERENZA STATISTICA  È un insieme di metodi, basati sulla teoria della probabilità, atti a condurre lo sperimentatore a conclusioni plausibili sulla variabile casuale associata ad una particolare caratteristica di una popolazione, rilevata mediante l’osservazione di un campione di elementi della popolazione stessa. Essa include 1. La teoria della stima di parametri 2. La teoria della verifica di ipotesi STIMA DI PARAMETRI  Uno stimatore (t) è una funzione dei valori osservati sul campione t(X1, X2,…,Xn), utilizzato per la stima di un parametro θ (incognito) di una popolazione. Importante è ricordare che il parametro si riferisce all’intera popolazione, mentre lo stimatore solo al campione considerato e in quanto tale è variabile  Stima puntuale o ottimale = metodo di stima che conduce ad un unico valore per il parametro in oggetto, ovvero il valore più probabile del parametro all’interno della popolazione  Stima intervallare = il metodo di stima conduce ad un intervallo di valori, all’interno dei quali si suppone che si trovi con una certa probabilità il valore vero del parametro VERIFICA DI IPOTESI  Un’ipotesi statistica è una asserzione o supposizione sulla distribuzione di una o più variabili casuali.  Si mettono a confronto due ipotesi, espresse in modo tale da essere contrarie:  H0 è l’ipotesi che costituisce l’oggetto della verifica; specifica i valori dei parametri della popolazione da cui si suppone provenga il campione (o i campioni) in esame. o Stabilisce che i valori ottenuti nel campione sono puramente casuali. o H0: θ = θ0, dove θ è il valore della popolazione e θ0 è il valore che ci si attende  Ha è l’ipotesi alternativa, secondo la quale i risultati ottenuti non sono casuali ma sono spiegabili secondo una qualche regola o teoria. o Può essere bidirezionale (Ha: θ ≠ θ0) o monodirezionale (Ha: θ <> θ0) TEST STATISTICI E REGOLE DECISIONALI  È una verifica campionaria che può assumere valori compresi in un particolare insieme, che costituisce lo spazio campionario del test, secondo una determinata distribuzione di probabilità.  Ogni test statistico divide lo spazio campionario in due sottoinsiemi complementari: la regione di accettazione di H regione di accettazione di H0 e la regione di rifiuto di H0. In base alla regione in cui andrà a cadere il valore campionario t, si prenderà una decisione sull’ipotesi H 0. Dal punto di vista decisionale, la suddivisione dello spazio campionario porta a quattro soluzioni possibili:  Errori 1. All’errore di primo tipo di primo tipo si attribuisce un valore piccolo fissato a priori. α rappresenta la probabilità di respingere l’ipotesi H0 quando è vera. 2. La probabilità dell’errore di secondo tipo errore di secondo tipo non viene fissata a priori ma dipende da α e dal valore del parametro θ; il valore β rappresenta la probabilità di non respingere l’ipotesi H0 quando è falsa.  Dato un campione di numerosità n, se α diminuisce β aumenta e viceversa.  1- β è la potenza del test, ovvero la probabilità di accettare l’ipotesi alternativa quando questa è vera. È quindi la probabilità, ad esempio di dire che un trattamento è efficace quando effettivamente lo è. Se è bassa al contrario non possiamo essere sicuri che l’ipotesi alternativa sia corretta. Si può calcolare a priori per comprendere se la ricerca è valida e quindi c’è una buona probabilità di avere un buon risultato.  Tipi di test 1. Test ad una coda: il valore del parametro θ è minore o maggiore di un valore specificato. H: θ <> θ0 2. Test a due code: il valore del parametro θ è interno o esterno ad un intervallo delimitato da due valori specificati. H: θ1< θ< θ2 o H: θ < θ1; θ > θ2 LA TEORIA DELLA MISURA AFFIDABILITA’ O ATTENDIBILITA’ O RELIABILITY  Attendibilità:  Più in generale è il grado in cui una misura è libera da errore di misura  Tecnicamente è la proporzione di variabilità della misurazione che è effettivamente riferibile a reali differenze tra i soggetti sottoposti a misurazione e non a errori dello strumento di misura o Quindi le differenze tra i soggetti sono reali e non dipendono da errori casuali nella misurazione o Misura precisione della misura e quindi l’oscillazione delle risposte rispetto alla media o deviazione standard o Quanto più valutiamo diversi aspetti dello stesso costrutto con diversi item, minore sarà l’affidabilità, ma così avremo maggiore validità.  In particolare, è il grado in cui misure effettuate su soggetti (pazienti) che non sono cambiati nel tempo risultano stabili sotto diversi punti di vista. Ad esempio:  utilizzando differenti insiemi di item appartenenti allo stesso strumento (consistenza interna);  a distanza di tempo (affidabilità test-retest);  ottenuti da persone differenti nella stessa occasione (inter-rater/accordo tra giudici);  ottenuti dalle stesse persone nella stessa occasione (intra-rater).  Ogni misura può essere concepita come il risultato della seguente formula: X=V+E, dove X è la misura che si ottiene sommando la componente di Errore (E) alla Componente Vera della misura (V)  Una misura, per essere adeguata, dovrebbe minimizzare la proporzione relativa all’Errore di misura, cioè il rapporto ρ=VV+E dovrebbe essere il più vicino possibile a 1. RIPASSO SCALE  Le scale possono essere divise in numeriche e categoriali.  Quando misuriamo creiamo un legame funzionale tra un numero o quantità e una etichetta. Nelle scale nominali queste etichette non sono altro che una rappresentazione di un gruppo di persone, quindi ci permette di dire se due persone sono uguali o diversi perché appartengono allo stesso gruppo o meno.  La scala ordinale permette di introdurre un ordine di grandezza o priorità nelle etichette, quindi ci permette di misurare la relazione maggiore, minore o uguale.  La scala a intervalli permette di confrontare le differenze tra quantità, mentre quella a rapporti si differenzia in quanto confronta i rapporti tra misure. Un’altra differenza fondamentale è che la scala a rapporti ha lo zero assoluto  La trasformazione permissibile è una trasformazione dell’insieme numerico in un altro insieme numerico secondo alcune regola che vanno a mantenere integre le caratteristiche delle relazioni empiriche che sussistono tra gli elementi che abbiamo misurato.  Noi possiamo passare da un tipo di scala ad un’altra quando si mantiene inalterata la qualità della misurazione.  In una scala a rapporti è permessa solo la moltiplicazione per una costante, la quale varia solo l’unità di misura.  In una scala a intervalli si ragiona sulla differenza tra distanze, quindi le uniche trasformazioni permesse sono l’addizione di costanti e le moltiplicazioni di costanti. Nel primo caso si ridefinisce l’origine della scala, mentre nel secondo caso l’unità di misura. ERRORE DI MISURA VALIDITÀ DI CONTENUTO  Validità di contenuto: grado in cui il contenuto di uno strumento riflette in maniera adeguata il costrutto che si propone di misurare. Misura in che modo gli item formulati rispecchiano tutte le sfaccettature del costrutto che vogliamo misurare.  Validità di facciata: grado in cui (gli item di) uno strumento riflette (riflettono) in maniera adeguata il costrutto che si propone di misurare. Infatti certi item potrebbero misurare un costrutto ma potrebbe non essere chiaro cosa vuole misurare. È un sottoinsieme della validità di contenuto  Un’alta validità di facciata è pericoloso perché è come fare un colloquio clinico, mentre avere una bassa validità di facciata stressa il partecipante e bisognerebbe rendere esplicito lo scopo.  Non sempre le persone rispondono agli item in modo onesto (sia consapevolmente per diffidenza che non consapevolmente per compiacere lo sperimentatore), motivo per cui si creano degli item overt e covert che permettono di misurare quanto il soggetto stia dicendo la verità anziché far finta di apparire in maniera differente. Tale obiettivo è raggiungibile anche con le scale lie, ovviamente porta a una bassa validità di facciata  A differenza del BF che è uno strumento di origine fattoriale, il MMPI ha una struttura di costruzione di tipo criteriale, ovvero usa item che misurino le caratteristiche tipiche di una malattia mentale. MMPI ha una bassa validità di facciata  Requisiti 1. Gli item devono cogliere aspetti rilevanti del costrutto che ci si propone di misurare. 2. Il costrutto deve essere rappresentato in maniera esaustiva dagli item, cioè gli item devono essere un campione rappresentativo del dominio totale; ovvero rappresentare tutte le sfaccettature del costrutto misurato. Inoltre gli item dedicati a un certo aspetto del costrutto deve essere proporzionale alla rilevanza che esso ha rispetto agli altri 3. Gli item devono essere comprensibili dalla persona che deve essere valutata (linguaggio comprensibile) 4. Gli item devono essere accettabili per la persona che deve essere valutata (es: diversa cultura di provenienza).  Requisiti generali che consentono di valutare la validità di contenuto 1. Descrizione del costrutto che ci si propone di valutare; 2. Descrizione della popolazione target; 3. Descrizione dell’obiettivo di misurazione sotteso al questionario; ad esempio, discriminativo, valutativo, predittivo; 4. Descrizione degli item; 5. Descrizione del processo di sviluppo dello strumento; cioè la fonte da cui sono stati tratti gli item (ad esempio pazienti, letteratura); la selezione degli item; i criteri utilizzati per la riduzione degli item; 6. Descrizione del numero di valori mancanti per ciascun item: gli item senza risposta che potrebbero dipendere dalla mancata comprensione, dall’ambiguità degli stessi in base all’interpretazione o dalla non accettabilità nello rispondere 7. Descrizione degli effetti “pavimento” e “soffitto”, quando la distribuzione dei punteggi è platicurtica o leptocurtica. Ogni strumento quindi deve essere usato in base alla finestra ideale o specificità del campione a cui è indirizzata VALIDITÀ DI COSTRUTTO  Grado in cui i punteggi di uno strumento sono coerenti con le ipotesi (ad esempio, relativamente alle associazioni interne (tra sottoscale), alle associazioni coi punteggi di altri questionari, o a differenze tra gruppi rilevanti), sulla base dell’assunto che lo strumento misura in maniera valida il costrutto che si propone di misurare  Verifica il grado di coerenza tra il test e quello che vogliamo misurare  Permette di affermare la coerenza tra misura ottenuta e quello che vogliamo misurare attraverso una serie di ipotesi a priori che verifichiamo attraverso diverse techinche.  Analizza e considera se c’è un legame tra il costrutto specifico e quelli correlati e se ci sono differenze tra i sottogruppi della popolazione che possiamo ritenere importanti.  L’analisi fattoriale permette di misurare la dimensionalità dello strumento, ovvero valutare se effettivamente il test misura più costrutti, se questi sono correlati (obliquità) o sono ortogonali.  Requisiti 1. Quando la validità di costrutto viene valutata per mezzo di ipotesi, tali ipotesi devono essere formulate a priori (cioè, prima della raccolta dati); 2. Quando si valutano validità convergente e divergente (= due dimensioni sono correlate o meno), le ipotesi devono riguardare le associazioni tra i punteggi derivati dallo strumento e i punteggi ottenuti da altri strumenti; 3. Quando si valuta la validità discriminante, le ipotesi devono riguardare le differenze in termini di media o mediana dei punteggi ottenuti allo strumento da (sotto)gruppi differenti di individui; 4. La direzione e la forza assoluta o relativa delle correlazioni o delle differenze tra medie che ci si aspetta di osservare devono essere incluse nelle ipotesi. o A priori dovremmo dire cosa ci aspettiamo: correlazione più o meno forte e la direzione (diretta o inversa) VALIDITÀ STRUTTURALE  Grado in cui i punteggi di uno strumento rifle6ono in maniera adeguata la dimensionalità del costrutto che ci si propone di misurare  Tecniche di cluster analysis: ci permette di osservare se gli item si raggruppano in cluster omogenei  Network analysis: permette di osservare come gli item del questionario si raggruppano e se effettivamente il contenuto dei sottogruppi è coerente con le nostre aspettative VALIDITÀ CROSS-CULTURALE  Grado in cui il funzionamento degli item di uno strumento, tradotto o riadattato a livello culturale, riflette in maniera adeguata il funzionamento degli item inclusi nella versione originale dello stesso strumento  Lo strumento deve essere in grado di portare lo stesso risultato aspettato all’interno di altri contesti culturali, ovvero deve resistere dal punto di vista psicometrico  Requisiti 1. E’ necessario considerare il risultato finale del processo di traduzione e ada6amento dello strumento, anziché il processo in sé. o Per avere una buona traduzione è necessario che il traduttore abbia familiarità con la psicologia e usi un linguaggio adattato alla popolazione di riferimento. Ovviamente serve un madrelingua della lingua di arrivo che abbia una buona conoscenza della lingua di partenza. o Back version = riprendere il questionario tradotto e farlo tradurre nuovamente nella versione di origine da parte di qualcuno che non conosce il questionario. L’ideale sarebbe ottenere lo stesso questionario, ma la traduzione non è mai uguale. In questo caso si osservano e si modificano gli- item che non corrispondono tra le due traduzioni o La traduzione deve tener conto della cultura di arrivo: ad esempio gli item devono essere inclusivi e positivi. Inoltre è importante considerare il cambiamento culturale per facilitare la comprensione e ricevere la risposta che ci si aspetta. (es hockey-calcio) 2. Tuttavia, può essere utile o necessario disporre di alcune informazioni riguardanti il processo, al fine di poter valutare accuratamente il risultato. Pertanto, è consigliato descrivere le informazioni inerenti il processo di traduzione all’inizio del questionario. VALIDITÀ DI CRITERIO  Grado in cui i punteggi di un questionario riflettono in maniera adeguata un “gold standard”  Il riferimento si riferisce al fatto che i punteggi del questionario corrispondano a quelli che ci si aspetterebbe se avessimo usato questo riferimento  Verifichiamo lo strumento tramite un riferimento oggettivo  Può essere un criterio da testare nell’immediato o a posteriori, lontano nel tempo. RESPONSIVENESS  Responsiveness: grado in cui uno strumento è in grado di rilevare dei cambiamenti nel costrutto che si propone di misurare  È tipica di quegli strumenti che vogliono valutare l’esito di uno strumento riabilitativo. Quindi su strumenti che sono in grado di dare info su modifiche su deficit cognitivi  Necessitano quindi di studi longitudinali che operano sul lungo termine  Validità longitudinale: grado in cui l’interpretazione dei cambiamenti nei punteggi di uno strumento rifle6e in maniera adeguata i cambiamenti nel costrutto che ci si propone di misurare  Responsiveness di costrutto: grado in cui i cambiamenti nei punteggi in uno strumento sono coerenti alle ipotesi (per esempio, rispe6o alla relazione con i cambiamenti nei punteggi di altri strumenti, o differenze tra gruppi nei cambiamenti osservati), in base all’assunto che lo strumento misura in maniera valida il costru6o che si propone di misurare  Responsiveness di criterio: grado in cui i cambiamenti nei punteggi o6enu- a uno strumento rifle6ono in maniera adeguata il cambiamento in una misura “gold standard” INTERPRETABILITÀ  Grado in cui è possibile attribuire un significato qualitativo (ad esempio, interpretazioni cliniche) ai punteggi quantitativi ottenuti in un questionario o al cambiamento in tali punteggi  Disegni cross-sectional (trasversali) = studio di partecipanti a età diverse contemporaneamente. Limiti: effetto coorte, ovvero si confrontano popolazioni nate e cresciute in contesti completamente diversi.  Disegni longitudinali = studio i partecipanti nel tempo. Limiti: o Mortalità (perdita di pp) o Costi o Tempistiche  Bisogna tener distinti i punteggi numerici dal loro stesso significato clinico. Infatti solo alcune variazioni hanno un significato dal punto di vista clinico. Spesso per definire se un risultato è importante si usano dei cut-off.  Questi sono valori di comodo che massimizzano la possibilità di evitare falsi positivi e negativi e di dire se effettivamente c’è una variazione o una condizione importante dal punto di vista clinico ANALISI DEL CAMPIONE  Quando si valutano le proprietà di una misura, i risultati dipendono dal campione in cui si ottengono i punteggi. Pertanto, è di fondamentale importanza essere a conoscenza della tipologia (clinica o non clinica) dei soggetti coinvolti.  È importante dal punto di vista di validità esterna: capacità di poter generalizzare le conclusioni a popolazioni differenti  Descrizione del campione nel quale viene valutato lo strumento:  Ad esempio in una tabella 2✕2 dove due operatori OPa e OPb devono indicare la presenza “1” o l’assenza “0” di una serie di sintomi in un paziente si avrà la seguente situazione:  AO0 indica il fatto che entrambi i giudici non hanno rilevato la caratteristica, AO1 che l’hanno rilevata e 01 e 10 che c’è discordanza  Si nota che la k di Cohen mette in evidenza se e quanto la concordanza è presente traducendolo in un indicatore statistico che si può riportare sotto ipotesi nulla alla distribuzione chi quadrato per poter dare un valore più preciso al nostro giudizio finale sulla fedeltà  Dalla tabella delle frequenze osservate è possibile passare a quella delle frequenze attese attraverso le formule seguenti: A A0=¿TO PaO׿TOPbO ¿ N e A A1=¿T O Pa1× ¿TOPb 1 ¿ N  Dalla prima tabella (frequenze osservate) è possibile ricavare un primo indice detto “indice di concordanza” (IC) che si ottiene attraverso la seguente formula: IC= A O0+AO1 N  Dalle informazioni contenute nelle due tabelle è possibile ricavare l’indice K che può essere calcolato applicando la seguente formula: K= ( AO0+AO1 )−( A A0+A A1 ) N− (A A0+A A1 )  Naturalmente è possibile estendere la precedente formula a casi in cui siano presenti più livelli di risposta K di Cohen K DI COHEN: INTERPRETAZIONE  Non si può affermare che esistano linee guida universali per l’interpretazione dell’indice K come scarso, buono, ottimo. Diversi autori hanno proposto differenti soluzioni.  Seppure diverse nella forma tali linee guida appaiono uniformi nella sostanza attribuendo in linea generale le seguenti categorie interpretative: STATISTICA SUL SOGGETTO SINGOLO: IL TEST C  Il Test C (Von Neumann, 1941; Caracciolo, Larcan &Camma, 1986) consente di valutare il livello di inclinazione delle curve nelle singole fasi di un esperimento. Principalmente tale test consente di valutare se il trend di un set di misurazioni sia stazionario o segua una direzione (in aumento o in diminuzione). Il Test C si applica su una serie di misurazioni (almeno 8) condotte su SOGGETTO SINGOLO. Il test misura la probabilità con cui i punti di una serie temporale siano disposti a caso. Se tale probabilità appare essere inferiore ad un valore critico (arbitrariamente fissato) si conclude che esiste un trend significativo.  Al fine di valutare la significatività del valore osservato per il Test C occorre far riferimento alla distribuzione normale attraverso la statistica Z. Al fine di calcolare il punto Z corrispondente al valore di C calcolato occorre prima ricavare l’errore standard di C attraverso la seguente formula:  Il punto Z è infine ottenibile dividendo il valore di C per il suo errore standard:  Il valore critico di Z con α=0.05 è 1.64, mentre con α=0.01 è 2.17. Valori di Z calcolato superiori al cut-off stabilito indicano un trend significativo. IL TEST C: NOTA BENE  Occorre notare che il valore osservato del Test C può essere solo positivo.  In altre parole, sia che il trend sia crescente o decrescente il valore del test sarà sempre positivo.  Ciò porta ad una ulteriore evidenza ossia che sarebbe sbagliato affermare che se il Test C presenta un valore significativo esso non potrebbe essere definito come “significativamente crescente” o “significativamente decrescente”.  Nonostante ciò, essendo che il test può assumere solo valori positivi, il livello di significatività da individuare (lo Z critico) è quello relativo ad una ipotesi monodirezionale destra piuttosto che bidirezionale.  Da un punto di vista interpretativo si può affermare che un trend è significativo oppure no, l’analisi grafica può suggerire in forma descrittiva l’andamento del trend (che comunque ci si aspetta segua la direzione ipotizzata teoricamente). IL MODELLO SPERIMENTALE MANIPOLAZIONE E CONTROLLO DELLE VARIABILI  La variabile o fattore è una variabile categoriale, ovvero di una scala nominale. Quando si svolge un esercizio di identificazione di variabili, i fattori si chiamano con le lettere dell’alfabeto maiuscole (A, B, C...). si segnala per prima la VD e poi i fattori in ordine, prima i between e poi i within, i quali sono annidati al loro interno. Inoltre il disegno può essere definito anche tramite i livelli delle variabili (es: disegno 2 x 3 x 3).  Le variabili indipendenti: sono variabili che non dipendono da altre variabili e vengono controllate e manipolate dallo sperimentatore. Si ipotizza che queste variabili producano degli effetti di influenzamento o cambiamento  Le variabili dipendenti: sono variabili che dipendono da altre variabili, ossia dalle variabili indipendenti, cioè si ipotizza che subiscano degli effetti dalle variabili indipendenti. In una ricerca, solitamente le variabili dipendenti sono le risposte dei soggetti e quindi ci permettono di valutare gli effetti che le variabili indipendenti hanno sui soggetti  Ci sono variabili indipendenti che possono essere manipolate dallo sperimentatore (per esempio “tipo di trattamento”); altre variabili non possono essere manipolate dallo sperimentatore (per esempio il genere, l’età).  Le variabili indipendenti, per poter essere manipolate, devono essere operazionalizzate, cioè devono essere tradotte in precise definizioni concrete. Manipolazione e controllo delle variabili  Si possono manipolare direttamente i valori della variabile indipendente (per esempio: numero di volte che si presenta un determinato stimolo)  Si possono manipolare indirettamente i valori della variabile indipendente (per esempio: categorizzare i valori della variabile indipendente)  Un ulteriore modo per manipolare una variabile indipendente consiste nel variare le istruzioni date ai partecipanti  Anche per le variabili dipendenti è fondamentale l’operazionalizzazione: queste variabili devono essere tradotte in definizioni operative per poter essere utilizzate  Qualunque sia lo strumento che utilizziamo per rilevare la variabile dipendente, esso deve rappresentare sempre e solo la caratteristica che si vuole misurare CONDIZIONE SPERIMENTALE  Quando si conduce un esperimento, la prima cosa che bisogna fare riguarda le condizioni sperimentali: bisogna decidere quanti e quali saranno i livelli della variabile indipendente.  Ogni variazione nel livello della variabile indipendente crea una condizione sperimentale. Una variazione crea due condizioni, due variazioni creano tre variazioni, ecc.  Quando si conduce un esperimento si devono avere almeno due condizioni sperimentali, cioè almeno una variazione della variabile indipendente (esempio: trattamento vs non trattamento).  Quando decidiamo le condizioni sperimentali, vige il principio di parsimonia: bisogna riuscire a ridurre le condizioni sperimentali al minimo indispensabile per poter verificare le ipotesi.  La variabile indipendente può anche essere chiamata fattore e si considereranno i suoi livelli.  Esempio – Film violento: Vogliamo verificare la seguente ipotesi: “la visione di un film violento produce nei bambini un aumento dell’aggressività”  Il primo modo in cui potremmo agire è misurare solo il livello di aggressivita che rileviamo a seguito della visione del film. Ma per avere un disegno sperimentale necessitiamo di un gruppo di controllo, ovvero un gruppo che nel nostro caso verà un film neutro. In questo caso saremmo sicuri che l’effetto osservato dipende dalla manipolazione della condizione sperimentale: possiamo definire una relazioen causa-effetto tra la manipolazione e i risultati. ESEMPIO:  Ricerca con Ansia come variabile dipendente, si considerano coppie di gemelli che vivono in tre aree geografiche con culture diverse.  Il disegno è di tipo misto:  Fattore A: fratello 1 e fratello 2, 2 livelli, within (in quanto si richiedono a tutti, è come se avessimo due fratelli e li dividessimo per età). Quando riusciamo a costruire una relazione tra i livelli allora la misura è within.  Fattore B: aree geografiche, 3 livelli, between ESEMPIO 2:  10 soggetti fanno due trattamenti, intervento A e B, fatti su gruppi di soggetti diversi.  La VD è l’ansia  Fattore A: intervento A o B, 2 livelli, between  Fattore B: tempo o misurazione pre e post trattamento, 2 livelli, within  Tipo di disegno 2X2 misto ESEMPIO 3  Trattamento A e B sono stati fatti da due terapeuti diversi (Mario e Sara), si vuole misurare l’effetto del terapeuta. Un gruppo fa il trattamento A con Mario, uno B con Mario, uno A con Sara e uno B con Sara.  VD = ansia  Fattore A = Sara o Mario, 2 livelli, between  Fattore B = A o B, 2 livelli, between  Fattore C = tempo misurazione pre e post, 2 livelli, within  Il tipo di disegno è 2X2X2 misto. ESEMPIO 4  Trattamento A e B sono stati fatti dallo stesso terapeuta e entrambi vengono somministrati al gruppo. Le misurazioni pre e post avvengono prima e dopo entrambi gli interventi.  VD = ansia  Fattore A = trattamento A e B, 2 livelli, within  Fattore B = tempo misurazione pre e post, 2 livelli, within  Disegno 2X2 a misure ripetute  Limiti: 1. Effetto sequenza, dovuto al fatto che il trattamento precedente può influenzare il seguente. Di solito, infatti si fa in modo di dividere i due interventi da un lungo periodo di tempo chiamato periodo di washout. 2. Effetto ordine: il trattamento somministrato dopo può avere effetti diversi rispetto al somministrarlo da solo. La stessa cosa vale per il primo trattamento. Si potrebbero avere due gruppi e invertire l’ordine de trattamenti nel secondo gruppo, complicando il disegno, infatti si aggiunge un fattore chiamato ordine con due livelli e between. I DISEGNI SPERIMENTALI E IL CONTROLLO PROCEDURE DI CONTROLLO  Scopo essenziale della metodologia sperimentale è tenere sotto controllo le variabili intervenienti o «di disturbo» che possono generare errori rispetto alle deduzioni tratte a partire dai dati osservati e ridurre la validità di un esperimento  E’ necessario distinguere due significati del concetto di controllo: l’esperimento di controllo e il controllo sperimentale  Campionamenti non probabilistici: gli elementi della popolazione non hanno la stessa probabilità di essere estratti per far parte del campione. Quando si effettua un campionamento non probabilistico è possibile incorrere in un errore sistematico («bias») che può distorcere i risultati ottenuti. Il bias più frequente, quando si esegue campioni non probabilistici, consiste nella scelta dei soggetti più facilmente reperibili e quindi non avere più un campione rappresentativo. o Campioni di comodo: non permettono di trarre conclusioni che possono essere estese a tutta la popolazione  Campionamento casuale: gli elementi del campione vengono estratti in maniera del tutto casuale, con la garanzia che ogni componente (o elemento) della popolazione abbia la stessa probabilità di estrazione. Affinché tale campionamento sia attendibile è necessario che il campione abbia una numerosità che oscilla tra il 5% e il 10% della popolazione.  Campionamento casuale stratificato: prima di eseguire il campionamento, si suddivide la popolazione in sottopopolazioni o raggruppamenti (clusters, definiti in italiano anche grappoli), in base ad una o più variabili di rilievo per l’indagine, poi si estraggono in maniera casuale gli elementi del campione da tali raggruppamenti (o starti). In questo modo si garantisce una maggiore rappresentatività nel processo di costruzione nel campione rispetto alle variabili misurate.  Svantaggi: una variabile che usiamo per il processo potrebbe legarsi a una variabile correlata con l’esito dell’esperimento STRATEGIE SPECIFICHE DI CONTROLLO: ASSEGNAZIONE DEI SOGGETTI ALLE CONDIZIONI SPERIMENTALI  La seconda strategia di controllo specifico nella ricerca è l’assegnazione dei soggetti alle condizioni sperimentali. Quando si conduce un esperimento, si possono manipolare una o più variabili indipendenti e si hanno almeno due gruppi di soggetti: sperimentale e di controllo; per controllare l’effetto di possibili variabili di disturbo, diventa fondamentale il modo in cui i soggetti vengono assegnati a questi gruppi.  Possiamo parlare di disegno sperimentale SOLO quando c’è un gruppo di controllo e l’assegnazione è avvenuta tramite randomizzazione. Questi inoltre permettono di minimizzare le ipotesi alternative.  In questo modo dovremmo avere ragionevole fiducia che i due gruppi siano omogenei  Il metodo elettivo è quello dell’assegnazione casuale, o randomizzata. Ossia ogni elemento del campione ha la stessa probabilità di far parte del gruppo di controllo o del gruppo sperimentale. Questo metodo consente di neutralizzare, facendoli incidere allo stesso modo nei gruppi, i possibili effetti delle variabili di disturbo.  Quando l’assegnazione casuale dei soggetti non è possibile o non è agevole, si può procedere con il metodo del pareggiamento dei soggetti nei gruppi, che consiste nel rendere i gruppi simili rispetto alla variabile da controllare. Il pareggiamento può essere utilizzato per rendere equivalenti due gruppi da sottoporre a trattamento  Un particolare tipo di pareggiamento è l’appaiamento («matching»): uno a uno dei soggetti che abbiano le stesse caratteristiche rispetto alle variabili da controllare.  In base al tipo di VI possiamo avere disegni di ricerca differenti 1. Si hanno disegni di ricerca in cui due gruppi omogenei tra loro sono sottoposti a condizioni diverse: questo tipo di controllo avviene fra i gruppi (between groups). I disegni solo between sono detti disegni fattoriali. 2. Si hanno altri disegni di ricerca il cui controllo sulle variabili di disturbo avviene all’interno del gruppo stesso (within group), cioè quando si considerano gli stessi soggetti prima e dopo un trattamento, ovvero quando si utilizzano i soggetti come controllo di se stessi. I disegni solo within sono detti, disegni a misure ripetute.  La terza strategia di controllo specifico nella ricerca è il controllo degli effetti di ordine e sequenza. Quando usiamo i soggetti come controllo di loro stessi, possiamo incorrere a degli inconvenienti: visto che i soggetti devono ripetere, in condizioni diverse, le prove relative alla variabile dipendente, può crearsi una situazione di apprendimento. Oltre a questo effetto che possiamo definire di ordine o di pratica, può crearsi un effetto di sequenza e di contrasto, ovvero una prova eseguita per prima può influenzare quella eseguita successivamente.  Una soluzione per controllare questi effetti è rappresentata dal controbilanciamento, che consiste nel bilanciare l’ordine delle condizioni in modo che quella che è presentata per prima alla metà dei soggetti sia presentata per seconda all’altra metà. DISEGNI MONOFATTORIALI  I disegni monofattoriali sono quei disegni che hanno una sola variabile indipendente o «fattore» che agisce tra i gruppi (ogni gruppo viene sottoposto ad una sola condizione sperimentale) o entro i gruppi (ogni gruppo viene sottoposto a tutte le condizioni sperimentali, per questo vengono definiti anche disegni a misure ripetute)  Un classico disegno sperimentale tra i gruppi prevede una sola variabile indipendente con due livelli (gruppo sperimentale – gruppo di controllo). Si possono avere delle variabili indipendenti con più di due livelli. In questo caso, se utilizziamo un disegno sperimentale tra i gruppi, abbiamo bisogno di tanti gruppi quanti sono i livelli della variabile indipendente (o condizioni sperimentali).  Nel disegno sperimentale entro il gruppo, tutti i soggetti sono sottoposti a tutte le condizioni sperimentali. Nel caso più semplice, abbiamo solo due livelli, per cui lo stesso gruppo viene sottoposto a entrambe le condizioni sperimentali; ma possiamo avere anche più di due livelli.  È molto usato nei disegni longitudinali DISEGNI MULTIFATTORIALI  I disegni multifattoriali si chiamano così perché si analizzano contemporaneamente più variabili indipendenti o fattori. Tramite questi disegni è possibile sia analizzare l’effetto principale di ogni variabile indipendente, sia l’interazione tra queste.  L’effetto principale indica l’effetto che una variabile indipendente ha sulla variabile dipendente a prescindere dagli effetti delle altre variabili indipendenti.  Si ha un’interazione quando l’effetto che una variabile indipendente ha sulla variabile dipendente non è lo stesso per tutti i livelli delle altre variabili indipendenti. Quindi si osserva come una variabile indipendente modula la risposta dell’altra. o Nel caso in cui non ci sia interazione il grafico è ben rappresentato da due segmenti paralleli dove la differenza tra i due gruppi riguardo una VI è costante o Un’interazione semplice è data dal fatto che una viabile indipendente incide di più nel punteggio di un gruppo piuttosto che di un altro. o L’interazione di cross over si ha invece quando i risultati dei due gruppi vanno in direzioni completamente opposte (grafico dove i segmenti si incrociano)  Un esempio di un disegno multifattoriale: disegno 2X2 ovvero un disegno con due variabili indipendenti, ognuna delle quali ha due livelli. In questo disegno sperimentale abbiamo quattro condizioni (A1B1, A2B1, A1B2, A2B2), date dalla combinazione dei due livelli delle due variabili indipendenti.  Se il disegno è entro i soggetti dobbiamo sottoporre lo stesso gruppo alle quattro condizioni. Se il disegno è tra i soggetti abbiamo bisogno di quattro gruppi (equivalenti) ognuno dei quali viene sottoposto ad una condizione.  Quando si può ipotizzare una correlazione tra le misurazioni (es. questionari) fatte dai diversi soggetti: ogni volta che le risposte dei pp sono accoppiate bisogna parlare di disegni entro i gruppi.  Ad esempio quando si misura il tono dell’umore nella madre e nel bambino. In questo caso si può ipotizzare una potenziale correlazione tra le due misurazioni fatte a due soggetti diversi  Oltre ai disegni tra e entro i soggetti, esisto anche i disegni misti, in cui una variabile è controllata tra i gruppi, e una entro i gruppi.  I disegni fattoriali diventano più complicati se abbiamo più di due variabili indipendenti o se ogni fattore ha più livelli. Per esempio un disegno 2X2X2 vuol dire che abbiamo tre variabili indipendenti, ciascuno a due livelli, quindi otto condizioni sperimentali; un disegno 2X3 vuol dire che si hanno due variabili indipendenti, la prima con due livelli, la seconda con tre, quindi sei condizioni sperimentali. I DISEGNI QUASI-SPERIMENTALI E LO STUDIO DEL SOGGETTO SINGOLO DISEGNI SPERIMENTALI  Principali caratteristiche:  Assegnazione casuale dei soggetti alle condizioni sperimentali  Completo controllo delle variabili in studio DISEGNO PRE-POST CON GRUPPO DI CONTROLLO  Disegno in cui ci sono i due gruppi, uno sperimentale che riceve il trattamento e quello di controllo o placebo. Entrambi vengono misurati prima e dopo l’intervento.  È un tipo di disegno misto (between l’intervento e within la misurazione pre e post)  Doppio cieco, indica un esperimento dove né i partecipanti né i somministratori sanno chi riceve l’intervento. DISEGNO PRE-POST DI TIPO SOLOMON  Disegno in cui ci sono due gruppi sperimentali e due controlli. Mentre tutti i gruppi fanno la misurazione posttest, solo un controllo e un gruppo sperimentale fanno anche il pretest.  Cerca di limitare la valutazione pretest, perché potrebbe influenzare la valutazione posttest e quindi la validità dell’esperimento. Ad esempio una valutazione psicologica iniziale potrebbe aumentare la consapevolezza dei sintomi da parte del paziente e potrebbe influenzare la VD.  Spesso, quindi si cerca di dilazionare il pretest e il trattamento  Ad esempio quando misuriamo un’abilità (ma anche uno stato psicologico), la valutazione al post- test sarà più alta del pretest MINACCE ALLA VALIDITÀ INTERNA  Influenzano e confondono il legame causa-effetto indagato. Le minacce sono elementi esterni che possono influenzare il risultato e portare a effetti non dipendenti dalla manipolazione sperimentale. Essi non sono controllabili e forniscono una spiegazione alternativa ai risultati. Sono le seguenti:  Lo strumento non misura adeguatamente il costrutto = gli item scelti misurano altri costrutti o non è adeguato dal punto di vista psicometrico  Contesto storico = eventi esterni concomitanti che influenzano gli esiti (es: traumi, lutti...)  Maturazione dei soggetti = crescita o sviluppo nell’infanzia, ma anche deterioramento di alcune funzioni negli anziani.  Testing = effetto di valutazione pretest sulla variabile dipendente  Regressione verso la media = le valutazioni estreme, in misurazioni successive tendono a tornare verso valori medi.  Bias di selezione = i gruppi sperimentali e di controllo non sono omogenei. Per questo motivo spesso una volta randomizzati i partecipanti nell’assegnazione ai gruppi si controlla la rappresentazione della categoria d’interesse. Ad esempio in un gruppo i soggetti possiedono delle abilità che li facilitano nella VD  Mortalità sperimentale = drop out o attrition rate, ovvero soggetti che abbandonano lo studio in corso d’opera. È comune negli studi longitudinali  Effetto ordine = fra trattamenti, stimoli...  Effetto sperimentatore, effetto soggetto: ovvero sapere di essere stati assegnati a un gruppo piuttosto che ad un altro o sapere chi fa parte di un gruppo piuttosto che ad un altro. STUDIO QUASI SPERIMENTALE  Non implica il fatto che la metodologia e il risultato non siano scientifici. Però rispetto a questa tipologia di studio quello sperimentale è quello che permette di minimizzare il più possibili le minacce. Lasciano però più spazio a spiegazioni alternative legate all’efficacia del trattamento (rapporto causale tra risultati e trattamento), e quindi il fatto che l’esito osservato dipenda dal trattamento fornito.  Dà la possibilità di far ricerca minimizzando il più possibile le minacce, ma senza fare uno studio sperimentale poiché non si possono rispecchiare le sue caratteristiche.  Infatti, non sempre le condizioni necessarie per la realizzazione di un disegno sperimentale sono verificate:  Calcolo test C per la fase A. L’intervallo di riferimento entro cui accettare l’ipotesi nulla secondo cui l’andamento è stazionario, è dato dai valori di Z è -1.96 e 1.96 che richiama IC al 95%. Quindi assumiamo che la parte di baseline sia stazionaria  Calcolo test C per la fase B. Essendo un valore di Z oltre 1.96, accettiamo l’ipotesi alternativa per cui non ci sia stazionarietà quando il trattamento ha avuto un effetto nel modificare il comportamento inappropriato (miglioramento)  Calcolo test C per la fase A’. Il valore finale ricade nella regione di accettazione dell’ipotesi nulla, quindi c’è stazionarietà. Esso in questo caso indica un mantenimento del miglioramento STRATEGIE ALTERNATIVE AI METODI SPERIMENTALI I METODI DESCRITTIVI: METODI NON SPERIMENTALI  I metodi descrittivi (non sperimentali) prevedono la descrizione del fenomeno in esame.  Il metodo descrive le variabili in esame, non prevede alcuna manipolazione della variabile indipendente né un controllo completo sulle variabili che possono intervenire nella ricerca modificandone i risultati. In questo senso è una ricerca tipicamente «esplorativa». Infatti viene fatta prima di fare un’ipotesi che possa essere trattata attraverso qualche metodo sperimentale o quasi sper.  La ricerca non sperimentale viene definita anche correlazionale, poiché valuta la relazione esistente tra i livelli di più variabili. La correlazione però implica la stima del grado in cui due variabili covariano e non dell’influenzamento di una sull’altra.  In questi tipi di disegni, il rapporto causale può essere inferito per via logica, ovvero in base a specifiche ipotesi sulla natura delle variabili in gioco.  Due sono i limiti principali della ricerca non sperimentale: il primo limite riguarda l’impossibilità di stabilire chiare relazioni causa-effetto; il secondo limite è che non si può escludere l’intervento di altre variabili sovraordinate capaci di influenzare i risultati ottenuti. ALCUNE TIPOLOGIE DI RICERCHE NON SPERIMENTALI  La ricerca d’archivio : consiste nell’analisi di dati raccolti da altre persone, diverse dal ricercatore, e in altri momenti, che non sono quello della ricerca. Tali dati esistono a prescindere della ricerca che si vuole condurre e, nella maggior parte dei casi, sono conservati in registri o archivi pubblici.  Il ricercatore si limita a scegliere ed esaminare, con metodi descrittivi e correlazionali, i dati di interesse.  La ricerca d’archivio ha il vantaggio di poter essere utilizzata quando, per motivi sia pratici sia etici, non è possibile l’utilizzo di altre metodologie, come per esempio qualora volessimo studiare un fenomeno accaduto nel passato.  Per quanto riguarda i limiti della ricerca d’archivio, questi riguardano i dati che sono contenuti negli archivi. Infatti si può condurre una buona ricerca se le informazioni di cui si ha bisogno esistono in quantità e tipologia adeguata. Un ulteriore limite è l’incertezza della qualità della metodologia usata negli esperimenti considerati.  Possiamo mettere assieme i risultati di più articoli, una delle metodiche più usate è la review: ovvero il fatto di riprendere e mettere assieme i concetti fondamentali presi da più articoli, cercando anche i fattori in comune  L’osservazione naturalistica : in generale può essere definita come una tecnica di rilevazione del comportamento che consiste nel «guardare» cosa succede a particolari soggetti, in una data situazione. Nell’osservazione naturalistica il soggetto viene osservato nel suo ambiente naturale, senza essere disturbato dal processo di osservazione, ovvero si osserva il comportamento del soggetto (ci si nasconde) senza interferire con esso e senza manipolare alcuna variabile. Quando il ricercatore non può (o non vuole) nascondere la propria presenza, si può ricorrere all’osservazione partecipante, in cui il ricercatore entra nella scena da osservare senza, comunque, interferire con essa. In questo caso, il ricercatore deve rendere la propria presenza quanto più familiare possibile per i soggetti da osservare.  L’osservazione naturalistica ha il principale vantaggio di rispettare la naturalità del comportamento; tuttavia ciò costituisce anche uno dei suoi limiti, poiché con questo metodo non si è in grado di individuare le cause di un comportamento.  L’osservazione naturalistica, per essere valida, deve attenersi ad alcune regole fondamentali:  sistematicità con cui si osserva il comportamento: il ricercatore deve scegliere solo quelle interazioni comportamentali che ritiene più inerenti le proprie ipotesi;  registrazione del comportamento (videocamera, carta e matita, ecc.): la registrazione deve riguardare sempre i dati e mai le deduzioni;  questioni etiche relative all’osservazione naturalistica: bisogna avere il consenso informato, cioè i partecipanti devono conoscere la natura della ricerca e acconsentire a partecipare.  L’inchiesta : è una particolare forma di raccolta «guidata» dei dati, in essa le risposte vengono sollecitate mediante stimoli scritti cui le persone devono rispondere. L’inchiesta è una tecnica che ha lo scopo di conoscere opinioni, atteggiamenti, comportamenti, stili di vita di una data popolazione. Essa consiste nel porre un insieme ordinato di domande (attraverso l’intervista diretta, l’intervista telefonica, ecc.) relative all’argomento in esame ad un campione rappresentativo della popolazione.  Inchiesta longitudinale: sono inchieste che vengono effettuate in periodi di tempo lunghi. Lo scopo dell’inchiesta longitudinale è verificare se avvengono dei cambiamenti della variabile di interesse nel campione in esame. In questo caso si intervista ripetutamente lo stesso campione di soggetti.  Inchiesta trasversale: sono inchieste che hanno lo stesso fine dell’inchiesta longitudinale, l’unica differenza tra le due è che in quest’ultima si prendono in considerazione gruppi diversi di soggetti.  Studi longitudinali e trasversali : entrambi hanno lo scopo di analizzare cambiamenti che avvengono con il trascorrere del tempo.  Nello studio longitudinale (studio di panel) si seleziona un gruppo di individui che viene poi analizzato ad intervalli di tempo regolari;  Nello studio trasversale (studio di trend) si selezionano più gruppi, con diversi livelli d’età, in cui si analizzano i cambiamenti della stessa caratteristica.  Gli studi longitudinali presentano alcuni limiti: un primo limite consiste nel possibile abbandono dei soggetti, un secondo limite è rappresentato dal fatto che nel tempo qualcosa può interferire con la ricerca stessa, modificandone i risultati. Inoltre è costoso in termini di tempo e soldi.  Gli studi trasversali hanno il limite dell’effetto della coorte di età; infatti questi studi analizzando gruppi di individui di età diversa, che hanno avuto esperienze diverse, forniscono dati che spesso non sono confrontabili tra loro.  Lo studio di casi singoli : è un caso particolare di ricerca longitudinale di uno studio intensivo e prolungato nel tempo di un singolo caso. E’ una metodologia di ricerca che consiste nell’analizzare, in maniera intensiva, il comportamento di una singola persona. Gli studi sui casi singoli vengono utilizzati quando il caso da studiare è raro o unico e hanno il vantaggio di fornire una descrizione profonda ed accurata del caso in esame. Il loro limite consiste proprio nell’eccezionalità del caso, sul fatto, dunque, che i risultati che si ottengono sono difficilmente generalizzabili. I QUASI-ESPERIMENTI  Nei quasi-esperimenti chi conduce la ricerca non ha un controllo completo di tutte le variabili. Nei quasi- esperimenti non è possibile assegnare casualmente i soggetti alle varie condizioni sperimentali, ma solo selezionarli in base a raggruppamenti già esistenti.  I quasi-esperimenti sono anche chiamati «ex post facto» (dopo il fatto), perché la ricerca avviene dopo che i gruppi si sono formati in base a dei criteri che non è stato il ricercatore a decidere.  Disegni con gruppo di controllo non equivalente: Si ricorre a questo disegno quando non è possibile avere a disposizione due gruppi di soggetti equivalenti, perché è difficile trovare un gruppo di controllo realmente equivalente al gruppo sperimentale. In questi disegni, dal momento che manca l’assegnazione casuale dei soggetti, per verificare l’equivalenza dei gruppi è necessario formare il gruppo di controllo facendo in modo che sia più simile possibile al gruppo sperimentale.  Dobbiamo avere un gruppo di controllo e un di riferimento che vengono organizzati sulla base di un processo di randomizzazione, senza quest’ultima si parla di un disegno quasi sperimentale Studiamo l’interazione tra il fattore gruppo e il fattore tempo. I possibili esiti sono:  Grafico 1: i due gruppi partono dalla stessa baseline, ma nel post-test si osservano punteggi più alti nel gruppo sperimentale. Il suo cambiamento potrebbe essere dovuto al trattamento.  Grafico 2: mentre il gruppo si controllo non ha subito cambiamenti, il gruppo sperimentale che partiva da una baseline più bassa, osservano risultati maggiori nei post-test.  Grafico 3: entrambi i gruppi partono dalla stessa baseline e al post-test mostrano entrambi un incremento nella prestazione: forse perché il trattamento non ha portato al cambiamento, ma a una variabile interveniente (es: passare del tempo).  Grafico 4: i due gruppi partono da una baseline diversa, ma mostrano lo stesso cambiamento al post-test, quindi il trattamento non ha portato, al miglioramento, bensì una variabile interveniente.  Grafico 5: i gruppi partono da due baseline diverse e non mostrano miglioramenti al post-test.  Grafico 6:il gruppo sperimentale parte da una baseline più bassa e ha un miglioramento notevole al post-test. Mentre il gruppo di controllo non mostra miglioramenti. Quindi il trattamento è efficace a far aumentare i punteggi del gruppo di controllo deficitario quasi ai livelli della normalità  Questi confronti si fanno con l’analisi della varianza Analisi di covarianza = da un lato abbiamo due fattori e dall’altro variabili continue. Se abbiamo una variabile indipendente continua e una categoriale, mettendole assieme potremmo considerare come info della variabile continua il punteggio che i singoli hanno al pretest e poi si osserva òa differenza al post test. Così questa differenza viene spogliata della differenza dovuta al punteggio di baseline e ci aiuta ad analizzare il punteggio al post-test tenendo conto del fatto che potrebbero esserci delle differenze al pretest. Il valore di pretest viene quindi messo come covariata  Disegni con regressione discontinua: Ci sono casi in cui è il ricercatore a voler valutare l’effetto del trattamento su due gruppi già diversi in partenza. Il presupposto dei disegni con regressione discontinua è che vi sia una correlazione fra i risultati precedenti e quelli successivi al trattamento.  Si rileva una variabile in un gruppo di soggetti (per esempio l’ansia) (prima rilevazione).  Successivamente si creano due gruppi: il primo (gruppo sperimentale) costituito dai soggetti che hanno riportato un punteggio alto; il secondo (gruppo di controllo) costituito dai soggetti che hanno riportato un punteggio medio-basso.  Sottoponiamo il gruppo sperimentale ad un trattamento e al termine della quale, rileviamo nuovamente la variabile nei due gruppi.  Il presupposto è che vi sia una correlazione tra i valori della variabile tra la prima e la seconda rilevazione per tutti i soggetti.  A questo punto si calcola la retta di regressione relativa al livello della variabile sia per i soggetti del gruppo di controllo che sperimentale.  Disegni senza gruppo di controllo e serie temporale: Si tratta di un disegno con un solo gruppo, in cui si rileva la variabile dipendente (Y) più volte sia prima che dopo il trattamento(X). Lo scopo delle rilevazioni ripetute è quello di aumentare la validità interna del disegno, considerando la tendenza dei dati, piuttosto proprio per l’eccezionalità del caso, sul fatto che i risultati che si ottengono sono difficilmente generalizzabili.  La caratteristica principale dello studio di casi singoli è che si esaminano singoli esempi o meglio casi di un fenomeno. I pre-esperimenti I pre-esperimenti  Spesso si hanno validi motivi pratici ed etici che ci impediscono di considerare un gruppo di soggetti (campione rappresentativo) negli esperimenti.  A volte l’esperimento ha scarsa significatività clinica anche se ha grossa significatività statistica.  Ogni volta che si considera una media dei dati per molti soggetti vi è la possibilità che il quadro generale dia una rappresentazione distorta del comportamento dei singoli individui ANALISI DELLA VARIANZA  L’analisi della varianza (ANOVA, Analysis of Variance) è una tecnica di analisi dei dati che consente di verificare ipotesi relative a differenze tra le medie di due o più popolazioni.  È una generalizzazione del t-test che appunta valuta il fatto che medie prese da popolazioni diverse siano diverse o meno  L’analisi della varianza è una tecnica statistica di tipo parametrico:  si assume che la variabile di interesse si distribuisca normalmente nella popolazione e che i campioni siano estratti in maniera casuale dalla popolazione;  la numerosità campionaria è rilevante;  nel confronto tra più campioni le varianze devono essere omogenee.  È possibile classificare i diversi modelli di ANOVA in base al numero di variabili indipendenti e dipendenti:  i modelli che prevedono una sola variabile indipendente vengono definiti disegni a una via: una variabile dipendente e una variabile indipendente categorica con due o più livelli (= fattore);  i modelli che prevedono due o più variabili indipendenti vengono definiti disegni fattoriali;  i modelli che prevedono una sola variabile dipendente definiscono un’analisi della varianza univariata;  i modelli che prevedono due o più variabili dipendenti definiscono un’analisi della varianza multivariata (o MANOVA, Multivariate Analysis of Variance) I TIPI DI VARIABILE INDIPENDENTE  Le variabili di tipo fattore vengono classificate a seconda dell’indipendenza o della dipendenza delle osservazioni fra i livelli.  Possiamo così avere fattori comunemente chiamati “between subjects” (tra i soggetti) e “within subjects” (entro i soggetti). La differenza è la stessa che passa tra i gruppi come sono considerati nel t-test per campioni indipendenti e nel t-test per campioni dipendenti.  Un fattore “between subjects” è una variabile i cui livelli raggruppano delle osservazioni provenienti da unità statistiche differenti. Un esempio può essere il "sesso", fattore a due livelli ("maschio" e "femmina").  Un fattore “within subjects” è una variabile i cui livelli raggruppano delle osservazioni provenienti dalle stesse unità statistiche. In questo caso si includono anche misure ce potrebbero essere considerate non indipendenti, le cui misure sono fatte su individui diversi (es. fratelli). Per esempio, il fattore Tempo è “within”  Son definiti anche studi a misura ripetuta perché riguardano più misure fatte sugli stessi soggetti IL MODELLO TEORICO DELL’ANOVA  Nel modello teorico più classico dell’ANOVA (“tra i soggetti”) il punteggio y ij di un soggetto j nel gruppo i è così scomponibile: Alpha indica l’appartenenza a un livello piuttosto che un altro L’ipotesi è che l’errore si distribuisca in maniera normale, con media uguale a 0, e il sigma indichi la grandezza dell’errore FINALITA’ DELL’ ANALISI DELLA VARIANZA  Si testano un’ipotesi nulla che riguarda il fatto che le medie tra i gruppi siano uguali e l’ipotesi alternativa secondo cui almeno due medie differiscono tra di loro, ovvero una è diversa dalle altre.  L'analisi della varianza esamina la variabilità totale dei dati mediante una sottile scomposizione in variabilità tra i gruppi (che è la variabilità sperimentale in quanto dovuta alle variabili introdotte dallo sperimentatore) e variabilità nei gruppi (dovuta a variabili difficilmente controllabili).  È, pertanto, un procedimento statistico che da una risposta alla seguente domanda: “La variabilità tra i gruppi, rispetto a quella nei gruppi, è talmente grande da giustificare l'inferenza che le medie delle popolazioni, di cui sono campioni, sono del tutto differenti? ”  Pertanto, al fine di comprendere come si esegue un ANOVA, bisogna tenere bene in mente i concetti di Devianza e Varianza  Il computo riguarda il come si suddivide la varianza tra i valori nonostante si agisca anche tramite la devianza SCOMPOSIZIONE DELLA DEVIANZA  La devianza rappresenta la somma dei quadrati degli scostamenti tra ogni punteggio e la media. Da questo momento in avanti estenderemo quanto detto sul punteggio del singolo soggetto all’intero campione di riferimento.  I diversi tipi di devianza:  devianza totale (SST): è la somma dei quadrati (sum of squares) degli scarti (differenza tra i singoli punteggi e la media generale della variabile). Essa può essere espressa dalla somma tra la devianza tra i gruppo e quella entro i gruppi  devianza tra i gruppi (o between, SSB): è la somma dei quadrati degli scarti (differenza tra i punteggi medi di gruppo e la media generale), ovvero alla variabilità tra i diversi gruppi;  devianza entro i gruppi (o within, SSW): è la somma dei quadrati degli scarti tra i punteggi di ogni soggetto e la relativa media di gruppo, ovvero alla variabilità dei soggetti all’interno di ogni gruppo. GRADI DI LIBERTA’  Gradi di libertà: considerano il fatto che nella formula siano contenute determinate informazioni che ci permettano di trovare i dati di alcuni soggetti a partire da quelli conosciuti dagli altri. E’ importante togliere con la sottrazione perché l’informazione altrimenti sarebbe ridonante. Dove k è il numero di livelli della variabile considerata VARIANZE  Dividendo le devianze per i rispettivi gradi di libertà si ottengono le varianze:  Varianza totale (MST = mean of squares) = devianza totale / n–1;  Varianza tra i gruppi (MSB) = devianza tra i gruppi / k–1;  Varianza entro i gruppi (MSW) = devianza entro i gruppi / n–k. IL RAPPORTO F  Il rapporto tra le varianze MSB / MSW segue la distribuzione F, quindi può essere utilizzato per esaminare ipotesi sulla significatività della differenza tra la variabilità dovuta al trattamento e quella residua  È una distribuzione asimmetrica, la cui asimmetria diminuisce man mano che aumentano i gradi di libertà. Si delinea la zona di accettazione dell’ipotesi nulla la quale, in quanto la distribuzione è asimmetrica si collocherà sulla coda a destra e si procederà confrontando quindi la distribuzione teorica con quella osserva, se il valore della distribuzione osservata supera il cutoff/alpha allora significa che c’è almeno una media diversa dalle altre  La F esamina le seguenti ipotesi:  H0: 1 = 2 = … = k  H1: almeno due  diverse ASSUNZIONI  Ci sono delle assunzioni che devono essere soddisfatte affinché i risultati dell’ANOVA possano essere interpretati in maniera affidabile:  gli errori (ij) devono seguire la distribuzione normale ed avere media uguale a 0;  la varianza degli errori ( ) deve essere uguale in ogni gruppo (condizione di omoschedasticità);  gli errori (ij) devono essere indipendenti;  gli effetti hanno una natura additiva: la variabile sperimentale «aggiunge» qualcosa alla condizione- base e lo fa in maniera «identica» per tutti i soggetti  Viene definita una tecnica robusta poiché anche se violate le assunzione ci dà risultati sufficientemente affidabili (è una tecnica parametrica). ANOVA UNIVARIATA: DISEGNI “TRA SOGGETTI” A UN SOLO FATTORE  Il modello teorico spiegato finora ha come esempio tipico il disegno tra i soggetti ad un solo fattore  Vengono definiti tra i soggetti, oppure per gruppi indipendenti, i disegni in cui ad ogni trattamento o condizione sperimentale corrisponde un diverso gruppo di soggetti. In ogni condizione ci sono soggetti diversi: un soggetto esposto a una condizione non viene esposto a nessun ’altra condizione. ANOVA UNIVARIATA: DISEGNI FATTORIALI  Vengono definiti fattoriali (o più vie) i disegni di analisi della varianza in cui vi sono due o più variabili indipendenti. Nei disegni fattoriali vengono esaminati gli effetti di due o più variabili indipendenti categoriali sulla variabile dipendente.  Il più semplice disegno è il «2 x 2», dove abbiamo due fattori ciascuno dei quali ha due differenti livelli.  Vantaggi dei disegni fattoriali:  consente lo studio dell’interazione. Cioè l’effetto congiunto delle VI sulla VD  aumenta la potenza del test, cioè la probabilità di rilevare la presenza di un effetto, quindi la probabilità di rifiutare l’ipotesi nulla quando essa è falsa o Accettare l’ipotesi alternativa quando questa è vera è una probabilità che può essere espressa con 1-  o come potenza del test o Ovvero maggiore probabilità di trovare un effetto, o che l’ipotesi alternativa sia vera non aumentando il numero di casi.  consente una maggiore economia nel numero dei soggetti da esaminare, mantenendo la stessa potenza del test. ANOVA UNIVARIATA: DISEGNI FATTORIALI EFFETTI PRINCIPALI E INTERAZIONI  Nei disegni fattoriali abbiamo due tipi di effetti: gli effetti principali e le interazioni.  L’effetto principale rappresenta l’effetto medio di una variabile indipendente sulla variabile dipendente, indipendentemente dai valori delle altre variabili indipendenti.  L’interazione rappresenta l’effetto di una variabile indipendente sulla variabile dipendente non è lo stesso per tutti i livelli delle altre variabili indipendenti  Se non c’è interazione assumiamo un effetto di tipo additivo, ovvero i due effetti si sommano nel definire la variabile dipendente (c’è parallelismo tra le variabili) DISEGNI FATTORIALI «TRA SOGGETTI» (BETWEEN SUBJECTS)  Nei disegni fattoriali «tra i soggetti» tutti i fattori sono fattori between subjects, ovvero i soggetti vengono assegnati ad ognuna delle singole celle, quindi ogni soggetto è esposto solamente ad una particolare combinazione delle condizioni sperimentali.  In questo caso la devianza totale (𝑆𝑆𝑇) si scompone in 4 parti:
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved