Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

Tecniche di ricerca sociale, analisi monovariara e bivariata, Sintesi del corso di Metodologia E Tecniche Di Ricerca Sociale

hanno preso tutti voti alti, sono molto semplici con tutto ciò che serve per passare l'esame

Tipologia: Sintesi del corso

2022/2023

In vendita dal 01/07/2024

daniela-oliva-19
daniela-oliva-19 🇮🇹

5 documenti

1 / 20

Toggle sidebar

Documenti correlati


Anteprima parziale del testo

Scarica Tecniche di ricerca sociale, analisi monovariara e bivariata e più Sintesi del corso in PDF di Metodologia E Tecniche Di Ricerca Sociale solo su Docsity! ANALISI BIVARIATA ..CONTINUO SLIDE 14.. Frequenza= numero dei dati di una modalità su una variabile Distribuzione di frequenza= elenco ordinato di tutte le modalità di una variabile Possono esserci vari tipi di relazione fra 2 variabili: UNI-DIREZIONALE (A -→ B) BI-DIREZIONALE ASIMMETRICO (A influenza B più di quanto B influenza A) BI-DIREZIONALE SIMMETRICO (A e B si influenzano reciprocamente) Se la relazione è diretta o indiretta lo stabiliamo dalla matrice, quindi ci affidiamo all’esperienza del ricercatore. Per stabilirlo statisticamente ricorriamo all’analisi trivariata con l’aggiunta di una variabile di controllo (t). Nella ricerca sociale non possiamo stabilire la direzione della relazione ma possiamo ipotizzarla. La relazione fra 2 variabili si interpreta e analizza con: 1. Tabella di contingenza e rappresentazioni grafiche; 2. Indici e coefficienti. SLIDE 15 TABELLA DI CONTINGENZA Una tabella di contingenza è costituita da righe e colonne, ciascuna corrisponde ad una delle due variabili cui si intende analizzare la relazione, nelle celle sono riportate le frequenze delle 2 variabili. Le cifre dei marginali della tabella di contingenza si dicono MARGINALI DI RIGA e MARGINALI DI COLONNA. Per poter leggere una tabella di contingenza bisogna PERCENTUALIZZARE Per poter stabilire se c’è relazione fra 2 variabili categoriali bisogna METTERE IN PERCENTUALE la variabile che si ritiene indipendente: si prendono i valori assoluti della variabile che consideriamo indipendente e li dividiamo per il totale della modalità indipendente che stiamo considerando. ( VALORI ASSOLUTI/TOTALE DELLE MODALITA’) - Se consideriamo la variabile X indipendente e che influenza Y allora dovremmo PERCENTUALIZZARE IN COLONNA - Se consideriamo Y indipendente che influenza X allora PERCENTUALIZZIAMO IN RIGA Per interpretare meglio il dato qual ora avessimo variabili categoriali ordinate possiamo farlo utilizzando: - L’INDICE DI DIFFERENZA PERCENTUALE ➢ Se lo scarto è ampio significa che i casi si concentrano nelle categorie estreme ➢ Se lo scarto è ridotto significa che i casi si concentrano nelle categorie centrali Come si fa? Xi/Xf (valore assoluto iniziale/valore assoluto finale) Le 4 info delle celle in tabelle di contingenza sono 4 tipi di frequenze: Quantifica l’influenza della variabile indipendente (di riga) su quella dipendente (di colonna). Si comporta bene: quando i MARGINALI sono EQUILIBRATI e quando una diagonale ha le celle semi-vuote; oppure quando i marginali sono squilibrati ma nessuna cella è semi-vuota. L’ODDS è un rapporto di PROBABILITA’, una VALUTAZIONE IN TERMINI PROBABILISTICI, serve se vogliamo calcolare la relazione fra VARIABILE CATEGORIALE CON + DI 2 MODALITA’ e una VARIABILE DICOTOMICA Si utilizza ODDS perché: - Non può essere attribuito segno alla relazione - Non si ricorre a nessun coefficiente delle dicotomiche Vantaggi: consente di confrontare senza ricorrere alle percentuali • ESISTE RELAZIONE tra variabili se le probabilità che abbiamo rilevato sono diverse fra loro; viceversa se le probabilità fossero state uguali non ci sarebbe stata relazione: - ETEROGENEITA’: (probabilità diverse) ci fa capire che c’è relazione; - OMOGENEITA’: (probabilità uguali) non c’è relazione Se si vuole rappresentare graficamente utilizziamo: - DIAGRAMMA A NASTRI: riporta il valore degli odds - DIAGRAMMA A DOPPIA BANDIERA: v. categoriale+odds Gli ODDS rappresentano il rapporto tra la probabilità che un soggetto estratto a caso appartenga o non appartenga alla variabile considerata. SLIDE 17. RELAZIONE FRA 2 VARIABILI CATEGORIALI – CHI QUADRO Quando si descrive la relazione fra: - 2 categoriali non ordinate - 1 categoriale ordinata e una non ordinata È necessario che: 1. Le frequenze fra le categorie siano equilibrate 2. Le categorie non devono essere troppo numerose altrimenti crea squilibrio e un alto rischio di celle vuote. RELAZIONE FRA 2 VARIABILI CATEGORIALI NON ORDINATE I COEFFICIENTI che andremo ad analizzare si basano su LA FEQUENZA ATTESA, cioè la frequenza che avremo in caso di indipendenza tra le modalità. Serve per confrontare una SITUAZIONE ATTESA TEORICA (ideale) in caso di indipendenza, con la FREQUENZA OSSERVATA. Dal confronto di queste due frequenze DOBBIAMO STABILIRE SE C’E’ O NON C’E’ ASSOCIAZIONE. SE LA FREQUENZA ATTESA E QUELLA OSSERVATA SONO UGUALI SIGNIFICA CHE L’ASSOCIAZIONE NON C’E’ (=indipendenza). Come si calcola? Moltiplico il valore marginale di riga con il marginale di colonna diviso il numero dei casi ( marginale di riga+marginale di colonna/ N) ➢ Per stabilire se c’è relazione calcoliamo la differenza tra F.OSSERVATA e F.ATTESA. Se c’è indipendenza assoluta le due frequenze coincidono e la differenza sarà pari a 0. F.osservata – F.attesa = CONTINGENZA Questo ci servirà per calcolare il CHI-QUADRO…… Il CHI-QUADRO = χ2 Calcoliamo le contingenze per le rispettive frequenze attese, la sommatoria di ogni cella ci darà come risultato il x2 Formula: contingenza2 / frequenza assoluta = X2 È un test che si utilizza per sapere se c’è relazione tra due variabili categoriali non ordinate. È un test di: - Associazione - Significatività: rileva solo la significatività statistica di una tabella di contingenza Lo scopo del test del X2 è quello di stabilire se le frequenze osservate differiscono da quelle attese. Prova a stabilire la probabilità che due variabili siano associate. Caratteristiche: ➢ Non rileva la forza dell’associazione tra le due variabili ➢ Non ha un range di variazione ➢ Il valore ottenuto è direttamente proporzionale al N (n casi) Per vedere se c’è significatività statistica dobbiamo verificare che il valore assunto da X2 non sia frutto di un errore; se invece è affidabile, quanto lo è? Si fa un TEST DI SIGNIFICATIVITA’ 1. Stabiliamo il grado di certezza che vogliamo avere. (quanto voglio essere sicura del mio calcolo). Es. 95%, lascio margine di errore del 5% 2. Ci calcoliamo i gradi di libertà (GL): il margine di oscillazione di un errore a livello probabilistico è una tabella già impostata. Lc= COPPIE APPAIATE: coppia di casi presenta lo stesso valore su X e/o su Y.  assenza di cograduazione. → Il calcolo di coppie concordanti, discordanti e appaiate ci danno la misura di quando le variabili sono associate. →tale tecnica può essere utilizzata quando le 2 variabili producono una tabella con poche celle. Dopo aver effettuato il calcolo si passa ai coefficienti: COEFFICIENTE GAMMA DI GOODMAN E KRUSAL Sintetizza la relazione tra due variabili categoriali ordinate, applicabile sono alla tabella di contingenza 2X2 si basa sul confronto tra coppie GRADUATE (P) e coppie CONTRO- GRADUATE (Q). è definito come la probabilità (somma) che qualsiasi coppia di casi estratta a caso sia concordante, meno la probabilità (somma) che sia discordante. Formula: quantifica il grado di associazione tra X e Y varia tra 0 e 1 1= associazione perfetta positiva 0= assenza di associazione -1= associazione perfetta negativa LIMITI: non considera le coppie appaiate e questo lo porta a sovrastimare la forza dell’associazione. Sovrastima perché è un coefficiente bi-direzionale, risente del N di modalità delle variabili (K); all’aumentare del n° delle modalità aumenta il valore del coefficiente Gamma. Sulla base di questi difetti sono stati creati altri coefficienti Bi-direzionali: di KENDALL 1. TAU Q= si utilizza per tabelle quadrate Formula: 2(P-Q)/N(N-1) 2. TAU R= si utilizza per le tabelle rettangolari Formula: 2 x min x (P-Q)/ N2 (min-1) Min= numero minore tra il totale delle righe e il totale delle colonne In questo modo è come se il rettangolo diventasse quadrato Ha normalizzato il n° di categorie. La differenza fra Gamma e questi due coefficiente risiede nel modo in cui essi normalizzano. Anche questi coefficienti però non tengono presente le COPPIE APPAIATE, quindi non risolve il problema di sovrastimare la relazione. Questo problema viene risolto dal Coefficiente D di Sommers. È un coefficiente uni-direzionale, infatti lo dobbiamo utilizzare se una delle due variabili è indipendente. Formula: Dxy= P-Q/P+G+Lc (lc sono le coppie appaiate) COEFFICIENTE RHO di Spearman: viene utilizzato quando vogliamo confrontare variabili categoriali ordinate prodotte dalle Tecniche di Scaling con più di 11 modalità (es. termometro dei sentimenti). Il soggetto si posiziona lungo un continuum che produrrà variabili categoriali ordinate. Rileva il grado di accordo fra graduatorie compilate da individui diversi. Limiti: risente dei valori estremi. Per variabili categoriali ordinate che vogliamo mettere a confronto utilizziamo: - Grafico a colonne suddivise - Spezzata a gradini - Istogramma di composizione SLIDE 19. ANOVA, RELAZIONE FRA VARIABILI CATEGORIALI E CARDINALI Per porre in relazione una variabile cardinale (dipendente) e una variabile categoriale (indipendente) si ricorre all’analisi della VARIANZA→ANOVA. Prevede l’analisi monovariata dei valori caratteristici di una variabile cardinale entro le modalità di una variabile categoriale. Un’ipotesi nulla prevede che: - I dati di un gruppo abbiano la stessa origine; - Le differenze osservate fra i gruppi siano dovute solo dal caso. • CARATTERISTICHE ANOVA: per applicare Anova è necessario che: 1. Il ricercatore abbia le idee chiare circa la struttura del disegno di ricerca e sulle variabili da includere nell’analisi (ipotizzando che la v. categoriale influenza la cardinale). 2. Sia possibile stabilire quale sia la variabile dipendente e quale quella indipendente. • FASI per valutare l’associazione: 1. Suddividere l’insieme dei casi (creare dei gruppi); 2. Calcolare la media delle cardinali (in ciascun gruppo); ALTRE FORME DI RAPPRESENTAZIONE GRAFICHE: - Diagramma a barre - Grafico a colonne - Alberelli SLIDE 20-21. DIAGRAMMA DI DISPERSIONE/ RELAZIONE FRA 2 VARIABILI CARDINALI. La relazione di due variabili cardinali si rappresenta mediate il “DIAGRAMMA DI DISPERSIONE”, e ci si ricorre quando le grandezze poste sull’asse X e sull’asse delle Y sono grandezze MISURATE CON SCALE METRICHE (discrete o continue). VIENE UTILIZZATO PER: 1. Rappresentare due grandezze che possono essere correlate fra loro; 2. Individuare eventuali relazioni tra 2 caratteristiche diverse di una popolazione. La posizione di un soggetto si presenta con 1 puntino; cioè la posizione di un individuo su entrambe le variabili. L’insieme dei casi crea una “nuvola di puntini” Valori anomali (outlier): discostano molto dalla media agendo negativamente sui valori che questa può assumere. Si considera solo il 1° quadrante 2° 1° 3° 4° - In ascissa si rappresentano i valori delle variabili indipendenti (x), in ordinata i valori della variabile dipendente (y) - Ogni asse è una variabile - Ogni puntino è un caso • LA RELAZIONE FRA DUE VARIABILI CARDINALI PUO’ ESSERE: - MONOTONICA/NON MONOTONICA: MONOTONICA= La variabile per aumentare in modo proporzionale rispetto alla variabile Y, la distanza che intercorre fra loro non è uguale ma percorrono la stessa direzione. - LINEARE/NON LINERARE: LINEARE= Incremento proporzionale costante, è lineare quando aumentano con lo stesso incremento. Sulla base di questi due principi abbiamo 6 TIPI DI RELAZIONI: 1= RELAZIONE MONOTONICA LINEARE: al crescere di Y cresce X in modo costante, incremento proporzionale. 2= RELAZIONE MONOTONICA LINEARE INVERSA: al crescere di X decresce Y, in modo costante, decremento proporzionale. 3= RELAZIONE MONOTONICA NON LINEARE: cresce X e cresce anche Y ma non in modo costante. 4= RELAZIONE MONOTONICA NON LINEARE INVERSA: decresce X e decresce Y non in modo costante. 5= RELAZIONE CURVILINEA NON MONOTONICA: cresce X e cresce Y, fin quando Y non inizia a decrescere. 6= ASSENZA DI RELAZIONE. • RETTA DI REGRESSIONE: possiamo immaginarla se c’è linearità ➔ Se la relazione è lineare, tutti i punti coincidono con la retta e avremo RELAZIONE PERFETTA. Es. ➔ Se la relazione non è lineare i punti non coincidono sulla retta Es. ei= RESIDUI/ERRORI= più è ampia la distanza, più siamo distanti da una perfetta associazione. • ANALISI DEI RESIDUI: quando la situazione non è lineare si riscontrano errori, cioè RESIDUI RESIDUO= distanza fra valore effettivo di Y e un valore atteso di Y (valore di Y se la relazione fosse lineare, ovvero se ci fosse relazione tra X e Y) ei= Yi – Y- (cioè valore effettivo-valore atteso) • E’ POSSIBILE SERVIRSI ANCHE DI COEFFICIENTI (oltre il diagramma di dispersione) individuati grazie alla “RETTA DI REGRESSIONE” Y^ i = +/- a +/-b b= coefficiente di regressione (angolare) che determina l’inclinazione della retta a= intercetta, indica il valore di Y
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved