Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

Tecniche e modelli di analisi multivariata, Appunti di Metodologia Delle Scienze Sociali

tecniche e modelli utili nella ricerca sociale

Tipologia: Appunti

2020/2021

Caricato il 18/01/2021

Auroraalfe30
Auroraalfe30 🇮🇹

4.6

(5)

5 documenti

Anteprima parziale del testo

Scarica Tecniche e modelli di analisi multivariata e più Appunti in PDF di Metodologia Delle Scienze Sociali solo su Docsity! ANALISI MUTIVARIATA: da tre variabili in su, essa si può definire come un insieme di operazioni finalizzate al raggiungimento di almeno uno di questi obiettivi: 1) esplorazione del fenomeno oggetto di studio 2) Descrizione del fenomeno oggetto di studio 3) Sintesi classificazione delle informazioni che riguardano oggetto di studio 4) Spiegazione interpretazione e specificazione delle relazioni tra le variabili che si ritengono ipoteticamente connesse 5) previsione di stati futuri che riguardano il fenomeno in oggetto (molto ambizioso) TECNICHE: sono un procedimento di elaborazione e di analisi finalizzata al raggiungimento di un obiettivo acronimo des, descrivere, esplorare, sintetizzare. Essi svolgono il lavoro dell'investigatore che cerca il colpevole hanno una funzione esplorativa descrittiva. SCOPI E FUNZIONI DI TRE TECNICHE DI ANALISI MULTIVARIATA: A seconda delle variabili bisogna scegliere le procedure compatibili con quel tipo di variabile nell'analisi di dati; le procedure per le variabili cardinali sono più semplici di quelle per le categoriali, quando ho delle variabili cardinali e si studia la relazione non si parla di relazioni fra variabili ma la relazione fra le modalità di una e quelle di un’altra. Le variabili quasi-cardinali con la procedura di deflazione sono assimilati a variabili cardinali vere proprie 1) ANALISI IN COMPONENTI PRINCIPALI (ACP) 2) ANALISI DELLE CORRISPONDENZE MULTIPLE (ACM) 3) ANALISI DEI GRUPPI (ADG) DOMANDA A CUI SI DEVE RISPONDERE È COME, QUANDO E PERCHÈ ANALISI DELLE COMPONENTI PRINCIPALI (ACP) Si usa per le variabili cardinali e quasi cardinali la matrice usata è quella delle correlazioni (per ciascuna coppia di variabili si calcola il coefficiente di correlazione lineare che esiste tra queste due variabili), per fare una sintesi da insiemi variabili è necessario che vi sia più o meno correlazione se c'è correlazione c'è la varianza in comune l’ACP, e la quota di varianza in comune fra le variabili. ( la combinazione lineare è una somma ponderata) La sintesi la ottengo dalla matrice delle correlazioni estraendo un nuovo costrutto: le componenti principali, costrutto matematico che rappresenta una quota della varianza comune che c'è nella matrice delle correlazioni partenza, le componenti sono combinazione lineari di tutte le variabili, usate si possono estrarre tante componenti quante sono le variabili immesse nell’analisi. La varianza totale sarà pari al numero di variabili estraiamo una componente principale della prima variabile andiamo avanti così estrazione avviene una componente alla volta la prima è quella che ha il maggior numero di varianza, la seconda è quella che estrae il maggior numero di varianza sottratta la prima parte estratta. • Ha senso fare questo tipo di analisi quando le correlazioni non sono zero o non sono tutte uguali al valore massimo, in quanto l'obiettivo è quello di ridurre il numero di variabili tralasciando il superfluo. Si chiamano componenti principali perché fanno emergere la dimensione più importante della quota totale di partenza facendo perdere parte dell'informazione che possiamo considerare meno importante. È una scelta del ricercatore scegliere quale variabile usare, E con il programma di analisi dei dati otteniamo dei risultati a questa procedura. Usiamo degli appositi coefficienti per controllare ACP: -AUTOVALORE: È un numero che si associa la componente principale estratta rappresenta la quota di varianza riprodotta da ciascuna componente. -COMUNALITA: È un coefficiente che riguarda le variabile e il valore che ci fa capire il costo della sintesi che abbiamo fatto, può variare tra 0 ne 1 0 quando le prime componenti non riproducono la varianza 1 quando sia una riproduzione totale della varianza Mi fa capire quali variabili hanno ceduto più varianza, voglio sapere con questo coefficiente qual è la quota di varianza delle variabili riprodotta la componente principale che ho deciso di estrarre Pagina di 1 5 -PESO COMPONENZIALE (DEETTO AUTOVETTORE): esprime quanta quota di varianza è una variabile cede ad una componente, considero i pesi più alti in valore assoluto su ciascuna componente, considero le variabili che hanno contribuito di più e gli do un nome definendo la componente con un etichetta (posso usare la tecnica della rotazione per capire meglio quale nome dare quindi quale etichetta) Questi assumono valori standardizzati con media o e varianza 1, devono essere calcolati per ciascun caso della matrice dei dati. In conclusione dell'analisi aggiungo nella matrice dei dati è una nuova variabile che prende il nome di indice (in quanto solo una sintesi delle variabili di partenza) per ciascuna componente che si è deciso di conservare. Le componenti principali sono nuove variabili che chiamo variabili di secondo ordine in quanto sono frutto dell'elaborazione di altre variabili quelli di partenza. ANALISI DELLE COMPONENTI MULTIPLE (ACM) Si usa per le variabili categoriali e la trasposizione della ACP per queste variabili, in questo caso i nuovi costrutti prendono il nome di fattori, la matrice usata è quella di Burt anche detta corrispondenze multiple (Dove i numeri inseriti sono frequenze assolute o frequenze congiunte avrò una tabella con delle sotto-tabelle quante sono le variabili che inserisco, ho una tabella di contingenza che posso scomporre in tabelle più semplici di corrispondenza), il numero di elementi sottoposti all'analisi è la somma delle modalità che ho selezionato per quella variabile (le chiamo MODALITÀ ATTIVE), I fattori:sono combinazioni di tutte le modalità attive, si possono estrarre tanti fattori quante sono le modalità attive; le modalità illustrative: possono essere usate per arricchire la descrizione di ciascun fattore prodotto dall'analisi fatta con le modalità attive Modalità attive: modalità che contribuiscono alla formazione dei fattori Modalità illustrative: non concorrono a formare il fattore. A differenza dell'analisi precedenti non potendo calcolare i coefficienti di correlazione lineare non posso utilizzare la tabella delle correlazioni. Bisogna decidere quanti fattori conservare, quelli che si utilizzano meglio insieme delle relazioni esistenti tra le varie modalità delle variabili -MASSA o peso relativo: mi dice che frequenza a ciascuna modalità che abbiamo inserito nell'analisi delle corrispondenze multiple, più la massa è alta più la modalità ha un'influenza nell’insieme -AUTOVALORI: (stesso significato della comunalità) ma cambia la terminologia, qui l’ autovalore non potrà riprodurre la varianza perché non è una caratteristica delle variabili categoriali ma riprodurrà la quota di inerenza riprodotta dal fattore -CONTRIBUITO RELATIVO, o COSENO QUADRATO:(sarebbe a comunità dell’ACP) varia tra 0 e 1 non può assumere valori negativi, quota di inerzia di ciascuna variabile prodotta dai fattori estratti. -CONTRIBUTO ASSOLUTO: (sarebbe i peso componenziale acp) quanto ciascuna modalità di ciascuna variabile contribuisce all'inerzia di ciascun fattore, solo valori positivi, somma 100 la posso leggere come un valore percentuale, utile per trovare un etichetta a ciascun fattore. Valori che si associano a ciascuna modalità. Valore coefficiente alto: modalità ben riprodotta Valore coefficiente basso: modalità mal o non del tutto riprodotta -CONRDINATA FATTORIALE: (simile ai punteggi componenziali) ha valori sia negativi che positivi), ci fa collegare su ciascun fattore le modalità dividendole tra semiasse positivo negativo, Pagina di 2 5
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved