Scarica Lezione 5 approfondimento spss statistiche descrittive e più Slide in PDF di Marketing Territoriale solo su Docsity! 1 APPROFONDIMENTO: Tecniche di analisi statistica con il software SPSS Prof. Alessandro M. Peluso Università del Salento mi
SPSS-PASW STATISTICS
od Sta
IBM° SPSS° Text Analytics (RR | me
IO
for Surveys Trial Pr
REI ARE O RE ESORTATO
SISSI
PETSISIIO
ETERO =
Downiosds by Product Family RIVISTI
Downloads by Product Family erre nere 1019 i
$
Statistics Family KE Data Collection Family v° 7
a ®
> IBM® SPSS® Stati: Tria el i + IBM SPSS Data Collection Overview video Questions? Contact an Si
+ IEM© SPSSDAmos Trial + Take many roads to ruth with IBM ‘search specalist at.
- 1601009)
mme Future ofStatistcs, ala Mining and fina
Ra = The mows and ue ofs.ivey ressareh ©=
pi FR > Operatonalzing Voice ofthe Customer How | | 5rcatusaî
RE: Ra So an Top Performers Create Aztionable Insight 300-543-2185.
target high-va ue customers
http://www-01.ibm.com/software/analytics/spss/downloads/
- IBW SPSS Data Collection Dovolopmont Library
5 Analisi delle frequenze (Frequency analysis) Contare (in termini assoluti o relativi, %) quante volte una modalità statistica si manifesta all’interno di un campione È adatta per variabili misurate su scale non- metriche (nominale od ordinale) per le quali, si ricordi, non ha senso calcolare media, e dev. std. Quanti maschi? Quanti laureati? Ecc. 6 Analisi delle frequenze e verifica di ipotesi È possibile verificare se esistono differenze significative nelle frequenze (proporzioni) con cui si manifestano le diverse modalità statistiche di una variabile non-metrica Test statistici non- parametrici Chi-Square (χ2) test Calcola la corrispondenza tra le frequenze attese e quelle osservate 7 In generale, i test statistici Sono strumenti decisionali che consentono di stabilire quanto le stime campionarie sono errate, verificando la plausibilità di alcune ipotesi Ipotesi nulla (H0) Che di solito descrive lo status quo e che si spera di confutare H0 = nessuna differenza/effetto Ipotesi alternativa (H1) Negazione di H0 H1 = ∃ una differenza/effetto (test a 2 code) Descrive una specifica differenza/effetto H1 = ∃ una differenza/effetto positiva/o (test a 1 coda) 10 Chi-Square (χ2) test 22 1 ( ) χ = i ik Obs Exp i i Exp f f f= − ∑ f iObs = Frequenze osservate f iExp = Frequenze teoriche o attese k = numero delle modalità statistiche (es., Variabile X: “Sesso” ⇒ k = 2), gdl = k -1 Esempio: Verificare se esiste una differenza statisticamente significativa tra le seguenti proporzioni di uomini e donne su un campione di 16 ss. (si assuma fExp = 8, ∀ i, cioè che ci siano 50% M/F) f UominiObs = 6 f DonneObs = 10 ■ χ2 = ….. è significativo? 11 Il valore critico di χ2 associato ad α = 0,05 è pari a 3,84, maggiore del nostro valore (χ2-critico > χ2), quindi il test non è significativo Per χ2 = 1, p ∈ [0,250, 0,500] χ2 = 1 χ2 (gdl = 1) = 1,00; con α = 0,05 12 Esempio #3 Aprire il file “Sesso.sav” Eseguire il comando: Selezionare dal menù Analyze: Nonparametric tests→ Chi-Square Selezionare la variabile “Sesso” OK (commentare il risultato) 15 Analisi descrittive (univariate) Servono a rappresentare con pochi numeri le caratteristiche di un campione Misure delle posizioni centrali Media, Mediana, Moda Misure di dispersione Varianza, Deviazione standard ■ Misure di forma Skewness Curtosi 16 Formule principali 2Dev. Std. popolazione σ σ= 2Dev. Std. campionaria S S= Si ricordi … N x N i i∑ == 1µ epopolazion Media n x X n i i∑ == 1 acampionari Media N x N i i∑ = µ− =σ 1 2 2 )( epopolazion Varianza 1 )( acampionari Varianza 1 2 2 − − = ∑ = n Xx S N i i 17 Anche in questo caso si usano i test statistici per verificare la plausibilità di specifiche ipotesi, usando il concetto di significatività Analisi delle differenze e verifica di ipotesi H0: nessuna differenza/ effetto H1: Negazione di H0 H1: ∃ una differenza/effetto Descrive una specifica differenza/effetto H1: ∃ una differenza/effetto positiva/o 20 t-test a campione singolo (one-sample t-test) Consente di verificare l’esistenza di una differenza significativa tra il valore medio (es., ) di una variabile statistica e un valore esogeno (es., µ) = media campionaria µ = media della popolazione gdl = n – 1 S = Dev. Std. Campionaria = Errore Std. della Media H0: (o qualche altro valore esogeno) H1: X µ = X t S n − X S n µX = µX ≠ 21 Esempio #5 Esempio tratto da: Levine et al. (2006), Statistica, Milano: Apogeo, p. 296 e segg. Obiettivo: un imprenditore vuole verificare se l’ammontare medio delle sue fatture dell’anno appena finito è diverso da quello medio degli ultimi cinque anni (µ = $120). A tal fine, considera un campione casuale di 12 fatture aventi i seguenti importi in $: 108,98; 152,22; 111,45; 110,59; 127,46; 107,26; 93,32; 91,97; 111,56; 75,71, 128,58; 135,11 Calcolare in Excel la statistica t (α = 0,05 su 2 code; quindi, vedere il valore α = 0,05 sulla tavola dei valori critici a 2 code) e discutere il risultato Costruire il file in SPSS ed eseguire il seguente comando: Selezionare dal menù Analyze: Compare Means→ One-Sample T Test Specificare la variabile d’interesse e come Test Value il valore 120 OK (commentare il risultato) BM. Tavola. Valori critici del t di Student
Nella prima colonna sono indicati i gradi di libertà ( g/), nella prima riga i possibili livelli di significatività (
All’incrocio tra il numero di gradi di libertà e il livello di significatività si trova il valore critico del ? di Stud
Probabilità p di essere nella zona di rifiuto individuata dal valore critico tabulato
gl 0.500 0.250 0.100 0.050 0.025 0.010 0.005 0.001
T
1 1.00 241 6.31 12/71 25.45 63.66 127.32 636.58
2 0.82 1.60 2.92 480 6.21 9.92 14.09 31.60
3 0.76 1.42 2.35 38 4.18 5.84 7.45 12.92
4 0.74 1.34 2.13 2178 3.50 4.60 5.60 8.61
5 0.73 1.30 2.02 267 3.16 4.03 4.77 6.87
6 0.72 1.27 1.94 245 2.97 3.71 4.32 5.96
7 0.71 1.25 1.89 2536 2.84 3.50 4.03 5.41
8 0.71 124 1.86 281 2.75 3.36 3.83 5.04
9 0.70 123 1.83 206 2.69 3.25 3.69 4.78
10 0.70 1.22 181 2.03 2.63 347 3.58 4.59
11|- - - 020- — — -121- — — -1,80- — > (820) 2.59 3.11 3.50 4.44
12 0.70 121 1.78 5 2.56 3.05 3.43 4.32
13 0.69 1.20 177 2.16 2.53 3.01 3.37 4.22
14 0.69 1.20 1.76 214 2.51 2.98 3.33 4.14
15, 0.69 1.20 1.75 213 2.49 2.95 3.29 4.07
16 0.69 1.19 1.75 2.12 247 2.92 3.25 4.01
17] 0.69 1.19 174 211 2.46 2.90 3.22 3.97
18 0.69 1.19 1.73 2.10 2.45 2.88 3.20 3.92
19 0.69 1.19 1.73 2.09 2.43 2.86 3.17 3.88
20| 0.69 1.18 1.72 2.09 2.42 2.85 3.15 3.85
BM. Tavola. Valori critici del t di Student
Nella prima colonna sono indicati i gradi di libertà ( g/), nella prima riga i possibili livelli di significatività (
All’incrocio tra il numero di gradi di libertà e il livello di significatività si trova il valore critico del ? di Stud
Probabilità p di essere nella zona di rifiuto individuata dal valore critico tabulato
gl 0.500 0.250 0.100 0.050 0.025 0.010 0.005 0.001
I
1 1.00 241 6181 12.71 25.45 63.66 127.32 636.58
2 0.82 1.60 2092 4.30 6.21 9.92 14.09 31.60
3 0.76 1.42 2535 3.18 4.18 5.84 7.45 12.92
4 0.74 1.34 253 2.78 3.50 4.60 5.60 8.61
5 0.73 1.30 262 257 3.16 4.03 4.77 6.87
6 0.72 1.27 14 245 2.97 3.71 4.32 5.96
7 0.71 1.25 1.89 2.36 2.84 3.50 4.03 5.41
8 231 2.75 3.36 3.83 5.04
9 226 2.69 3.25 3.69 4.78
10 223 2.63 347 3.58 4.59
11 0.70 121 1.80 220 2.59 3.11 3.50 4.44
12 0.70 121 1.78 2.18 2.56 3.05 3.43 4.32
13 0.69 1.20 177 2.16 2.53 3.01 3.37 4.22
14 0.69 1.20 1.76 214 2.51 2.98 3.33 4.14
15, 0.69 1.20 1.75 213 2.49 2.95 3.29 4.07
16 0.69 1.19 1.75 2.12 247 2.92 3.25 4.01
17] 0.69 1.19 174 211 2.46 2.90 3.22 3.97
18 0.69 1.19 1.73 2.10 2.45 2.88 3.20 3.92
19 0.69 1.19 1.73 2.09 2.43 2.86 3.17 3.88
20| 0.69 1.18 1.72 2.09 2.42 2.85 3.15 3.85
26 Esempio #6 (continua) Costruire il file in SPSS ed eseguire il seguente comando: Analyze → Compare Means → Paired-Samples T Test Specificare la variabile d’interesse OK (commentare il risultato) 27 t-test a campioni indipendenti (independent-samples t-test) Consente di verificare l’esistenza di una differenza significativa tra i valori medi di una variabile misurata su due campioni (gruppi) distinti 1 2 1 2 2 1 2 ( ) (µ µ ) = 1 1 p X X t S n n − − − + H0: H1: gdl = n1 + n2 – 1 dove: )1()1( )1()1( combinata Varianza 21 2 22 2 112 −+− −+−= nn SnSn S p 21 µ=µ 21 µ≠µ