Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

stata specialistica, Slide di Analisi Statistica

statistica

Tipologia: Slide

2014/2015
In offerta
30 Punti
Discount

Offerta a tempo limitato


Caricato il 07/09/2015

sara9992
sara9992 🇮🇹

4.8

(4)

1 documento

Anteprima parziale del testo

Scarica stata specialistica e più Slide in PDF di Analisi Statistica solo su Docsity! COMANDI STATA (MACROECONOMIA APPLICATA AA. 2010-11) OPZIONE INIZIALE NEL CASO SI UTILIZZI UN DATASET MOLTO AMPIO Se il dataset che si vuole far leggere al programma è molto ampio, STATA ha bisogno di espandere la sua memoria. In questo caso, il primo comando da inserire è il seguente: set memory 30m questa impostazione permette di far leggere al programma file molto ampi. Come salvare e stampare il programma che si e’ effettuato su STATA: il file LOG STATA puo’ salvare la sessione di lavoro su un file. Il file che ne risulta, chiamato “file log” contiene tutto cio’ che si e’ effettuato. In questo modo il lavoro che si e’ svolto puo’ essere rieditato o incorporato in un file di word. Per salvare la sessione di lavoro su STATA, bisogna scrivere su stata-command: log using “nome del file.log” Quindi se voglio salvare il mio file di risultati nella directory c:\econometria e gli voglio dare il nome di pippo1 scrivero’su stata-command: log using “c:\econometria\pippo1.log” Durante la sessione posso anche voler interrompere la registrazione del file. Ad esempio, posso voler fare prima alcune prove e solo dopo, una volta che sono sicuro delle procedure, salvarle nel mio log-file. Per interrompere temporaneamente la registrazione della sessione scrivere: log off Per ripristinarla: log on Invece, per chiudere la registrazione definitivamente scrivere: log close CHIUDERE IL FILE E’ IMPORTANTE PER SALVARE CIO’ CHE SI E’ FATTO! Dopo che ho chiuso il log-file posso andare su Word, aprire il file c:\econometria\pippo1.log. Apparira’ tutta la mia sessione di lavoro che potra’ essere modificata, e inclusa in un qualsiasi file di testo. Commenti da aggiungere al file .log Nota: Stata legge qualsiasi comando che inizia con * come un commento e non come un comando. Se voglio quindi scrivere un commento che venga salvato sul log-file basta quindi che inizi la frase con *. Esempio: *questo e’ il test Goldfeld-Quandt Come leggere i dati su STATA: uso di STAT-TRANSFER Il modo piu’ semplice per leggere un file excel su STATA e’ quello di utlizzare il programma Stat- Transfer. Questo programma consente di salvare un file in formato nomefile.xls (formato excel) in un file in formato nomefile.dta (formato stata). L’IMPORTANTE E’ CHE IL FILE DI EXCEL CONTENGA NELLA PRIMA RIGA I NOMI DELLE VARIABILI E NELLA PRIMA COLONNA IL NOME DELLE REGIONI/INDIVIDUI (nel caso di campione cross-section) OPPURE GLI ANNI (nel caso di serie temporali). In altre parole, sistemate le variabili per colonne. Una volta sistemato il file in formato excel: 1. aprite STAT-TRANSFER 2. Vi apparira’ una pagina (transfer) in cui vi si chiede “input file type”. Specificare “EXCEL”. 3. Su “file specification” scrivere il nome completo del file EXCEL che volete salvare in formato STATA. 4. Su “output file type” specificare invece “STATA VERSION 6 (o 7 o 8)” 5. Sotto, su “file specification” dovrebbe gia’ apparirvi il nome del file in formato .dta. 6. Adesso cliccate il pulsante “Transfer” 7. Potete aprire il nuovo file in formato dta su STATA. COMANDI UTILI PER ANALISI DESCRITTIVE LIST nome variabili = visualizza i valori delle variabili che si vogliono controllare. Dopo il comando specificare le variabili che si vogliono visualizzare. ESEMPIO il comando: list anno pil visualizza le variabili anno e pil. SUMMARIZE nome variabili = fornisce un breve riassunto statistico delle variabili specificate. Es. summarize anno pil visualizza un breve riassunto statistico delle variabili anno e pil. DESCRIBE nome variabili = lista brevemente le variabili CORRELATE nome variabili = fornisce la matrice di correlazione delle variabili. Questo comando e’ indispensabile per analizzare la correlazione esistente tra le diverse variabili esplicative introdotte in una regressione e fare quindi una valutazione approssimata di eventuali problemi di multicollinearita’. generate lnX=ln(X) lnX e’ il nome arbitrario che ho deciso di dare alla nuova serie creata. Quindi, in generale il comando e’ generate nome nuova variabile= qualche funzione di X Altre funzioni comuni sono: generate X2=sqrt(X) genera una serie che e’ la radice quadra della serie X Gli operatori matematici che Stata legge sono: +(addizione), -(sottrazione/negazione), *(moltiplicazione), /(divisione), ^(elevazione a potenza) COME TRASFORMARE UNA VARIABILE “ETICHETTA” IN UNA VARIABILE NUMERICA Un altro comando utile è il comando EGEN. E’ FONDAMENTALE PER RIUSCIRE A CREARE UNA VARIABILE NUMERICA DA ETICHETTE. Es. Se ho variabili per paese e ho una variabile non numerica che definisce per nome i diversi paesi questo può creare problemi quando ad esempio voglio che il programma mi legga il dataset come panel (vedi comando tsset). In questo caso infatti ho bisogno di passare dalle etichette (nomi completi di paesi) e numeri (paesi identificati da un numero) e lo posso fare con il comando egen+group. Se la vraibile etichetta che voglio trasformare in numerica si chiama paesi scrivo: egen paesi2=group(paesi) E mi crea la variabile paesi2 che identifica ciascun paese del mio campione con un numero Altri due comandi che possono consentire di fare la stessa trasformazione sono GENERATE e ENCODE: Il comando GENERATE (+ l’opzione real) serve a trasformare i dati che il programma legge come “string” (non in formato numerico) in formato numerico. Generate nuova variabile = real (vecchia variabile) Un altro modo per fare la stessa cosa utilizza il comando ENCODE Encode nome della variabile da trasformare, generate nuovo nome SE SI VUOLE MODIFICARE IL CAMPIONE ANALIZZATO CON STATA: COMANDI IF, DROP, KEEP IF Comando per definire esattamente il campione Regress Y X1 X2 if tin(1965, 1989) Definisce che voglio effettuare una regressione OLS utilizzando solo i dati del campione compreso tra gli anni 1965-1989 anche se il mio campione copre, ad esempio il periodo 1963-1992. Oppure posso eliminare le osservazioni 1963, 1964, 1990, 1991, 1992 dal campione con il comando DROP(elimina): drop if year<1965 drop if year>1989 Per eliminare un anno preciso indicare: drop if year= =1977 Per eliminare invece un individuo/nazione: drop if paesi2= =30 Così elimino il paese che nel dataset è identificato dal numero 30 (vedi anche comando egen) . Oppure, se voglio eliminare dalla regressione una regione/individuo definita, ad es., dalla variabile reg posso scrivere: xi: regress yitpop lagyitpop laglnhk2 i.reg if reg>2 | reg<2; Qui sto eliminando la regione 2. Il segno “|” significa “or”. Infine, posso dire al programma cosa considerare anziche’ quello che deve eliminare con il comando KEEP. keep varlist keep if expression keep in range [if expression] ANALISI DI REGRESSIONE REGRESS = comando per la regressione OLS. Dopo REGRESS mettere in ordine la variabile dipendente e poi la lista di variabili esplicative . La costante e’ messa automaticamente dal programma, non va specificata. Esempio: Regress Y X1 X2 Se si vuole invece escludere la costante dalla regressione bisogna specificarlo nel comando. Es.: Regress Y X1 X2, noconstant dopo una virgola. ANALISI DI REGRESSIONE DATI PANEL Per specificare al programma che i dati che sta leggendo sono dati longitudinali o panel usare il comando TSSET. Esempio: tsset nome-variabile-individui nome-variabile-temporale Se quindi la variabile che indica gli individui del mio campione si chiama “paesi” e quella che indica il tempo si chiama “anni” devo scrivere: tsset paesi anni. Se poi uso dati annuali devo specificarglielo come opzione dopo una virgola (opzione “yearly”): tsset paesi anni, yearly In seguito all’immissione di alcuni comandi, il programma può dimenticare che ha in memoria un dataset panel. Può essere quindi necessario dover ridare il comando tsset paesi anni, yearly di tanto in tanto Ricorda che se stai lavorando con dati panel ed effettui una regressione con il comando regress tipo: Regress Y X1 X2 stai effettuando una analisi di tipo POOLING (vedi il Wooldridge) STIMATORE EFFETTI FISSI: XTREG (fe) Se invece si vuole effettuare una regressione panel con effetti fissi, il comando giusto è xtreg a cui va aggiunta l’opzione fe: xtreg Y X1 X2, fe l’opzione fe dice al programma che lo stimatore che si vuole utilizzare è proprio quello fixed effects (o within groups). Altrimenti il programma utilizza in automatico uno stimatore panel con effetti random. (vedi il Wooldridge) STIMATORE EFFETTI RANDOM: XTREG (re) Se invece si vuole effettuare una regressione panel con effetti random, il comando giusto è xtreg a cui va aggiunta l’opzione re: xtreg Y X1 X2, re TEST DI HAUSMAN Si costruisce in cinque passaggi: 1) Si effettua stimando per primo il modello con effetti fissi: xtreg Y X1 X2, fe 2)Poi si dice al programma di salvare le stime con il seguente comando: collapse (first) country country_isocode year1960 pil1960 pop1960 ki1960 (mean) ki_mean (last) year2000 pil2000 pop2000, by (countryno) by(countryno) mi dice di fare il collapse paese per paese del panel. con (first) sto dicendo al programma di selezionare quelle variabili indicate dopo l’opzione nella prima riga (che nel mio esempio corrisponde al 1960). Con (mean) sto dicendo al programma di prendere ki_mean in media su tutto il periodo 1960-2000. Con (last) gli sto dicendo di prendere l’ultima riga di quelle variabili (che nel mio esempio è il 2000). ________________________________________ USO DELLA CALCOLATRICE IN STATA Se si vogliono effettuare calcoli direttamente sul programma STATA il comando giusto è “display”. Dopo il comando si può direttamente impostare il calcolo che si vuole fare. TEST DI SPECIFICAZIONE DEL MODELLO FORNITI DA STATA Sono da effettuare subito dopo la regressione che si vuole analizzare Dopo la regressione posso quindi dare i seguenti comandi: test : effettua test delle ipotesi lineari sui parametri. RVFPLOT, border yline(0) = mi fornisce il plot dei residui versus I valori stimati. Utilissimo perché se il modello è ben specificato non dovrei osservare alcun pattern nel grafico. Se invece vi è ad es. varianza crescente/decrescente nei residui sospetto eteroschedasticità. In generale, qualsiasi pattern indica una violazione delle assunzioni OLS. DWSTAT = questo comando dato dopo una regressione OLS mi fornisce il valore del test di Durbin-Watson per l’autocorrelazione del primo ordine. OVTEST= Calcola il test RESET HETTEST=Test di eteroschedasticita’ SKTEST=Test di normalita’. Per un test di normalita’ sui residui bisogna prima salvare i residui della regressione come specificato in precedenza e poi (se ho salvato i residui con il nome residui1) DARGLI IL COMANDO, SKTEST RESIDUI1 REGRESSIONI IN PRESENZA DI ETEROSCHEDATSTICITA’ Se i test mostrano la presenza di eteroschedasticita’ dei residui bisogna controllare per questo problema. I comandi utili sono: ROBUST = costruisce standard error di beta-cappello corretti per la presenza di eteroschedasticita’ (correzione di White). Es: regress Y X1 X2 X3, robust l’opzione robust si scrive dopo la virgola Oppure: (WLS) = Per effettuare Weighted Least Squares bisogna aggiungere dopo aver specificato la regressione tra parentesi quadre quale variabile va utilizzata per la ponderazione [w=variabile] Es. Regress Y X1 X2 X3 [w=X2] INFINE RICORDA CHE SE HAI DUBBI SU SPECIFICI COMANDI PUOI SEMPRE UTILIZZARE L’HELP DI STATA. SCRIVENDO INFATTI: HELP NOMECOMANDO STATA TI DA’ MOLTE INFORMAZIONI SUL FUNZIONAMENTO DEL COMANDO. Oppure (ultima ratio) scrivi a diliberto@unica.it
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved