Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

Introduzione Distribuzioni Statistiche: Unità, Caratteri, Distribuzioni, Dispense di Statistica

Statistica inferenzialeStatistica applicataAnalisi StatisticaStatistica Descrittiva

Una introduzione alle unità statistiche, ai caratteri statistici e alle distribuzioni statistiche. Le unità statistiche sono le unità elementari su cui vengono osservati i caratteri oggetto di studio, mentre i caratteri possono essere discreti o continui e trasferibili o meno. La formazione di una distribuzione statistica deriva dall'operazione di classificazione di tutte le unità statistiche di un dato collettivo secondo la modalità del carattere posseduta da ciascuna unità. Le distribuzioni possono essere semplici, doppie o multiple.

Cosa imparerai

  • Che cos'è una unità statistica?
  • Come si differenziano le distribuzioni statistiche semplici, doppie e multiple?
  • Quali sono i tipi di caratteri statistici?
  • Come si forma una distribuzione statistica?
  • Quali sono le distribuzioni statistiche semplici?

Tipologia: Dispense

2019/2020

Caricato il 13/08/2022

dandsh00
dandsh00 🇮🇹

4 documenti

1 / 41

Toggle sidebar

Documenti correlati


Anteprima parziale del testo

Scarica Introduzione Distribuzioni Statistiche: Unità, Caratteri, Distribuzioni e più Dispense in PDF di Statistica solo su Docsity! 1 ASPETTI INTRODUTTIVI SULLA METODOLOGIA STATISTICA: LEZIONE 1 La statistica ha come oggetto di studio i dati, i quali sono numeri inseriti in un contesto che rende il numero informativo. La statistica utilizza i dati per comprendere meglio la realtà e trarre conclusioni. I suoi strumenti – sia grafici che numerici – devono essere, però, utilizzati e interpretati con una certa attenzione e seguendo ragionamenti opportuni. La statistica è una disciplina che studia e appronta una serie di metodi e di strumenti adatti all’analisi quantitativa dei dati su cui agiscono molte cause al fine di individuare i tratti essenziali dei fenomeni osservati, o le regole che presiedono alla manifestazione di certi risultati. Il metodo statistico si interessa dei fenomeni collettivi, cioè di quei fenomeni che si manifestano solo su di una massa di osservazioni (cioè di fatti riferiti a insiemi di unità e non a singoli casi). L’indagine statistica: Ogni studio o indagine statistica comporta lo svolgimento di diverse operazioni che variano da ricerca a ricerca: dal momento della definizione del problema da analizzare, alla raccolta dei dati, alla elaborazione degli stessi, ai risultati. Diagramma dell’analisi statistica: In ogni analisi statistica, il primo passo da compiere consiste nel “FAR PARLARE IN MODO CHIARO I DATI” e ascoltare quello che essi dicono. Soltanto organizzando attentamente i dati, costruendo grafici e tabelle e ponendo domande specifiche è possibile far parlare in modo chiaro i numeri. Le fasi di un’indagine statistica: 1. Piano della rilevazione: Riguarda la definizione del problema da analizzare in tutti i suoi aspetti (scientifici, statistici, organizzativi, economici, etc). Definizione della: scelta del campo di indagine, scelta del metodo di rilevazione (diretto, indiretto o sperimentale – definire il piano (protocollo) degli esperimenti), scelta dell’epoca di rilevazione, scelta degli strumenti necessari alla rilevazione (questionari, apparecchi per analisi cliniche), tempi e costi e la diffusione dei risultati. 2. Raccolta dei dati: consiste nella costituzione della documentazione statistica di partenza, ossia nella rilevazione materiale dei dati secondo le modalità definite nella fase preparatoria: sarà costituita da tutti i questionari compilati, da tabulati. Sebbene si tratti di materiale grezzo esso costituirà la base di partenza per la formazione dei dati statistici necessari alle successive analisi. 3. Classificazione e lo spoglio dei dati: La classificazione dei dati riguarda la sistemazione dei dati grezzi in forma statisticamente trattabile. L’operazione di Classificazione (mediante lo spoglio dei dati contenuti nella documentazione statistica di partenza) si identifica con l’individuazione di una procedura che permette di assegnare ogni oggetto ad una ben definita classe, oppure nel determinare ed assegnare un codice, una etichetta, ad ogni oggetto. 4. Elaborazione dei dati: Tale fase riguarda tutte le possibili elaborazioni dalle più elementari alle più complesse, che possono essere effettuate, secondo gli scopi della ricerca, a partire dal data file creato nella fase precedente in cui si trasformano i microdati in macrodati tramite opportune aggregazioni; ad esempio: formazione di tabelle semplici o multiple, calcolo di indici, medie, correlazioni, rappresentazioni grafiche. In questa fase si applicano i procedimenti propri della metodologia statistica. 2 5. Interpretazione dei risultati: Questa fase riguarda l’analisi dei risultati ottenuti e l’isolamento di risultati significativi emersi dalle analisi effettuate. Questo è il momento più complesso e delicato dell’intera indagine statistica, ma anche quello più creativo. Bisogna stare molto attenti, per non correre il rischio di false interpretazioni del fenomeno. Nomenclatura statistica: Unità statistiche, Popolazione (o collettivo statistico), Caratteri statistici, Distribuzioni statistiche. 1. Unità statistiche: Si definiscono unità statistiche le unità elementari, su cui vengono osservati i caratteri oggetto di studio. Ad esempio: se vogliamo analizzare l’attività turistica di una regione le unità statistiche sono le aziende turistiche, se vogliamo analizzare la forza lavoro le unità statistiche sono i singoli addetti. Distinguiamo: unità statistiche semplici (sono quelle che rappresentano un solo elemento) e unità statistiche composte (sono quelle che rappresentano più elementi). Le unità statistiche possono essere rappresentate da: persone o essere viventi, oggetti (merci, abitazioni), territori (Regioni, Province), tempi (anni di calendario, mesi, entità (imprese, istituzioni scolastiche o sanitarie). 2. Popolazione (o collettivo statistico): L’insieme di più unità statistiche omogenee rispetto ad una o più caratteristiche costituisce un collettivo statistico o una popolazione. Il numero delle unità statistiche di un collettivo costituisce la numerosità del collettivo che indichiamo con N. Abbiamo visto come il collettivo statistico è l’insieme delle unità statistiche a cui lo studioso è interessato - Finito od infinito? - Empirico o teorico? Esempio: le lampadine prodotte da un’industria costituiscono un collettivo empirico e finito, I sieropositivi possono essere un collettivo teorico infinito. Collettivo di stato: insieme di unità statistiche individuabili in maniera esatta solo in un preciso istante di tempo (esempio: gli esercizi commerciali di Termoli il 20 agosto 2018) Collettivo di movimento: insieme di unità statistiche individuabili in maniera esatta solo in un preciso periodo di tempo (reddito speso dai turisti nel comune di Termoli fra il 10 ed il 20 agosto 2018). 3. Caratteri statistici: si definiscono caratteri le caratteristiche del collettivo statistico. Esempi: la temperatura, la superficie destinata alla produzione agricola di una azienda, il sesso, le caratteristiche chimiche di un prodotto, la professione, il titolo di studio, il reddito. Le caratteristiche assunte da ogni singola unità statistica del collettivo si chiamano modalità del carattere. Esempio: Unità statistiche: (particella 1,2,3,4) Popolazione (collettivo): {Particella 1, Particella 2, Particella 3, Particella 4} Caratteri: (Superficie, Zona altimetrica, Tipo di coltura); Modalità: (12000 m2, …4000 m2, Montagna, Collina, Pianura, Bosco, Granturco, Grano, Farro). Ad esempio, il carattere Zona altimetrica assume la modalità Pianura in corrispondenza dell’unità statistica rappresentata dalla Particella 3. Un carattere può assumere modalità differenti in corrispondenza delle diverse unità statistiche del collettivo. Le modalità del carattere devono essere: esaustive, ossia devono rappresentare tutti i possibili modi di essere del carattere (maschio e femmina), non sovrapposte, ossia ad ogni unità statistica si può associare una sola modalità del carattere (o è maschio o è femmina). Distinguiamo inoltre: Caratteri quantitativi (variabili statistiche): le modalità sono espresse numericamente (età in anni compiuti o in classi di età, numero dei componenti la famiglia, la temperatura in gradi centigradi, etc.); Caratteri qualitativi (mutabili statistiche): se le modalità del carattere sono qualitative, ossia espresse da numeri convenzionali (il sesso in uomini (1) e donne (2); le professioni in libero professionista (1), dirigente (2), impiegato (3), i giorni della settimana, etc.;) Caratteri discreti: quando l’insieme delle modalità può essere messo in corrispondenza biunivoca con l’insieme dei numeri naturali {1, 2, 3, ...} o un suo sottoinsieme (numero di clienti in fila ad uno sportello, il numero dei componenti di una famiglia, il voto all’esame di Statistica, numero di visitatori che visita un museo, il numero di turisti per regione, il numero di confezioni vendute di un dato prodotto, etc.). 5 b. Le serie territoriali (o serie spaziali): Esprimono la distribuzione di un fenomeno in rapporto al territorio, ossia le modalità del carattere considerato sono ordinate secondo luoghi, paesi, territori. Questi studi sono oggi importanti, per esempio, nelle analisi dei sistemi ecologici e per la valutazione dell’impatto ambientale di qualsiasi innovazione sul territorio. Le analisi territoriali ultimamente si sono notevolmente sviluppate grazie alla disponibilità di software, come il GIS (Geographic Information System) che consentono di riprodurre sulle mappe del territorio le informazioni statistiche in modo da creare una immediata corrispondenza tra studio dei dati e loro rappresentazione geografica. c. Le matrici di dati: Particolari rappresentazioni tabellari mediante le quali si schematizzano le informazioni (misure, registrazioni, risposte) raccolte su ciascuna unità statistica in rapporto ad una molteplicità di fenomeni. Ogni colonna della matrice esprimerà una variabile o mutabile rilevata sulle diverse unità statistiche. Dualmente, ogni riga della matrice esprimerà ordinatamente le misurazioni ottenute sulla singola unità statistica. Lo studio delle matrici di dati è un settore delle analisi statistiche multivariate. In ogni riga, relativa all’unità statistica corrispondente, si trovano i valori delle k variabili designati con Xij per i = 1, 2, 3, …, N e j = 1, 2, 3, …, k. Nella prima colonna delle variabili si leggono le N determinazioni della variabile X1 pertinenti a ciascuna delle N unità statistiche DISTRIBUZIONI STATISTICHE LEZIONE 2 La formazione di una distribuzione statistica deriva dall’operazione di classificazione di tutte le N unità statistiche di un dato collettivo secondo la modalità del carattere posseduta da ciascuna unità. Queste possono essere: Semplici (classificazione delle N unità secondo le modalità di un solo carattere), Doppie (classificazione delle N unità secondo la combinazione delle modalità di due caratteri) e Multiple (classificazione delle N unità secondo la combinazione delle modalità di più di due caratteri). 1. Distribuzioni statistiche doppie: Tabelle doppie derivate: i due caratteri considerati non sono rilevati sulle stesse unità statistiche, ossia i collettivi ai quali si riferiscono i caratteri sono diversi; tali tabelle sono costituite da più distribuzioni semplici. 6 Tabelle a doppia entrata: ciascuna unità statistica del collettivo considerato è classificata in base alla combinazione da essa presentata delle modalità dei due caratteri contemporaneamente considerati. I caratteri considerati possono essere: Due caratteri qualitativi, Due variabili, Un carattere qualitativo e uno quantitativo. Tra le distribuzioni statistiche distinguiamo: a. Distribuzioni di quantità: un’organizzazione dei dati in forma tabellare tale che ad ogni modalità di una certa variabile fa corrispondere una quantità (assoluta o relativa), o una grandezza derivante da misurazione, idealmente trasferibile tra le unità della popolazione (ad es. reddito, consumi, etc.). b. Distribuzioni di frequenza: la frequenza è il numero di volte che una determinata modalità si verifica nel collettivo in esame. Quando la frequenza è un numero intero non negativo si parla di frequenza assoluta (è il risultato di un conteggio). Quando la frequenza assoluta è rapportata al totale delle unità statistiche della popolazione si parla di frequenza relativa. La distribuzione di frequenza è un’organizzazione dei dati in forma tabellare tale che ad ogni modalità di una certa variabile (quantitativa o qualitativa) fa corrispondere la rispettiva frequenza (assoluta o relativa). In pratica la distribuzione di frequenza di un carattere quantitativo (che si presenta con modalità distinte) o di un carattere qualitativo (che si presenta con attributi distinti) è semplicemente un modo di organizzare e, quindi, di presentare le unità statistiche che manifestano la stessa modalità o lo stesso attributo sull’intera popolazione, enumerando le osservazioni per modalità o attributi coincidenti. Distinguiamo tra distribuzioni di frequenza: per variabili discrete e per variabili continue. La distribuzione di frequenza semplice della variabile discreta X può essere rappresentata attraverso la seguente tabella statistica: Proprietà: 7 Esempio: distribuzione di frequenza semplice secondo il sesso di N = 50 individui. Frequenze assolute, relative, percentuali. Richiami su alcuni operatori matematici: 1. Sommatoria: La sommatoria di ai per i che va da 1 a N è così definita Può anche essere rappresentata con: Le sue proprietà sono: La sommatoria doppia di aij per i che va da 1 a N e j che va da 1 a M viene indicata con: 2. Produttoria: La produttoria di ai per i che va da 1 a N è così definita: Può anche essere rappresentata con: Funzione di ripartizione empirica: Siano x1, x2, ……, xk le modalità assunte da un carattere qualitativo ordinato o quantitativo sulle N unità della popolazione. È possibile definire, per questa distribuzione, oltre alle frequenze assolute e relative, le frequenze cumulate assolute (Ni) e le frequenze cumulate relative (Fi), in questo modo: Esempio: Distribuzione delle famiglie rispetto alla variabile “n° di componenti”. Frequenze assolute, relative, percentuali, cumulate. Perché usiamo le frequenze relative? Utili per confrontare diversi collettivi (esempio donne e uomini e voto di maturità) Le frequenze assolute dipendono dalla numerosità del collettivo, mentre quelle relative e percentuali si riferiscono ad un collettivo formato da 1 o 100 unità. 10 4. Cartogrammi, mappe sociali: Sono indicati a rappresentare graficamente serie territoriali. Per costruire un cartogramma occorre predisporre di una carta geografica o topografica in cui siano chiaramente delimitate le diverse zone, regioni, circoscrizioni (geografiche, politiche, amministrative) rispetto alle quali viene analizzata l’intensità o la frequenza di uno o più caratteri (nati, morti, reddito pro-capite secondo le Regioni, Province, Comuni). ✓ Rappresentazioni grafiche di caratteri quantitativi: Distribuzione di frequenza di un carattere X suddiviso in k classi si rappresenta con un istogramma di frequenza Esempio: distribuzione di frequenza semplice secondo la statura espressa in classi di valori (in cm) di N = 50 individui. Frequenze assolute, relative, percentuali. …costruire piramidi di età… (vedi slide lezione 3 numero 29) Indicatori sintetici delle distribuzioni di frequenza: La sintesi di una distribuzione di frequenza va ricercata in funzione dell’obiettivo da raggiungere, ad esempio: esprimere il divario di affluenza dei turisti tra due regioni, fornire una valutazione media, valutarne la rappresentatività, etc. È necessario esplicitare quali aspetti di una distribuzione di frequenza si intendono esaminare e poi individuare le misure più adatte. Gli aspetti più importanti di una distribuzione di frequenza riguardano: • La posizione: La misura della sua centralità complessiva rispetto alle modalità e alle rispettive frequenze. La sintesi dovrà essere: un valore rappresentativo della variabile nella sua globalità, espresso nella stessa unità di misura del fenomeno e capace di sostituire in qualche modo tutte le osservazioni. • La variabilità: La mutevolezza dei dati nella popolazione, o come si suol dire l’attitudine della variabile ad assumere diverse modalità. La sintesi dovrà essere capace di graduare più fenomeni in termini di: - dispersione, variabilità, cambiamenti, - accentramenti rispetto alle osservazioni, - stabilità, affidabilità. La variabilità include al suo interno numerosi aspetti che richiedono misure differenti. • La forma: L’aspetto complessivo della distribuzione di frequenza rispetto a configurazioni standard. La sintesi dovrà misurare: - la simmetria della distribuzione (rispetto ad un punto notevole, come ad esempio una misura di posizione), - l’accentuazione o l’appiattimento delle modalità più frequenti, - il peso relativo degli estremi rispetto ai valori centrali della distribuzione. 11 Poiché ogni sintesi comporta una perdita di informazione dei dati elementari, essa va ricercata in modo da minimizzare tale perdita facendo riferimento esplicito agli obiettivi dell’indagine statistica. Misure di sintesi: ✓ Indici statistici di posizione: Obiettivo di una misura di posizione è quello di sintetizzare in un singolo valore numerico l’intera distribuzione di frequenza per effettuare confronti nel tempo, nello spazio o tra circostanze differenti. Sono stati proposti numerosi indici di posizione per una distribuzione di frequenza. Fra questi il concetto e la misura di “media” hanno assunto un ruolo centrale. Tuttavia, è guardata con sospetto quando si pretende di sintetizzare le informazioni di una realtà complessa e articolata mediante un unico valore. Quindi, ad esempio, la sola media aritmetica non è, di per sé, sufficiente per la sintesi di un fenomeno reale. ✓ Medie analitiche e medie di posizione: Le medie analitiche si considerano opportune operazioni matematiche in cui si tiene conto di tutti i valori delle modalità; le medie analitiche sono calcolate attraverso operazioni algebriche sui valori del carattere, che dovrà essere quindi di tipo quantitativo. Distinguiamo: Media aritmetica, Media geometrica, Media armonica e Media di potenza. ✓ Medie lasche (o di posizione): Medie che utilizzano, alcuni valori specifici della distribuzione di frequenze, individuati sulla base della loro collocazione relativa rispetto a tutti gli altri, ma senza coinvolgere nel calcolo tutte le modalità del carattere. In tale tipo di medie non si utilizzano operazioni algebriche. Tali medie possono quindi essere determinate anche su caratteri di tipo qualitativo. Distinguiamo: Valore centrale, Mediana, Quantili (quartili, centili, etc.), Moda. Il concetto di media: Esistono diversi criteri per definire il concetto di media  Una media secondo Cauchy di una variabile X è qualunque valore reale M intermedio tra il minimo x1 ed il massimo xN di una distribuzione di frequenza: Tuttavia, tale requisito costituisce più un controllo delle definizioni di media, che una soluzione operativa, essendo generalmente infiniti i numeri reali che soddisfano tale criterio detto criterio di internalità. Sia data: Una media secondo Chisini di una variabile X è quel valore M, intermedio tra il minimo x1 ed il massimo xN di una distribuzione di frequenze, che, rispetto ad una funzione sintetica delle osservazioni, lascia inalterato il valore: Media aritmetica: se consideriamo e supponiamo che la funzione f(.) sia additiva, ossia in base al criterio del Chisini si ha che la media in questione sarà la media aritmetica. Nel caso di serie di osservazioni x1, …, xi, …, xN, si ha quindi: 12 Nel caso di distribuzione di frequenze si ha, per quelle assolute: ANCORA SUGLI INDICATRI SINTETICI DELLE DISTRIBUZIONI DI FREQUENZA LEZIONE 4 Nel caso di frequenze relative si ha: Nel caso di distribuzione di frequenza con carattere quantitativo suddiviso in classi si può considerare il valore centrale ci = (xi-1+xi) /2 di ogni classe e calcolare quindi la media: Oss.: Le formule viste non sono tre formule differenti, ma solo modi differenti di calcolare la media aritmetica a seconda della disponibilità e dell’organizzazione dei dati statistici. Pertanto, si può dire che la media aritmetica è quel valore che possiamo attribuire singolarmente ad ogni unità statistica lasciando invariato l’ammontare globale del carattere. 15 1. Mediana-caratteri suddivisi in classi: Se il carattere è suddiviso in classi, si può ottenere un valore ben approssimato tramite la formula: 16 in cui si assume implicitamente l’ipotesi che nella classe mediana le unità siano distribuite uniformemente Dove: Im estremo inferiore della Classe Mediana, Fm-1 frequenza cumulata fino alla classe precedente quella mediana, Fm frequenza cumulata fino alla classe mediana, Δm ampiezza della classe mediana. -Proprietà della mediana: La mediana Me è quel valore che minimizza la somma degli scarti assoluti: Oss.: Un aspetto importante della mediana Me è la sua capacità di essere rappresentativa della posizione della distribuzione anche in presenza di valori all’estremo della distribuzione, ossia di valori notevolmente diversi da tutti gli altri. Quantili (percentili, quartili, etc…): Spesso è utile conoscere quale valore lascia una determinata percentuale di osservazioni al di sotto o al di sopra del valore stesso. Tale misura è chiamata percentile dei dati! Definiamo percentili quei valori che dividono la distribuzione in cento parti di uguale numerosità Il p-simo percentile di un insieme di dati è il valore per cui una percentuale pari a p delle osservazioni è inferiore o uguale ad esso Frequentemente sono usati il 25° e 75° percentile di un insieme di dati: - nel 1° caso è il valore per cui una percentuale pari a 25 delle osservazioni è inferiore o uguale ad esso (detto primo quartile); - nel 2° caso è il valore per cui una percentuale pari a 75 delle osservazioni è inferiore o uguale ad esso (detto terzo quartile); Possiamo quindi…… definire i quartili. Il primo quartile Q1 è un valore tale che il 25% delle osservazioni è inferiore o uguale a esso; Il secondo quartile Q2 è un valore tale che il 50% delle osservazioni è inferiore o uguale a esso (coincide con la mediana); Il terzo quartile Q3 è un valore tale che il 75% delle osservazioni è inferiore o uguale a esso. Il calcolo dei quartili può essere laborioso! Ne usiamo uno + semplice, anche se non propriamente corretto ma che dà valori molto vicini a quelli dei metodi più rigorosi!!! I quartili dividono l’insieme dei dati in quattro parti uguali. La mediana divide i dati a metà e se si prende la metà di una metà si ottiene un quarto! Vediamo le varie fasi: Fase 1: Ordinate i dati e trovate la mediana; Fase 2: Considerate la metà inferiore dei dati (tutti i valori che sono al di sotto della mediana) e trovatene la mediana. Il valore che si ottiene è il primo quartile Q1; Fase 3: Considerate la metà superiore dei dati (tutti i valori che sono al di sopra della mediana) e trovatene la mediana. Il valore che si ottiene è il terzo quartile Q3. 17 1. Percentili- caratteri suddivisi in classi: Per caratteri le cui modalità sono distribuite in classi oltre alle mediane, si possono calcolare anche i percentili: … INDICATORI STATISTICI DI VARIABILITÀ LEZIONE 5 La variabilità di un fenomeno è la sua attitudine ad assumere differenti modalità. Questa si misura attraverso gli indici di variabilità. Un indice di variabilità deve soddisfare queste proprietà: Deve essere nullo quando tutti i termini della distribuzione sono uguali tra loro, cioè se non c’è dispersione; Non si deve modificare se tutte le frequenze sono moltiplicate per una costante positiva; Crescere all’aumentare della disuguaglianza tra i termini. Le misure di variabilità si possono distinguere in due categorie: • Variabilità delle singole modalità x1≤ … ≤xi≤ …≤xN rispetto ad un valore caratteristico (ad esempio, la media aritmetica, la mediana, etc.) mediante una sintesi degli scarti tra le singole modalità e il valore caratteristico di riferimento. In tal caso la variabilità è intesa come dispersione e parleremo di misure di dispersione. • Variabilità reciproca (mutua) tra tutte le modalità considerate a 2 a 2. In tal caso la variabilità è intesa come disuguaglianza e parleremo di misure di disuguaglianza. Un semplice indice di variabilità è dato dal Campo di variazione, definito come la differenza tra il valore massimo e il valore minimo delle modalità di X: Range (X) = max (X)- min(X) Limite: tale misura è influenzata da valori atipici (perché molto alto o molto basso rispetto a tutti gli altri valori), i cosiddetti outliers. Misure di dispersione: Data la successione di valori reali x1≤ … ≤xi≤ …≤xN e calcolato un valor medio, ad esempio la media aritmetica , possiamo considerare le seguenti differenze: x1 -, x2 -, x3 - , …, xi - , …, xN -  Oss.: Se non esistesse variabilità o diversità tra le xi queste N differenze sarebbero tutte nulle. Il grado di questa variabilità può essere stimato in diversi modi. e calcolato un valor medio, ad esempio la 20 Limite: Tale indice non è adatto a misurare l’asimmetria nel caso di distribuzioni plurimodali. 2. Coefficiente di asimmetria di Fisher 1: Un altro indice proposto è quello di Fisher, maggiormente utilizzato, è quello che fa ricorso al terzo momento della media ed è dato da: BOXPLOT Grafici a scatola (Boxplot): Un modo per rappresentare graficamente la variabilità di una distribuzione è dato dal box- plot. Il box-plot è un grafico caratterizzato da tre elementi: -Una linea o punto, che indicano la posizione da una media della distribuzione (anche mediana); -Un rettangolo (box) la cui altezza indica la variabilità dei valori “prossimi” alla media (percentili); -Due segmenti che partono dal rettangolo e i cui estremi sono determinati in base ai valori estremi della distribuzione (campo di variazione). Ad esempio, come media si può prendere la mediana, come altezza del box la distanza interquartile e come estremi dei segmenti il valore minimo e massimo osservati: Una scatola centrale che si estende tra i quartili Q1 e Q3, Una linea nella scatola che riporta la Mediana (Me), Due linee verticali che escono dalla scatola fino alle osservazioni più piccole e più grandi. 21 … vedi slide lezione 5 numero 37-38-39… ASSOCIAZIONE TRA DUE O + CARATTERI LEZIONE 6 Analisi dell’associazione tra due (o +) caratteri: Introduzione da un punto di vista statistico dei concetti di: Dipendenza, Indipendenza e Interdipendenza (tra due (o +) caratteri statistici congiuntamente considerati). Si occupa di indagare le relazioni che intercorrono fra due (o più) caratteri rilevati sullo stesso collettivo di unità statistiche. Esempi: Mediante l’analisi statistica non si pretende di individuare le “leggi” che definiscono i legami tra i fenomeni, ma di verificare l’esistenza o meno di regolarità nell’associazione tra le modalità dei caratteri osservati: Relazione fra livello di soddisfazione di un cliente (qualitativo) e la sua zona residenziale (qualitativo), Relazione fra provincia di residenza (qualitativo) e livello di reddito (quantitativo), Relazione fra voto di maturità (quantitativo) e voto all'esame di statistica (quantitativo). Quali analisi statistiche? Due principali tipi di decisione: -Quali relazioni ci sono fra variabili? Le variabili sono qualitative? (chi-quadro, V di Cramer), Le variabili sono quantitative (correlazione o correlazione parziale). -Quali differenze ci sono tra due gruppi? T-test, Anova. Supponiamo di voler sintetizzare in una tabella il risultato di una rilevazione statistica in cui abbiamo analizzato il carattere X ed il carattere Y riportando le frequenze congiunte: TABELLA DI FREQUENZE A DOPPIA ENTRATA DISTRIBUZIONE DOPPIA DI FREQUENZE. Indipendenza statistica: Il carattere X si dirà indipendente da Y se, qualunque sia la modalità con cui si manifesta il carattere Y, la distribuzione relativa condizionata di X non cambia. Se X è indipendente da Y allora anche Y è indipendente da X. Due caratteri, X e Y, si dicono indipendenti se le distribuzioni relative condizionate di un carattere rispetto alle modalità dell’altro sono tra loro uguali. L’indipendenza tra due caratteri si verifica esaminando le frequenze con cui si presentano le modalità di entrambi i caratteri. Affinché esista indipendenza tra i due 22 caratteri è necessario che le frequenze relative delle distribuzioni condizionate siano uguali tra loro e uguali alle frequenze marginali relative. La connessione e le contingenze: Se due caratteri non sono statisticamente indipendenti si dicono connessi. Per misurare l’associazione possiamo confrontare le frequenze teoriche in una situazione di indipendenza con quelle osservate effettivamente nei dati. In pratica si misurano le differenze fra le frequenze osservate e quelle teoriche (cioè ottenute nel caso di indipendenza fra i due caratteri). Queste differenze vengono chiamate contingenze. È possibile costruire degli indici (basati sull’analisi delle contingenze di una tabella doppia) per vedere se fra due caratteri di qualsiasi tipo (ma vengono usati soprattutto per i caratteri qualitativi) via sia o meno una dipendenza. Gli indici sono: il chi-quadrato di Pearson e l’indice V di Cramer. Oss.: La somma di tutte le contingenze è sempre nulla e quindi un indice di associazione non può basarsi sulle differenze semplici, perciò si considerano i quadrati. Tuttavia, la somma può essere usata per controllare di avere fatto i conti giusti! Chi-quadrato di Pearson: Per due caratteri perfettamente indipendenti tutte le contingenze devono essere nulle e quindi il chi-quadrato avrà valore nullo. Se i due caratteri sono associati l’indice è positivo e sarà tanto più positivo quanto più le frequenze osservate saranno diverse da quelle teoriche. 25 1. Concentrazione: In alcune situazioni può non essere sufficiente basarsi sul calcolo di indici di variabilità per discriminare due popolazioni. In particolare, quando le unità statistiche sono individui e il carattere osservato è un carattere quantitativo trasferibile come la ricchezza, può aver senso chiedersi se la ricchezza sia equamente distribuita tra gli individui oppure essa è concentrata nelle mani di alcuni. La concentrazione Si misura su caratteri quantitativi trasferibili (non ha senso farlo per l’età o gli anni di istruzione). Osservati n valori ordinati di una variabile X, x1  x2  ...  xn si è interessati a studiare come l’ammontare del carattere sia ripartito fra le diverse unità statistiche. Si possono avere due situazioni estreme: equidistribuzione (ognuna delle n unità possiede dell’ammontare complessivo del carattere, ossia: xi = A/n = Xi per i= 1, 2…, n) e massima concentrazione (’intero ammontare del carattere è posseduto da una sola unità: x1 = x2 = ... = xn−1 = 0- xn = A). La curva di Lorenz: 26 RAPPORTI STATISTICI- per gli studi turistici 1. Rapporti di composizione (o di parte al tutto): I rapporti di composizione mettono in relazione l’intensità o frequenza di due fenomeni uno dei quali (numeratore) può considerarsi una parte dell’altro (denominatore). Essi mettono in relazione l’intensità o la frequenza di una modalità del fenomeno (carattere) con l’intensità o frequenza del fenomeno complessivo. Tra i rapporti di composizione più frequenti vi sono le frequenze relative di una distribuzione statistica. Essi indicano l’incidenza, generalmente espressa in termini percentuali, che quella modalità ha sul fenomeno totale. Ad esempio: la composizione percentuale della forza lavoro rispetto al sesso, o al titolo di studio più elevato posseduto. 27 2. Rapporti di coesistenza: Ora vogliamo sapere quanti sono i pernottamenti per vacanza in rapporto al numero di pernottamenti per altri motivi! Costruiremo un: Si tratta di un rapporto tra due “parti” che, se unite insieme, darebbero luogo alla totalità dei casi. Essi mettono in relazione le intensità o frequenze di uno stesso fenomeno in luoghi diversi (n° degli emigrati italiani in California e in altri Stati Americani); oppure di due fenomeni diversi in uno stesso luogo (rapporto di mascolinità). 3. Rapporti di derivazione: Molto utilizzati in Demografia, tali rapporti mettono in relazione l’intensità di un carattere con quella di un altro che può essere considerato presupposto necessario del primo. Sono detti di derivazione in quanto la quantità a numeratore deriva logicamente dalla quantità posta al denominatore. In genere la quantità a: numeratore è un dato di flusso (riferito ad un certo intervallo di tempo), denominatore è un dato di stato (riferito ad un certo istante di tempo). 4. Rapporti di densità: Particolare tipo di rapporto di derivazione. Sono definiti mediante il confronto tra la dimensione globale di un fenomeno (al numeratore) e la dimensione spaziale, temporale o caratterizzante cui esso fa riferimento (al denominatore). Oss.: Con riferimento al tempo diventano rapporti di frequenza; ad es. i passaggi orari di autoveicoli ad un certo casello autostradale. Ad esempio, la densità della popolazione residente rispetto alle regioni o alle province la densità della popolazione è data da: popolazione residente/superficie del territorio. 30 2. Numeri indici complessi: Sintetizzano in un unico indice le variazioni subite dai diversi fenomeni. Due metodi di costruzione: calcolo del numero indice delle somme ponderate delle intensità o frequenze (metodo delle somme ponderate); calcolo del numero indice delle somme ponderate delle intensità o frequenze (metodo della media ponderata). Indichiamo con: Classe formata da M singoli beni con prezzi unitari rilevati al tempo t pari a. Quantità del bene m-esimo (riferita ad un periodo medio o rappresentativo a) è indicata con qma. Il prezzo del bene m-esimo nel periodo preso come base con pm0. La spesa complessiva per gli M beni nel periodo t e nel periodo base è data da: Il numero indice percentuale dei prezzi per il periodo t con il metodo delle somme ponderate è: Perché ponderare? Supponiamo di avere 2 beni che hanno un consumo molto diverso. Esempio: Andamento del prezzo dei biglietti di attività ricreative (cinema, teatro ed eventi sportivi). Il prezzo del cinema si aggira intorno ai 7 euro, quello del teatro intorno ai 15 euro, quello dello stadio intorno ai 35 euro. In assenza di pesi il prezzo del biglietto dello stadio peserebbe di più sull’andamento dei prezzi, ma ponderando i prezzi con le quantità diamo più peso ai prezzi del biglietto del cinema che è più frequente. 3. Numeri indici dei prezzi: 31 4. Numeri indici delle quantità: ANALISI ELEMENTARE DELLE SERIE STORICHE LEZIONE 9 Le serie storiche, sviluppatesi maggiormente negli ultimi 35 anni, sono molto importanti nell’ambito delle metodologie statistiche applicate alle scienze sociali, e soprattutto a quelle economiche. In economia: - Analisi delle variazioni ora per ora dei prezzi sui mercati finanziari - Studio dei cicli lunghi dell’economia; In ambito turistico: - Analisi delle presenze turistiche mensili in una città. Obiettivi dell’analisi delle serie storiche: • Descrizione: sintetica dell’andamento del fenomeno. • Spiegazione: individuazione del meccanismo generatore della serie e delle relazioni tra il fenomeno osservato ed altri fenomeni. • Previsione: inferenza sui valori futuri del fenomeno in base alla sua storia passata. Una serie storica o serie temporale (dall’inglese time series) è una serie di valori di una variabile Y, rilevati nel tempo, cioè in istanti di tempo diversi, che si susseguono uno dall’altro, in genere, equidistanti tra loro. N.B.: caratteristica peculiare delle serie storiche è che l’ordine dei dati non è indifferente => successione ordinata delle osservazioni Esempi: Y(t): serie delle precipitazioni piovose nel corso del 2008/Y(t): serie dei prezzi delle camere di un albergo negli ultimi 10 anni. 32 Analisi classica delle serie storiche: Uno degli aspetti più utili delle serie storiche è quello di “riconoscere” nella dinamica temporale dei dati (in diminuzione o in aumento) alcuni “fattori causali” ben riconoscibili o “eventi-chiave”. Oss.: in molte analisi risulta difficile distinguere con precisione tra trend e ciclo, allora si parlerà di un’unica componente trend-ciclo T(t): trend - C(t): ciclo=trend-ciclo Oss.: La stagionalità ha una notevole importanza nell’ambito dei fenomeni turistici S(t): stagionalità Modelli di combinazione delle componenti: Si vuole enunciare un modello (Per modello si intende un enunciato formale che si suppone aderire, nel miglior modo possibile, alla “forma” empirica dei dati osservati) statistico di analisi, ovvero una “legge di composizione” che permetta di mettere in relazione fra loro le varie componenti. -Modello additivo: Y(t) = T(t) +C(t) + S(t) + E(t) -Modello moltiplicativo: Y(t) = T(t)C(t) S(t) E(t) -Modello misto: Y(t) = [T(t)C(t) S(t)]+ E(t) -Modello moltiplicativo: Y(t) = T(t)C(t) S(t) E(t) N.B.: Il modello moltiplicativo può essere ricondotto ad un modello additivo mediante trasformazione logaritmica: logY(t) = logT(t) + logC(t) + log S(t) + logE(t) 35 Rapporto di correlazione: considerando la scomposizione della varianza, si può definire l’indice relativo di dipendenza in media, cioè il RAPPORTO di CORRELAZIONE: INDIPENDENZA TRA CARATTERI QUALITATIVI LEZIONE 11 Misura dell’indipendenza tra due caratteri qualitativi: Un caso molto rilevante nelle applicazioni riguarda l’analisi dell’associazione tra due caratteri quantitativi. Covarianza: media dei prodotti degli scostamenti delle variabili X e Y dalle rispettive medie: i caratteri presentano concordanza se la maggior parte degli scostamenti sono concordi; I caratteri presentano discordanza se la maggior parte degli scostamenti sono discordi. Possiamo riscriverla: 36 Le proprietà della covarianza sono: se due caratteri sono indipendenti la covarianza è nulla; la covarianza dipende dall’unità di misura delle osservazioni (non si può confrontare la covarianza per diverse distribuzioni doppie); trasformare la covarianza in un indice relativo (è necessario analizzare il campo di variazione della covarianza). Correlazione: La covarianza può assumere valori all’interno di: …si può introdurre un indice relativo: −1  XY 1 Il coefficiente di correlazione lineare di Bravais e Pearson: Le proprietà della correlazione sono: −1  XY 1;  XY =1 se tra Y e X esiste un perfetto legame lineare e X e Y sono concordi;  XY = −1 se tra Y e X esiste un perfetto legame lineare e X e Y sono discordi;  XY = 0 se Y e X sono indipendenti o se la loro relazione non è lineare. RILEVAZIONI STATISTICHE, QUESTIONARIO E FONTI STATISTICHE LEZIONE 12 Il reperimento di informazioni statistiche: Informazioni già disponibili (FONTI STATISTICHE); Informazioni da ottenere ad hoc (INDAGINE STATISTICA); 1. Informazioni già disponibili (FONTI STATISTICHE) - Raccolte a fini specifici Es. se siamo interessati alle strutture ricettive presenti in Toscana è possibile consultare i dati pubblicati dall’Istat sull’annuario di statistiche del turismo relativi all’indagine sulla consistenza delle strutture ricettive -Raccolte per altri fini (dati amministrativi, censuari) Es. Per avere una stima degli escursionisti è possibile consultare le statistiche sul numero di ingressi agli istituti d’arte pubblicate dal Min. Beni Culturali (per altri scopi!). 2. Informazioni da ottenere ad hoc: Quando si vuole disporre di informazioni più precise e mirate rispetto agli obiettivi (es. motivazioni, atteggiamenti, opinioni dei turisti). - INDAGINE STATISTICA Rilevazioni: Sperimentali/Osservazionali: 1. Sperimentali (Medicina, Fisica, Chimica): Ipotesi di lavoro, Possibilità di controllo/Controllo: Diretto dei Fattori Sperimentali e dei Fattori di Stratificazione; Indiretto: Randomizzazione. 2. Osservazionali (Indagini di mercato, sondaggi): Non si ha la possibilità di controllo/ indagine statistica. Indagini statistiche: Indagine Totale/Indagine Campionaria ✓ Fasi dell’indagine: definizione degli obiettivi (definizione delle unità e delle variabili da rilevare, scelta del periodo di riferimento); individuazione della popolazione e della lista delle unità statistiche; definizione del piano di campionamento; raccolta dei dati (scelta della tecnica di rilevazione, formulazione del questionario e pretest, rilevazione sul campo); registrazione dei dati (registrazione su supporto magnetico, controllo e correzione) elaborazione e analisi dei dati. Un’indagine che rileva dati da tutto l’universo viene chiamato censimento (Esempio: censimento della popolazione ogni dieci anni in Italia o quello dell’agricoltura). Un’indagine che considera solo una parte della popolazione esaminata viene chiamata indagine campionaria. ✓ Vantaggi delle rilevazioni campionarie: Costi minori  Tempi più brevi (per problemi urgenti)  L’attendibilità delle informazioni ottenibili da un campione può essere misurata e controllata  Si possono chiedere più 37 informazioni  Fondamentale quando l’intervista deteriora o distrugge l’unità statistica (test di affidabilità dei freni delle automobili). La rilevazione dei dati: La raccolta delle informazioni può essere completa oppure parziale. o È completa quando si esaminano tutte le unità statistiche che compongono la popolazione oggetto di studio. (Pregi: Accuratezza delle stime anche a livelli territoriali molto spinti, Ricchezza delle informazioni raccolte, Esaustività--Difetti: Costo elevato, Tempi di elaborazione dei dati molto lunghi, Qualità dei dati non elevata). o È parziale quando ci si limita a studiare un sottoinsieme, detto “campione” dell’insieme di riferimento. (Pregi: Continuità della rilevazione, Economicità, Indagini più mirate e approfondite--Difetti: Riferimento territoriale non spinto, Variabilità campionaria). Statistica descrittiva e inferenza: La statistica descrittiva fornisce gli strumenti per sintetizzare ed esplicitare in forma corretta il modo in cui il fenomeno si è manifestato nel collettivo osservato; Mediante l’inferenza statistica è possibile misurare e controllare l’attendibilità delle informazioni provenienti da un campione-> estrazione del campione. Estrazione del campione: • Campionamento casuale: insieme di tutte quelle tecniche di formazione del campione in cui la selezione delle unità è affidata a regole probabilistiche. • Campionamento casuale semplice: i campioni della stessa dimensione estraibili da una popolazione hanno uguale probabilità di essere estratti. • Campionamento casuale stratificato: la popolazione viene suddivisa in un certo numero di strati. Da ogni strato in maniera indipendente viene poi estratto un campione casuale semplice. Progettazione del questionario: • Concettualizzazione: si individuano le entità che entrano in gioco, si descrivono le relazioni esistenti fra le entità e si individuano le possibili gerarchie fra le relazioni; • Individuazioni aree e sottoaree; • Contenuti, formulazione e successione logica delle domande (ES. ad imbuto o ad imbuto capovolto). -Redazione del questionario:  Codici identificativi:  Per identificare il rispondente  Per identificare l’intervistatore  Codici territoriali (regione, provincia, comune…)  Quesiti su caratteristiche strutturali  Sesso, età, titolo di studio, occupazione…  Dipendono dalla popolazione d’indagine e dagli obiettivi dell’indagine  Quesiti specifici  Volti al perseguimento degli obiettivi dell’indagine  fase più delicata  Quesiti per il controllo della qualità dei dati  chi è il rispondente nella famiglia, quesiti per cogliere il livello di interesse dell’intervistato… 1. Definizione degli obiettivi: Esplicitare le finalità dello studio per identificare soprattutto: Il collettivo statistico, Le unità statistiche, Le variabili da rilevare. 2. Periodo di riferimento: A quale periodo devono essere riferite le informazioni? Indagine puntuale, retrospettiva e longitudinale. 40 Offerta e domanda turistica: Da un punto di vista strettamente economico, il turismo consiste soprattutto nella messa a disposizione di risorse (naturali, storiche, umane) e nell’organizzazione di servizi. Il fenomeno turistico si compone: o OFFERTA Turistica: l’insieme delle risorse messe a disposizione, unito all’insieme dei servizi approntati perché i turisti possano fruire di tali risorse: strutture ricettive, impianti, ristoranti, aziende di promozione turistica, musei, mostre, eventi ecc. o DOMANDA Turistica: in questo caso, le risorse sono rivolte all’organizzazione di servizi tali da permettere ai propri concittadini di essere turisti, sia all’interno del proprio paese che altrove: agenzie di viaggio, tour operator, ecc. Nei confronti di questo aspetto ambivalente del turismo, i diversi paesi si situano su posizioni tra loro diversificate: segue… - Paesi tipicamente di domanda turistica (Giappone, Stati Uniti, Canada ecc.); - Paesi tipicamente di offerta turistica: l’Italia, e gli altri paesi dell’Europa meridionale e mediterranea. Le diverse vocazioni dei paesi considerati hanno finito con il riflettersi anche sulla produzione delle statistiche ufficiali. Prima della Direttiva 95/57/CE l’obiettivo era la standardizzazione delle rilevazioni e la creazione di una base informativa comune per tutti i paesi membri dell’Unione europea. In particolare, la Direttiva impone il miglioramento e l’armonizzazione delle statistiche riguardanti: a) la capacità degli alloggi turistici collettivi (alberghi, campeggi, alloggi per vacanze, ecc.); b) gli arrivi e le partenze negli alloggi turistici collettivi; c) la domanda turistica. Da gennaio 2012 le statistiche sul turismo (Istat) sono Prodotte in accordo al Regolamento UE n. 692/2011 che ha sostituito la precedente Direttiva comunitaria 95/57/CE Rispetto alla Direttiva, il regolamento è un atto legislativo vincolante che deve essere applicato in tutti i suoi elementi nell’UE -Aumento della tempestività -Aumento della comparabilità -Arricchimento dell’informazione. Il Turismo sta acquisendo sempre più un ruolo fondamentale nella creazione di crescita e occupazione nell’UE Tale industria richiede un’approfondita conoscenza: - del volume del turismo - delle sue caratteristiche - del profilo dei turisti - della spesa turistica - dei benefici per le economie degli Stati membri. Tipo di dati: 1. Dal lato della domanda turistica: ISTAT — Focus su «Viaggi e vacanze» all’interno dell’Indagine sulle spese delle famiglie; BANCA D’ITALIA — Indagine alle frontiere sul turismo internazionale dell’Italia 2. Dal lato dell’offerta turistica: ISTAT — Capacità degli esercizi ricettivi; http://www.istat.it/it/archivio/210783 Movimento dei clienti negli esercizi ricettivi http://www.istat.it/it/archivio/15073 Qualità dei dati: Le principali “componenti” della qualità del dato sono: 1. Rilevanza: Il sistema delle informazioni statistiche deve essere il più possibile adeguato alle esigenze conoscitive del soggetto che dovrà utilizzarle (un imprenditore interessato a realizzare un albergo di lusso in una certa città, dovrebbe disporre di informazioni sulle caratteristiche qualitative della clientela alberghiera tipica di quella città). 2. Accuratezza: Le misure dei fenomeni oggetto d’indagine devono essere il più possibile in accordo con le convenzioni definitorie adottate per identificarle (dati statistici che annoverassero come “turisti” un collettivo di rifugiati non potrebbero certo essere considerati accurati). 41 3. Attendibilità: Le modalità con le quali un fenomeno viene misurato devono essere sufficientemente perfezionate, in modo tale che il dato fornito risponda effettivamente a una misura dell’”oggetto” che si sta studiando. In caso di indagine retrospettiva (ad es., dopo un anno che è avvenuto il fenomeno da investigare), dobbiamo aspettarci nelle risposte dei soggetti interessati la presenza di errori dovuti a ricordi approssimativi o erronei. In questi casi è importante conoscere quantomeno l’entità dell’errore che si sta compiendo (nelle indagini campionarie è presente l’errore di campionamento, ma è un errore noto e si può valutarne l’entità). Inoltre, è opportuno, per quanto possibile, cercare di rendere minimo l’insieme degli errori (sia campionari che di altra natura). Solo così potrà essere garantita l’attendibilità del dato in questione. 4. Tempestività: I dati devono essere messi a disposizione degli utilizzatori in tempi ragionevolmente adeguati a un loro impiego proficuo; anche la periodicità delle indagini deve essere adeguata al fenomeno considerato (tassi di inflazione noti dopo un anno sarebbero inutili!). 5. Coerenza: Un dato statistico che si propone di misurare un fenomeno deve sempre essere confrontabile con un dato che misuri lo stesso fenomeno, ma che provenga da una fonte diversa rispetto a quella che stiamo considerando (questo presuppone che siano costruiti con modalità tra loro non troppo dissimili). Pregi e difetti del “sistema” italiano: I problemi principali delle statistiche italiane sul turismo non sono dovuti tanto al fatto che mancano i dati, ma piuttosto ai difetti intrinseci legati alle modalità stesse della loro rilevazione. Tutto questo nasce dal comune vizio d’origine di molte statistiche italiane sul turismo: il fatto che tali statistiche sono sostanzialmente di derivazione amministrativa, con tutti gli elementi di rigidità che questo comporta. La carenza più rilevante riguarda la rilevanza dei dati statistici sul turismo, ovvero la capacità dei dati di rilevare e misurare concretamente tutti i possibili aspetti del fenomeno. Le lacune principali riguardano: - gli escursionisti (ovvero i viaggiatori che soggiornano in un luogo per meno di un giorno) verso i quali non è rivolta nessuna indagine (gli unici dati al riguardo sono costituiti dalle stime). - Presenze turistiche negli alloggi privati (misura delle presenze turistiche negli alloggi privati (seconde case) e negli alloggi ceduti in affitto ma non iscritti al Registro degli esercenti il commercio; presenze turistiche delle quali non si dà conto in alcun modo nelle fonti ufficiali) -carenze informative (Le statistiche sui flussi turistici negli esercizi ricettivi, essendo una rilevazione essenzialmente di tipo amministrativo, non forniscono alcuna informazione sulla tipologia della domanda (caratteristiche e “profilo” dei clienti, tipologia dei servizi utilizzati ecc.). - aspetti qualitativi del turismo straniero (nel sistema italiano è molto carente l’acquisizione di informazioni sugli aspetti qualitativi del turismo straniero (caratteristiche sociodemografiche, durata e tipologia del viaggio, mezzi di trasporto utilizzati, motivazioni, gusti, esigenze ecc.), che si limita in sostanza alle sintetiche informazioni raccolte dall’indagine campionaria dell’UIC). -frequenza delle indagini (aspetto che spesso, soprattutto in passato, è stato curato poco dalle fonti ufficiali italiane è quello della frequenza delle rilevazioni e delle indagini, in alcuni casi effettuate con intervalli troppo lunghi e a volte anche irregolari. L’ISTAT, nel corso degli ultimi anni, ha revisionato il sistema delle statistiche sul turismo, a seguito del regolamento europeo in materia di statistiche del turismo.
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved