Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

Domande Bertorelle Biostatistica, Prove d'esame di Biostatistica

Domande di esercitazione biostatistica

Tipologia: Prove d'esame

2020/2021

In vendita dal 14/07/2022

Dianavitro
Dianavitro 🇮🇹

4.5

(4)

6 documenti

Anteprima parziale del testo

Scarica Domande Bertorelle Biostatistica e più Prove d'esame in PDF di Biostatistica solo su Docsity! 1 DOMANDE BIOSTATISTICA 1) La statistica inferenziale permette di (più risposte corrette) a) calcolare media e ds di un campione b) estendere le conclusioni riferite al campione sull'intera popolazione c) svolgere un test statistico e calcolare il p value d)costruire una distribuzione di frequenza e) concludere per esempio che un farmaco funziona con una certa probabilità di errore f) calcolare un IC g) costruire uno scatterplot 2) In una stima imprecisa ma NON distorta a) ripetendo molte volte la stima e facendo la media delle stime ottengo il valore vero da stimare b) NON ottengo il valore vero da stimare c) ripetendo molte volte la stima ottengo stime molto simili 3) Confrontando in diverse spiagge del mondo il numero di attacchi di squali e le quantità di rifiuti prodotti dai bagnanti, si osserva un 'associazione positiva. Questo potrebbe ragionevolmente indicare che (più risposte corrette) a) gli squali sono attratti dai rifiuti b) i bagnanti consumano + cibo e producono + rifiuti xche hanno paura degli squali c) probabilmente esiste una variabile di confondimento d) l'associazione non è significativa e) lo studio è osservazionale e quindi l'associazione potrebbe non indicare un 'associazione di causa- effetto 4) La lunghezza di una certa specie di pesci in un campione di 15 animali risulta pari a 22,3 cm convarianza pari 2,5 cm2, calcolare se possibile a) Deviazione Standard b) mediana c) coefficiente di variazione d) differenza interquartile e) Intervallo di confidenza al 99% 5) In uno studio statistisco con 4 gradi di liberta, la statistica test chi quadrato è risultata pari a 10,5. utilizzando la tavola statistica identificare il range corretto del p value a) fra 0,95 e 0,05 b) fra 0,05 e 0,25 c) fra 0,25 e 0,01 d) fra 9,41 e 11,14 6) Classificare le seguenti variabili in un campione di pesce palla co= cat ordi cn= cat nominali nd=numeriche discrete nc= numeriche continue peso diametro colore specie sesso livelli di aggressività (basso medio alto) numero di prede mangiate in un giorno 7) In una tabella di contingenza 2 x 3 due celle contengono un numero di osservazioni attese uguale a 4 (altre cellule numerosità maggiore di 10). Le assunzioni per svolgere un test del chi quadrato a) non sono soddisfatte b) sono soddisfatte c) sono incerte d) non sono significative e) dipendono dal p value 2 8)Per ciascuno dei p value indicati identificare la conclusione corretta ( assumendo alfa 0,05) tra le seguenti : rifiuto H0, non rifiuto H0, il calcolo del p-value è errato a) 0,041 b) 0,013 c) 0,264 d) 1,122 e) 0,062 9) L’errore di tipo II è un errore che si compie quando: a) Si rifiuta l’ipotesi nulla vera b) Non si rifiuta un’ipotesi nulla falsa c) Si accetta un’ipotesi nulla, vera o falsa che sia d) Si utilizza una statistica inappropriata 9) Assumete che gli investimenti di caprioli lungo una certa strada avvengano con la stessa probabilità lungo tutta la sua lunghezza, e con una media di 0,2 investimenti per km all’anno. Quale sarà la probabilità che monitorando un tratto di 1 km per un anno con una serie di telecamere venga osservato almeno 1 investimento? (Qual è la distribuzione di eventi casuali nel tempo o nello spazio? a) 0,82 b) 0,20 c) 0,18 d) 0,16 ESERCIZI 1) Viene sottoposta la stessa domanda dell’es. 27 p.5 a 10 studenti di biologia iscritti all'università de balocchi. 4 di loro rispondono correttamente. Utilizzando il test binomiale è possibile rifiutare l'H0 che le risposte vengono scelte a caso? Svolgere i calcoli. 2) Le due specie di moscerino (drosophila melanogaster e willinstoni) si assomigliano molto. In un esperimento vengono osservate 5895 coppie in riproduzione delle quali i maschi e le femmine appartenevano alle due specie dm e dw secondo la tabella Femmina dm Femmina dw Maschio dm 5567 84 Maschio dw 72 172 Verificare H0 secondo cui i maschi e femmine di questi moscerini scelgono il partner con cui accoppiarsi indipendentemente dalla specie. 3) Si vuole confrontare la risposta olfattiva in un uomo e in un gorilla ad uno specifico ferormone femminile. In un gruppo di 6 uomini, la risposta media è stata 0,87 con ds 0,31. In un gruppo di 6 gorilla, la riposta media è di 1,51 con ds 0,25. Assumendo che la variabile abbia una distribuzione normale in entrambe le popolazioni utilizzate il test F per verificare se esistono differenze significative - f 1,54 rifiuto ho - f 1,24 non rifiuto ho - f 1,54 non rifiuto ho - f 1 24 rifiuto ho - f 0,034 non rifiuto ho 5 17) Su un totale di 60 coleotteri catturati in natura, 15 sono stati trovati nelle trappole a caduta, 25 nelle tappe innescate con feromoni, e 20 in trappole innescate con zucchero. Se vuole capire se convenga utilizzare un certo tipo di trappole. In particolare, qual è l’ipotesi nulla da testare? a. Le trappole hanno la stessa capacità di catturare i coleotteri b. La correlazione tra trappole e catture è pari a 0 c. Le trappole non hanno la stessa capacità di catturare i coleotteri d. Le medie delle catture sono tutte uguali 18) Il test dei segni deve essere utilizzato al posto del test t di Student quando: a. I dati non hanno una distribuzione normale b. Il numero di osservazioni è troppo grande per poter svolgere il test t di Student c. Si desidera svolgere un test sui dati trasformati d. Si desidera avere un test più potente 19) La pseudoreplicazione si verifica quando: a. Le misure sono troppo poche b. Le misure non sono indipendenti c. Le misure sono troppe d. Le misure sono indipendenti 20) L’ipotesi nulla: a. Non viene mai accettata b. Può essere accettata in casi particolari c. Non viene mai rifiutata 21) (Fig. 14) in questa rappresentazione grafica della distribuzione campionaria di una media assumendo l’ipotesi nulla e l’ipotesi alternativa, possiamo dire che: a. La probabilità di compiere un errore di secondo tipo è superiore a quella di commettere un errore di primo tipo b. La probabilità di compiere un errore di primo tipo è uguale a quella di commettere un errore di secondo tipo c. La probabilità di compiere un errore di primo tipo è superiore a quella di commettere un errore di secondo tipo 22) Uno studio considera il peso come variabile. Questa è una variabile: a. Numerica continua b. Categorica nominale c. Numerica discreta d. Categorica ordinale 23) Se maschi e femmine sono in ugual proporzione nella popolazione, allora la probabilità di campionare 2 maschi è pari a: a. 0.25 b. 0.2 c. 0.5 d. 0.75 24) Assumete che gli investimenti di caprioli lungo una certa strada avvengano con la stessa probabilità lungo tutta la sua lunghezza, e con una media di 1.2 investimenti per km all’anno. Quale sarà la probabilità che monitorando un tratto di 1 km per un anno con una serie di telecamere vengano osservati almeno due investimenti (ovvero, 2 o più di due)? a. 0.6 b. 0.34 con Poisson c. 0.22 d. 1.2 6 25) Come spieghereste il fatto che molte variabili di tipo biologico tendono ad avere una forma a campana? a. Non c’è motivo, succede b. Queste variabili dipendono da molti fattori c. È la forma distributiva più nota d. Queste variabili dipendono da pochi fattori 26) Perché è più conveniente svolgere un test per t appaiati (se le assunzioni sono verificate) rispetto ai test dei segni? a. È meno distorto b. È più potente c. Il calcolo è più semplice d. Fa meno assunzioni 27) In un test t per un campione, per esempio H0 : µ = 10 e utilizzando a = 0.05, sappiamo già in partenza che: a. 5% delle volte concluderemo che la media della popolazione campionata è pari a 10 anche se tale media fosse diversa da 10 b. 95% delle volte l’ipotesi nulla è corretta c. 5% delle volte concluderemo che la media della popolazione campionata non è pari a 10 anche se tale media fosse proprio pari a 10 d. 5% delle si giungerà ad un’inferenza corretta e. 95% delle volte si giungerà ad un’inferenza incorretta 28) Uno studioso vuole capire se, nei delfini (DE), i maschi apprendono più velocemente delle femmine in un certo esercizio. Per questo misura in 10 maschi e 10 femmine (MF) il numero di giorni (NG) necessari per imparare un certo compito, e quindi confronta le due medie (ME) con un test statistico. Abbinare le parole sottolineate ai termini corretti tra popolazioni (a), campioni (b), variabile (c), stime (d), confondimento (e), binomiale (f). a. DE-a; MF-b; NG-c; ME-d b. DE-b; MF-f; NG-e; ME-a c. DE-a; MF-b; NG-e; ME-d d. DE-b; MF-a; NG-f; ME-d 29) Per verificare se la pendenza di una retta di regressione è significativamente diversa da 0, è possibile utilizzare: a. Un test del Chi-quadrato b. Un test F c. Un test t d. Un test binomiale 30) Una variabile di confondimento a. Può confondere gli errori di primo e di secondo tipo b. Può distorcere relazioni di causa-effetto c. Può distorcere la correlazione tra due variabili d. Può confondere il ricercatore 31) Il P-value in un confronto tra le medie calcolate in due campioni è risultato pari a 0.33. Questo risultato indica che: a. Non è possibile rifiutare l’ipotesi nulla b. Esiste una forte evidenza contro l’ipotesi alternativa c. L’ipotesi nulla è corretta d. L’evidenza contro l’ipotesi nulla è forte 32) Calcolare la probabilità di commettere almeno un errore di I tipo svolgendo 10 test indipendenti, assumendo che il livello di significatività di ogni test sia fissato a 0.05 a. 0.95 b. 0.4 c. 0.6 d. 0.5 e. 0.05 7 33) I campioni di convenienza tendono generalmente ad essere: a. Imprecisi b. Casuali c. Distorti d. Precisi e. Corretti 34) È stato misurato il peso di cinque semi provenienti da due coltivazioni sperimentali, chiamate <> e <>. Il ricercatore vuole determinare se vi è una differenza significativa nel peso dei semi delle due coltivazioni, quale ipotesi nulla deve considerare? a. Non vi sono differenze significative tra il peso dei semi premiere e il peso dei semi super b. Il peso dei semi premiere è minore del peso dei semi super c. Il peso dei semi premiere è maggiore del peso dei semi super d. Vi sono differenze significative tra il peso dei semi premiere e il peso dei semi super 35) Con una tabella di contingenza si studia: a. L’associazione tra due variabili categoriche b. La differenza tra varianze c. La differenza tra medie d. L’associazione tra variabili numeriche 36) Il test dei segni implica lo svolgimento di: a. Un test binomiale b. Un test del Chi-quadrato c. Una trasformazione dei dati d. Un’analisi della varianza (ANOVA) e. Un test t 37) Confrontando il peso in due campioni di topi alimentati con due diete diverse, si è giunti ad una media e intervallo di confidenza al 95% (della differenza) pari a 5.3 4.0 grammi. Questo risultato indica, assumendo che i topi nei due gruppi inizialmente avevano lo stesso peso medio, che: a. I pesi medi sono significativamente diversi con p-value b. Devo svolgere prima un test t per rispondere alla domanda c. I pesi medi non sono significativamente diversi con p-value d. I pesi medi sono significativamente diversi con p-value 38) Quale delle seguenti affermazioni è vera sia per la mediana che per la moda: a. Ha significato solo per variabili numeriche b. Sintetizza il grado di variabilità dei dati c. Rappresenta il valore osservato più spesso nel campione d. Non risente dei valori estremi 39) (Fig.4) la seguente distribuzione di probabilità dipende da un solo parametro. È della statistica test: a. Chi-quadrato b. F c. z d. t 40) (Fig.12) Questo schema rappresenta una stima: a. Distorta e imprecisa b. Corretta e imprecisa c. Corretta e precisa d. Distorta e precisa 10 59. I valori estremi di una distribuzione (outliers) influenzano molto: a. Solo la media b. La media e la mediana c. Solo la mediana d. Solo la moda 60. Il test del chi quadrato di bontà di adattamento a. Non più del 20% delle categorie deve avere una frequenza attesa < 1 b. Nessuna delle categorie deve avere una frequenza attesa < 5 c. Nessuna delle categorie deve avere una frequenza attesa < 1 d. Nessuna delle precedenti 61. (Fig.9) qual è il principale errore in questo grafico che potrebbe determinare un’idea sbagliata sugli andamenti delle vendite? a. Non è specificato a che cosa si riferiscono le vendite b. Bisognava lasciare i punti e non unirli con delle spezzate c. Manca la scala sull’asse delle ordinate d. Vengono rappresentate solo le vendite in un anno 62. In uno studio effettuato su un numero molto elevato di trote, è stato stimato che il numero medio di parassiti intestinali è pari a 0.88. Assumendo che presenza di parassiti sia un evento casuale, qual è la frazione stimata di trote che non hanno parassiti? a. 0.88 b. 8.8 c. 0.12 d. 0.41 63. L’errore standard misura: a. La precisione di una stima b. La dispersione di una variabile c. L’errore della variabile normale standardizzata d. La distorsione di una stima 64. Nello studio degli errori, β rappresenta: a. La probabilità di rifiutare un’ipotesi nulla vera b. L’errore di campionamento c. L’errore di primo tipo d. La probabilità di commettere errori di secondo tipo 65. Il coefficiente di correlazione a. Non dipende dall’intervallo di valori considerato b. Dipende dall’intervallo di valori considerato 66. La statistica inferenziale è fondamentale quando a. Stiamo stimando un parametro a partire da un campione b. Ci interessa capire qualcosa riguardo il campione c. Dobbiamo riassumere i dati raccolti d. Il campione coincide con la popolazione 67. Per rappresentare graficamente i valori di due variabili numeriche misurate in un campione di individui devo: a. Usare uno scatterplot b. Usare una distribuzione di frequenza c. Usare un istogramma d. Usare una tabella di contingenza 11 68. La trasformazione logaritmica dei dati a. Può essere utilizzata prima di svolgere un test non parametrico b. Può essere usata per ridurre l’errore di campionamento c. Può essere usata per migliorare l’adattamento dei dati alla gaussiana d. Si applica prima di utilizzare la distribuzione di Poisson 69. (Fig.6) nel confronto tra due medie in due campioni le cui distribuzioni dei dati sono riportate in Figura, utilizzereste: a. Un test non parametrico b. Un test di confidenza c. Un test parametrico d. Non serve un test 70. La distribuzione del numero di successi in n prove, quando le prove sono indipendenti e la probabilità di successo è la stessa in ogni prova è: a. Binomiale b. Poissoniana c. Uniforme d. Gaussiana 71. Il test di Mann-Whitney richiede: a. L’utilizzo dei logaritmi b. L’utilizzo dei ranghi c. L’utilizzo delle proporzioni d. L’utilizzo della radice quadrata 72. La distribuzione campionaria della media può essere riconosciuta a partire da un campione a. Vero b. Falso 73. Quale dimensione campionaria permetterebbe una stima della differenza tra la media di dimagrimento in 3 mesi con due diete diverse con un'incertezza non superiore a 2 kg? Assumete che la varianza del dimagrimento per entrambe le diete sia pari a 10 kg^. a) 200 individui per ciascuna dieta b) 10 individui per ciascun dieta c) 20 individui per ciascuna dieta d) 100 individui per ciascuna dieta 74. La correlazione lineare tra peso dell'animale e peso delle zanne in 10 elefanti africani è risultato pari 0.35. Assumendo che le assunzioni dell'analisi non siano violate, calcola l'errore standard di r e valutare con la statistica appropriata se questo coefficiente differisce significativamente da 0. a) Esr= 0.33, r non differisce significativamente da 0 b) Esr=0.33, r differisce significativamente da 0 c) Esr= 0.12, r non differisce significativamente da 0 d) Esr= 0.12, r differisce significativamente da 0 e) Esr= 1.1, r non differisce significativamente da 0 Calcolare ES, fare un test t (0.35/ES) 75. Il simbolo = in Excel viene utilizzato a)Alla fine di un'operazione aritmetica b) Per bloccare righe o colonne c) Per iniziare una formula d) Per produrre grafici cono colori uguali 76. La differenza tra le due seguenti distribuzioni campionarie della stima di una proporzione è: a) Il valore di p b) Il valore di n c) La forma della distribuzione d) L'intervallo di confidenza 12 77. Da sinistra verso destra, questi grafici rappresentano gli scarti: a) totali, entro gruppi, tra gruppi b) totali, tra gruppi, entro gruppi c) entro gruppi, tra gruppi, totali d) totali, tra gruppi, tra medie 78. Ordinate i quattro grafici seguenti in base al loro coefficiente di correlazione (dal coefficiente più piccolo a quello grande, attenzione al segno!) a)1,2,3,4 b) 3,1,4,2 c) 3,1,2,4 d) 2,4,1,3 79. Dopo aver estratto 100 campioni da una popolazione con media nota calcolo 100 medie campionarie e i corrispondenti Ic al 95%; osserverò che: a) tutti gli intervalli sono uguali b) tutti gli intervalli includono la media della popolazione c) circa 5 intervalli includeranno la media della popolazione d) circa 95 intervalli includeranno la media della popolazione 80. In una distribuzione di frequenza: a) è rappresentata una variabile sull’asse delle ascisse b) è rappresentata una variabile sull’asse delle ordinate c) Sono rappresentate due variabili 1.Grafico TV/aspettativa vita: l’aspettativa di vita è associata al numero di tv pro-capite 2. La potenza di un test significa: identificare correttamente un’ipotesi alternativa 3. Assunzioni correlazione: relazione lineare tra x e y, forma circ. o elli., distr. Freq. x e y sono normali→distr. Norm. bivariata (3D) 4.Grafici: dist. Freq (dati cat. = diag. A barre/ dati numerici= istogramma o dist. Freq. Cumulativa.) Ass. tra var. e diff tra gruppi (2 var cat= diagramma a barre raggruppate, mosaicplot/1 var num e 1 cat= istogramma, dist. freq. Com., a segmenti, dispersione (Scatterplot) 2 var num= Scatterplot, a linee, mappa) 5. Quale strategia permette di avere un campione completamente casuale di n studenti in una certa città dove sono presenti 4 etnie diverse? Estrarre a caso tra tutti gli studenti n numeri diversi → campione casuale estratto casualmente 6. Descrivere una strategia per ridurre la distorsione (per esempio la randomizzazione) e una strategia per ridurre ES (per esempio il bilanciamento) 7. Tasso di depressione più alto tra gli studenti che non frequentano biostatistica rispetto ai frequentanti; conclusione: il corso di biostatistica fa bene alla salute. Cos'è sbagliato nel ragionamento? Che lo studio è di tipo osservazionale quindi quelli che non frequentano potrebbero essere depressi per altri motivi 8. Quali sono le assunzioni in un test t per due campioni? La variabile deve avere distribuzione normale in entrambe le popolazioni; entrambi i campioni devono essere casuali; le varianze delle popolazioni devono essere uguali 9. ESERCIZIO: nel primo campione 16/25 maschi usurpatori attuano comportamento infanticida; nel secondo campione 10/30 maschi usurpatori sono infanticidi. Stiamo analizzando variabili di tipo categorico: infanticida/non infanticida e appartenenza a una o all'altra specie. Che test fare? Chi quadrato con tabella di contingenza 2x2: sulle righe metto le specie e sulle colonne metto infanticida/non infanticida. Esiste indipendenza tra le variabili di tipo categorico (Ho)? No, perché dovrei aspettarmi la stessa proporzione; se c'è solo correlazione allora le due variabili sono associate
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved