Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Respuestas a preguntas sobre análisis de datos: edad y origen de vinos comprados, Exámenes de Administración de Empresas

Documento que contiene respuestas a preguntas sobre el análisis de datos de una muestra de 200 compradores y la denominación de origen del vi que compran, así como su edad. Se calculan frecuencias relativas, índices de laspeyres y crecimiento salarial.

Tipo: Exámenes

2013/2014

Subido el 30/11/2014

jmmartinezdel
jmmartinezdel 🇪🇸

4 documentos

1 / 68

Toggle sidebar

Documentos relacionados


Vista previa parcial del texto

¡Descarga Respuestas a preguntas sobre análisis de datos: edad y origen de vinos comprados y más Exámenes en PDF de Administración de Empresas solo en Docsity! Respostes a l’examen Universitat Pompeu Fabra - Anàlisi de Dades Permutació Número: 1 Examen de Desembre 2014 L’examen consta de 8 exercicis diferents (Exercicis I-VIII). Els exercicis I a IV s’hauran de con- testar en les plantilles de respostes que es proveeixen. Cada pregunta compta 1 punt si es respon correctament i resta un quart de punt si la resposta és incorrecta. Aquestes preguntes es corregiran mecànicament, aix́ı que assegureu-vos d’entrar les respostes correctament a les plantilles. Els Exercicis V a VIII es contesten en fulls d’examen que s’han de lliurar. No es pot utilitzar més d’un full per pregunta i s’ha de contestar cada una en un full separat. Aquests quatre exercicis es corregiran de forma manual. Les respostes incorrectes d’aquesta part no compten negativament. Escriviu de forma clara i precisa. El total de punts a guanyar de cada exercici consta en el t́ıtol de l’exercici. Instruccions per omplir les plantilles (Exercicis I-IV) Usa sols llapis, boĺıgraf o retolador negre i omple bé les caselles. A la primera part de dalt posa sols el Nom i el Cognom, aix́ı com el grup. Omple (marcant les caselles de la plantilla) el DNI, la PERMUTACIÓ i el GRUP. DNI: el teu número de document d’identitat (si no en tens, el número que et van assignar en el moment de matricular-te). PERMUT.: Entra un 1 GRUP: Posa el número de grup (amb un 0 endavant, o sigui, 01, 02, 03 ó 04). Entra les respostes en les ĺınies de sota. Cada resposta disposa de dues ĺınies, la primera és per a la resposta correcta i la segona per anul·lar en cas d’equivocació. Exemple: Instruccions per contestar els exercicis V a VIII Contesta cada pregunta en un full separat. Pots utilitzar llapis o tinta. No t’oblidis de posar el teu nom, DNI o NIA i grup en cada full. Distribueix-te el temps adequadament! MOLT BONA SORT! Exercici 1: Consum de refrescos (10 punts) En el seu treball d’anàlisi de dades, el grup format pel Joan, la Júlia, l’Albert i la Mireia volen explicar el consum de refrescos. Per això entrevisten 10 estudiants sobre el nombre de refrescos que consumeixen durant una setmana. Amb les dades recollides construeixen el següent diagrama de caixa: En base a aquest diagrama responeu a les preguntes següents: Pregunta 1: Els 10 estudiants que s’analitzen al diagrama de caixa són (A) la dispersió (B) la població (C) la variable (D) la mostra (E) Cap de les respostes anteriors és correcta Resposta: És la mostra que té l’equip de treball per analitzar el consum de refrescos. Pregunta 2: La variable que es presenta al diagrama de caixa és (A) una variable categòrica (B) una sèrie temporal (C) una variable numèrica cont́ınua (D) una variable numèrica discreta (E) Cap de les respostes anteriors és correcta Resposta: Es tracta d’una variable numèrica discreta, el consum de refrescos sols pot agafar valors entre els números naturals positius o ser 0. Pregunta 3: Un individu en aquest conjunt de dades és (A) un estudiant entrevistat per al treball Com la mediana és una mica més de 6, el 50% dels joves consumeixen una mica més de 6 refrescos a la setmana. Exercici 2: Temps en acabar un test (6 punts) El temps que triga el seminari 103 d’Anàlisi de Dades en completar el test de seminari segueix una distribució normal, amb una mitjana igual a 15 minuts i una desviació t́ıpica igual a 4 minuts. En base a aquesta informació contesta a les preguntes següents: Pregunta 11: Quin és el percentatge aproximat d’estudiants que acaba en 17 minuts o menys? (A) 76,32% (B) 52,23% (C) 30,85% (D) 69,15% (E) Cap de les respostes anteriors és correcta Resposta: Estandaritzem: z = 17− 15 4 = 0, 5 A la taula de la distribució normal estàndard podem veure que hi ha un 69,15% dels estudiants que acaben en 17 minuts o menys. Pregunta 12: Useu la regla 68-95-99,7% per a aquesta pregunta: Si es vol premiar amb un punt extra al 2,5% d’alumnes que acaben el test més ràpid, quin seria el temps ĺımit per obtenir el premi? (A) 7 minuts (B) 3 minuts (C) 10 minuts (D) 5 minuts (E) Cap de les respostes anteriors és correcta Resposta: El 2,5% correspon a la part de la regla referent al 95%, aix́ı que això són dos desviacions t́ıpiques per sota de la mitjana: 15− 4 · 2 = 7 Es premiarà amb un punt extra als alumnes que acabin en 7 minuts o menys. Pregunta 13: Useu la regla 68-95-99,7% per a aquesta pregunta: Quin és el percentatge aproximat d’alumnes que acaba el test en 11 minuts o més? (A) 84% (B) 68% (C) 16% (D) 95% (E) Cap de les respostes anteriors és correcta Resposta: 11 és exactament una desviació t́ıpica per sota de la mitjana, per tant el percentatge és 68 + 32/2 = 84%. Pregunta 14: Quin ĺımit aproximat de temps s’hauria de posar el test perquè un 90% dels alumnes poguessin completar-lo a temps? (A) 20,12 minuts (B) 23,12 minuts (C) 15,23 minuts (D) 17,82 minuts (E) Cap de les respostes anteriors és correcta Resposta: El valor de z que deixa un 90% a l’esquerra és z = 1, 28. Necessitem determinar x perquè es compleixi: x− 15 4 = 1, 28 Per tant: x = 1, 28 · 4 + 15 = 20, 12 El test ha d’acabar en 20,12 minuts perquè aproximadament un 90% dels alumnes puguin completar-lo a temps. Pregunta 15: Un alumne amb un temps estandaritzat de realització del test igual a 1 acaba el test en (A) 19 minuts (B) 25 minuts (C) 23 minuts (D) 11 minuts (E) Cap de les respostes anteriors és correcta Resposta: Un temps estandaritzat de 1 minut correspon a un alumne amb un temps de realització del test que està una desviació estàndard per sobre de la mitjana, per tant triga 15 + 4 = 19 minuts. Pregunta 16: Un alumne que triga 23 minuts en realitzar el test, té un temps estandaritzat de realització igual a (A) -1 (B) 0 (C) 1 (D) 2 (E) Cap de les respostes anteriors és correcta Resposta: 23 són dues desviación t́ıpiques per sobre de la mitjana, per tant el temps estandaritzat és igual a 2. Exercici 3: Antiguitat a Muntam (6 punts) L’empresa de venda de mobles Muntam vol analitzar si amb l’antiguitat els treballadors munten els mobles més ràpid, i per això recullen dades sobre antiguitat i temps de muntatge d’un moble estàndar per a 6 treballadors: Treballador Temps de muntatge (minuts) Antiguitat (anys) 1 16 3 2 5 8 3 10 5 4 3 11 5 6 10 6 13 1 Mitjana 8,83 6,33 Des. t́ıpica 5,04 3,98 Mobles Muntam contracta un consultor que, usant aquestes dades, li calcula la regressión lineal següent: Temps de muntatge predit = 16, 15− 1, 16 Antiguitat En base a aquesta informació contesta les preguntes següents: Pregunta 17: Per cada any addicional d’antiguitat, les dades prediuen que (A) el temps de muntatge augmenta 16,16 minuts (B) el temps de muntatge augmenta 1,16 minuts (C) el temps de muntatge es redueix en 1,16 minuts (D) el temps de muntatge augmenta 14.99 minuts (E) Cap de les respostes anteriors és correcta Resposta: El pendent és igual a −1, 16, per tant el temps de muntatge disminueix en aquesta quantitat. Pregunta 18: El temps de muntatge predit per a un treballador que porta 2 anys a l’empresa Muntam és: (A) 13,83 minuts (A) 0,09 (B) 0,13 (C) 0,02 (D) 0,27 (E) Cap de les respostes anteriors és correcta Resposta: Hi ha 102 compradors que tenen entre 30 i 50 anys i que compren Rioja, per tant la freqüència relativa és igual a 18/200 = 0, 09. Pregunta 24: La distribució marginal corresponent a l’edat té les següents freqüències relatives (A) 0,66 0,24 0,04 0,07 (B) 0,55 0,27 0,18 (C) 0,04 0,11 0,11 (D) 0,51 0,01 0,02 0,02 (E) Cap de les respostes anteriors és correcta Resposta: Es tracta de la distribució per edats sense considerar el tipus de vi que es compra, i hi ha un total de 200 compradors, aleshores per a menys de 30 anys: 110/200 = 0, 55, 30-50: 54/200 = 0, 27, més de 50 anys: 36/200 = 0, 18. Pregunta 25: Les freqüències relatives de la distribució de vi comprat condicionada a ser més gran que 50 anys són: (A) 0,04 0,11 0,11 (B) 0,09 0,38 0,29 0,29 (C) 0,33 0,50 0,06 0,11 (D) 0,93 0,33 0,33 (E) Cap de les respostes anteriors és correcta Resposta: Tenim un total de 36 compradors que són més grans de 50 anys, dels quals 12 compren Rioja, per tant 12/36 = 0, 33, Ribera del Duero: 18/36 = 0, 50, Priorat: 2/36 = 0, 06 i Altres: 4/36 = 0, 11. Pregunta 26: Les freqüències relatives de la distribució d’edat entre els que compren Priorat és (A) 0,29 0,43 0,29 (B) 0,55 0,57 0,18 (C) 0,77 0,04 0,29 0,29 (D) 0,09 0,38 0,29 0,29 (E) Cap de les respostes anteriors és correcta Resposta: Hi ha 7 compradors de Priorat, del quals 2 tenen menys de 30 anys: 2/7 = 0, 29, 3 de 30-50 anys: 3/7 = 0, 43 i 2 tenen més de 50 anys: 2/7 = 0, 29. Pregunta 27: D’acord amb les dades, podem veure que entre els compradors de més de 30 anys (A) no hi ha relació entre l’edat i la preferència de vi (B) hi ha relació entre l’edat i la preferència de vi (C) no hi ha una preferència forta per Rioja (D) hi ha una preferència forta per Ribera del Duero (E) Cap de les respostes anteriors és correcta Resposta: Per veure si hi ha relació, hem de calcular la distribució de la preferència de vi condicionada a la edat, i obtenim les següents freqüències relatives: Edat Denominació d’origen Menys de 30 anys 30-50 anys Més de 50 anys Total Rioja 0,93 0,33 0,33 0,66 Ribera del Duero 0,02 0,50 0,50 0,24 Priorat 0,02 0,06 0,06 0,04 Altres 0,04 0,11 0,11 0.07 Total 1,00 1,00 1,00 1,00 Com podem apreciar, les distribucions condicionals són iguals per als compradors de més de 30 anys, per tant podem concloure que per a aquest grup no hi ha relació entre l’edat i la preferència pel vi. Pregunta 28: Entre el compradors de Rioja i Ribera del Duero (A) podem dir que l’edat té relació amb la compra de vins amb denominació Rioja o Ribera del Duero (B) podem dir que l’edat no té relació amb la compra de vins amb denominació Rioja o Ribera del Duero (C) no podem veure la distribució per edats (D) podem dir que els compradors més grans que 50 anys prefereixen aquestes denominacions de forma forta (E) Cap de les respostes anteriors és correcta Resposta: Per veure si hi ha relació, hem de calcular la distribució de les edats condicionada al vi que es compra, i obtenim les següents freqüències relatives: Edat Denominació d’origen Menys de 30 anys 30-50 anys Més de 50 anys Total Rioja 0,77 0,14 0,09 1,00 Ribera del Duero 0,04 0,57 0,38 1,00 Priorat 0,29 0,43 0,29 1,00 Altres 0,29 0,43 0,29 1,00 Total 0,55 0,27 0,18 1,00 Com podem apreciar, les distribucions condicionals no són iguals per als compradors de Rioja i Ribera del Duero, per tant veiem que śı que hi ha relació entre l’edat i la preferència pel vi per als compradors de Rioja i Ribera del Duero. En canvi per als compradors de Priorat i Altres no sembla haver-hi relació amb l’edat. Exercici 5: Contesta en un full a part – Cost de restaurants (5 punts) Es recull informació sobre el cost de sopar a restaurants italians de la ciutat de Barcelona i a l’àrea metropolitana: Cost per sopar (euros) Freqüències Freqüències relatives relatives (Ciutat de Barcelona) (Àrea metropolitana) 10-15 0,00 0,05 15-20 0,06 0,26 20-25 0,20 0,30 25-30 0,30 0,20 30-35 0,25 0,12 35-40 0,19 0,07 Pregunta 29: Calcula valors aproximats per al primer quartil, la mediana i el tercer quartil. Resposta: Per calcular els resums demanats és útil calcular les freqüències relatives acumulades: Cost per sopar (euros) Freqüències Freqüències relatives acumulades relatives acumulades (Ciutat de Barcelona) (Àrea metropolitana) 10-15 0,00 0,05 15-20 0,06 0,31 20-25 0,26 0,61 25-30 0,56 0,81 30-35 0,81 0,92 35-40 1,00 1 Per als restaurants de la ciutat de Barcelona el primer quartil està a l’interval 20-25, la mediana a l’interval 25-30 i el tercer quartil a l’interval 30-35. Per a l’àrea metropolitana el primer quartil està a l’interval 15-20, la mediana a l’interval 20-25 i el tercer quartil a l’interval 25-30. Per tant els valors Exercici 7: Contesta en un full a part – Llargada de components (6 punts) El 10,56 per cent del components de l’empresa Ruleman SA té una llargada que està per sobre de 340 mm, mentre que el 4,01 per cent dels components té una llarga que està sobre 348 mm. A més la distribució és aproximadament normal. Pregunta 33: Calcula la mitjana i la desviació estàndard dels components de l’empresa Ruleman SA. Resposta: A la taula de la distribució normal estàndard podem veure que el valor de z que deixa 10,56% a la dreta (89,44% a l’esquerra) és z1 = 1, 25, mentre que el valor de z que deixa 4,01% a la dreta (95,99% a l’esquerra) és z2 = 1, 75. Això ens permet plantejar les dues següents equacions: z1 = 340− µ σ = 1, 25 z2 = 348− µ σ = 1, 75 De la primera equació podem escriure: µ = 340− 1, 25σ Substitüım a la segona equació: 348− 340 + 1, 25σ σ = 1, 75 resolent obtenim σ = 16 i µ = 320. Pregunta 34: Calcula quina llargada màxima té el 5% dels components més curts. Resposta: Mirem a la taula de la distribució normal estàndard quin valor aproximat de z deixa 5% a l’esquerra y veiem que és z = −2, 57. Per tant tenim: z = −2, 57 = X − 320 16 Resolent obtenim X = 279, 88, que és la llargada màxima per al 5% de component més curts. Exercici 8: Contesta en un full a part – Índex de salaris (6 punts) Per a una empresa mitjana tenim les següens dades per als salaris dels treballadors: Any 0 Any 1 Grup Salari Nombre treballadors Salari Nombre treballadors Gestió 300 40 330 50 Qualificat 255 60 270 70 No qualificat 90 100 150 100 Pregunta 35: Calcula un ı́ndex salarial compost de Laypeyres usant l’any 0 com a base. Resposta: Per a un ı́ndex de Laspeyres hem de calcular les ponderacions per a l’any base: Gestió: 40 · 300 40 · 300 + 60 · 255 + 100 · 90 = 0, 33 Qualificat: 60 · 255 40 · 300 + 60 · 255 + 100 · 90 = 0, 42 No qualificat: 100 · 90 40 · 300 + 60 · 255 + 100 · 90 = 0, 25 També hem de calcular l’́ındex salarial simple per a cada grup, que a l’any 0 és igual a 100 i a l’any 1 és igual a: Gestió: 330 300 100 = 110 Qualificat: 270 255 100 = 105, 88 No qualificat: 150 90 100 = 166, 67 I per últim calculem la mitjana ponderada: 0, 33 · 110 + 0, 42 · 105, 88 + 0, 25 · 166, 67 = 122, 44 Per tant l’́ındex de Laypeyres agafant l’any 0 com a base és: Peŕıode Índex Any 0 100 Any 1 122,44 Pregunta 36: Indica la taxa de creixement (en percentatge) del salari entre l’any 0 i l’any 1. Resposta: La taxa de creixement en percentatge és igual a: 122, 44− 100 100 · 100 = 22, 44 o sigui 22,44%. (C) una variable categòrica (D) una variable numèrica discreta (E) Cap de les respostes anteriors és correcta Resposta: Es tracta d’una variable numèrica discreta, el consum de refrescos sols pot agafar valors entre els números naturals positius o ser 0. Pregunta 4: La mediana de la distribució és (A) 10 refrescos (B) una mica més gran de 6 refrescos (C) 4 refrescos (D) el 50% (E) Cap de les respostes anteriors és correcta Resposta: Com ens mostra el diagrama amb el śımbol dins de la caixa, la mediana és una mica més gran que 6. Pregunta 5: El recorregut o rang de variació de la variable analitzada és (A) una mica menys de 6 refrescos (B) 20 refrescos (C) de 4 a 10 refrescos (D) 17 refrescos (E) Cap de les respostes anteriors és correcta Resposta: El rang de variació és el màxim menys el mı́nim, que al diagrama de caixa podem veure que és 17 - 0 = 17. Pregunta 6: Al diagrama de caixa (A) es poden veure els cinc números resum (B) es poden veure els resums no resistents (C) es pot veure la població de l’estudi (D) es poden veure la mitjana, la desviació t́ıpica, el máxim i el mı́nim (E) Cap de les respostes anteriors és correcta Resposta: El diagrama de caixa és una representació dels cinc números resum, i de valors at́ıpics si n’hi ha. Pregunta 7: Respecte a les observacions at́ıpiques (A) no es pot veure res amb aquest diagrama (B) hi ha una observació at́ıpica, el 20 (C) hi ha 2 observacions at́ıpiques (D) no n’hi ha (E) Cap de les respostes anteriors és correcta Resposta: El diagrama de caixa representa les observacions at́ıpiques com un punt (asterisc o creu o algun altre śımbol) separat de la resta, com no hi ha podem dir que no hi ha observacions at́ıpiques. Pregunta 8: El valor màxim de consum de refrescos que s’ha observat és (A) No se sap (B) Aproximadament 10 refrescos (C) 17 refrescos (D) 20 refrescos (E) Cap de les respostes anteriors és correcta Resposta: Com podem apreciar al diagrama de caixa, la ĺınia de la dreta arriba a 17, i per tant aquest és el màxim. Pregunta 9: El 50% dels joves consumeix (A) més de 6 refrescos per setmana (B) menys de 4 refrescos per setmana (C) una quantitat que no podem determinar (D) 6 refrescos per setmana (E) Cap de les respostes anteriors és correcta Resposta: Com la mediana és una mica més de 6, el 50% dels joves consumeixen una mica més de 6 refrescos a la setmana. Pregunta 10: El 50% dels joves consumeix entre aproximadament (A) 6 i 10 refrescos per setmana (B) 10 i 20 refrescos per setmana (C) 0 i 4 refrescos per setmana (D) 4 i 10 refrescos per setmana (E) Cap de les respostes anteriors és correcta Resposta: Veiem al diagrama de caixa que el primer quartil és aproximadament 4 i el tercer quartil aproximada- ment 10, per tant entre aquests dos valors hi ha aproximadament el 50%. Exercici 2: Temps en acabar un test (6 punts) El temps que triga el seminari 103 d’Anàlisi de Dades en completar el test de seminari segueix una distribució normal, amb una mitjana igual a 15 minuts i una desviació t́ıpica igual a 4 minuts. En base a aquesta informació contesta a les preguntes següents: Pregunta 11: Quin és el percentatge aproximat d’estudiants que acaba en 17 minuts o menys? (A) 69,15% (B) 30,85% (C) 76,32% (D) 52,23% (E) Cap de les respostes anteriors és correcta Resposta: Estandaritzem: z = 17− 15 4 = 0, 5 A la taula de la distribució normal estàndard podem veure que hi ha un 69,15% dels estudiants que acaben en 17 minuts o menys. Pregunta 12: Useu la regla 68-95-99,7% per a aquesta pregunta: Si es vol premiar amb un punt extra al 2,5% d’alumnes que acaben el test més ràpid, quin seria el temps ĺımit per obtenir el premi? (A) 7 minuts (B) 3 minuts (C) 10 minuts (D) 5 minuts (E) Cap de les respostes anteriors és correcta Resposta: El 2,5% correspon a la part de la regla referent al 95%, aix́ı que això són dos desviacions t́ıpiques per sota de la mitjana: 15− 4 · 2 = 7 Es premiarà amb un punt extra als alumnes que acabin en 7 minuts o menys. Pregunta 13: Quin ĺımit aproximat de temps s’hauria de posar el test perquè un 90% dels alumnes poguessin completar-lo a temps? (A) 20,12 minuts (B) muntarà un moble en 16,15 minuts (C) muntarà un moble en 14,99 minuts (D) muntarà un moble en 1,16 minuts (E) Cap de les respostes anteriors és correcta Resposta: Per a una persona amb 0 antiguitat, la recta prediu 16, 15− 1, 16 · 0 = 16, 15 minuts. Pregunta 19: El temps de muntatge predit per a un treballador que porta 2 anys a l’empresa Muntam és: (A) 13,83 minuts (B) 16,15 minuts (C) 15 minuts (D) 12,32 minuts (E) Cap de les respostes anteriors és correcta Resposta: Utilitzem la recta de regressió: 16, 16− 1, 16 · 2 = 13, 84 Pregunta 20: Per a un treballador que portés 6,33 anys a l’empresa, i que trigués 8,83 minuts en realitzar la tasca, l’error de predicció de la recta arrodonit a un decimal (A) seria igual a 0 (B) seria negatiu (C) seria positiu (D) seria impossible de calcular (E) Cap de les respostes anteriors és correcta Resposta: Els valors suggerits són les mitjanes de la variable dependent i explicativa, per tant la recta passa per aquest punt i l’error de predicció és igual a 0. Pregunta 21: La variació en l’antiguitat a la feina dels treballadors aconsegueix explicar (A) un percentatge que no podem calcular amb aquestes dades (B) un 92% de la variació en el temps de muntatge (C) 1,16 minuts del temps del muntatge (D) un 84% de la variació en el temps de muntatge (E) Cap de les respostes anteriors és correcta. Resposta: Hem de calcular el coeficient de correlació, cosa que ens permet calcular el coeficient de determinació o mesura de bondat de l’ajust. Usant la fórmula pel pendent: b = r sy sx sabem que r = b sx sy = −1, 16 · 3, 98 5, 04 = −0, 92 El coeficient de determinació R2 és el quadrat del coeficient de correlació, o sigui R2 = 0, 922 = 0, 84 per tant s’aconsegueix explicar un 84% de la variació en el temps de muntatge. Pregunta 22: Per al treballador amb codi igual a 1, l’error de predicció o residu de la recta de regressió és igual a (A) 3,33 (B) 12,68 (C) 12,52 (D) 0 (E) Cap de les respostes anteriors és correcta Resposta: L’error de predicció és el valor real de la variable dependent menys el valor predit, és a dir y − ŷ = 16− 16, 15 + 1, 16 · 3 = 3, 33 Exercici 4: Vinoteca El Celler (6 punts) La Vinoteca El Celler vol gestionar millor el seu catàleg, i per això obté una mostra de 200 compradors i registra quina és la denominació d’origen del vi que compren i l’edat dels compradors: Edat Denominació d’origen Menys de 30 anys 30-50 anys Més de 50 anys Total Rioja 102 18 12 132 Ribera del Duero 2 27 18 47 Priorat 2 3 2 7 Altres 4 6 4 14 Total 110 54 36 200 En base a aquesta informació contesta les preguntes plantejades. Pregunta 23: Dins de la distribució conjunta, la freqüència relativa corresponent al compradors entre 30 i 50 anys que compren Rioja és igual a (A) 0,27 (B) 0,02 (C) 0,13 (D) 0,09 (E) Cap de les respostes anteriors és correcta Resposta: Hi ha 102 compradors que tenen entre 30 i 50 anys i que compren Rioja, per tant la freqüència relativa és igual a 18/200 = 0, 09. Pregunta 24: La distribució marginal corresponent a l’edat té les següents freqüències relatives (A) 0,66 0,24 0,04 0,07 (B) 0,55 0,27 0,18 (C) 0,04 0,11 0,11 (D) 0,51 0,01 0,02 0,02 (E) Cap de les respostes anteriors és correcta Resposta: Es tracta de la distribució per edats sense considerar el tipus de vi que es compra, i hi ha un total de 200 compradors, aleshores per a menys de 30 anys: 110/200 = 0, 55, 30-50: 54/200 = 0, 27, més de 50 anys: 36/200 = 0, 18. Pregunta 25: Les freqüències relatives de la distribució de vi comprat condicionada a ser més gran que 50 anys són: (A) 0,09 0,38 0,29 0,29 (B) 0,04 0,11 0,11 (C) 0,33 0,50 0,06 0,11 (D) 0,93 0,33 0,33 (E) Cap de les respostes anteriors és correcta Resposta: Tenim un total de 36 compradors que són més grans de 50 anys, dels quals 12 compren Rioja, per tant 12/36 = 0, 33, Ribera del Duero: 18/36 = 0, 50, Priorat: 2/36 = 0, 06 i Altres: 4/36 = 0, 11. Pregunta 26: Les freqüències relatives de la distribució d’edat entre els que compren Priorat és (A) 0,29 0,43 0,29 (B) 0,55 0,57 0,18 (C) 0,09 0,38 0,29 0,29 (D) 0,77 0,04 0,29 0,29 (E) Cap de les respostes anteriors és correcta Mesura Ciutat de Barcelona Àrea metropolitana Q1 22,5 17,5 Med 27,5 22,5 Q3 32,5 27,5 Pregunta 30: Utilitzant 10 com a mı́nim i 40 com a màxim, utilitza els 5 números resum per a comparar les distribucions del preu del sopar a la ciutat de Barcelona i a l’àrea metropolitana de Barcelona. Resposta: Els cinc números resum són el mı́nim, el primer quartil, la mediana, el tercer quartil i el màxim. Per a la ciutat de Barcelona són: 10 22, 5 27, 5 32, 5 40 Per a la ciutat de Barcelona el preu més habitual dels sopars a restaurant italians és al voltant de 27,5 euros, perquè aquest és el valor de la mediana i ens mostra el centre de la distribució. Hi ha un rang de 10 euros on es concentra el 50% dels restaurants al voltant del centre de la distribució, perquè 10 és el valor del rang interquart́ılic. Hi ha més freqüència de sopars amb preus alts que baixos, cosa que es veu perquè la distribució és lleument asimètrica cap a l’esquerra. Per a l’àrea metropolitana de Barcelona els 5 números resum són: 10 17, 5 22, 5 27, 5 40 El preu més habitual dels sopars és ara 22,5, més redüıt que per a la ciutat de Barcelona. La dispersió al voltant del centre és la mateixa, 10 euros, però hi ha més freqüència de sopars a preus baixos del rang possible, ja que per al cas de l’àrea metropolitana la distribució és lleument asimètrica cap a la dreta. Exercici 6: Contesta en un full a part – Desigualtat als Estats Units 2014 (5 punts) A l’Informe sobre Pobresa i Desigualtat de l’any 2014 elaborat per la Universitat de Stanford es recullen les següents dades sobre la distribució de la renda de les unitats familiars del Estats Units: Quintil Ĺımit inferior Ĺımit superior (dòlars E.U.) (dòlars E.U.) 1 0 20000 2 20000 40000 3 40000 70000 4 70000 100000 5 100000 300000 Nota: Cada quintil recull un 20% de les unitats familiars. Pregunta 31: Calcula l’́ındex de Lorenz-Gini correponent a l’any 2014 per als Estats Units. Resposta: Hem de calcular les proporcions acumulades d’unitats familiars i de renda. Les proporcions acumulades de població són clarament: pi 0,2 0,4 0,6 0,8 1 Per a calcular la renda acumulada necessitem el punt mig de cada interval, que són els següents: Quintil Punt mig renda (dòlars) 1 10000 2 30000 3 55000 4 85000 5 200000 Com tots els intervals tenen el mateix nombre de famı́lies (un 20% del total), calculem la proporció de renda de cada quintil, i obtenim la renda acumulada (arrodonint a dos decimals): qi 0,03 0,11 0,25 0,47 1 L’́ındex de Lorenz-Gini serà doncs: (0, 2− 0, 03) + (0, 4− 0, 11) + (0, 6− 0, 25) + (0, 8− 0, 47) 0, 2 + 0, 4 + 0, 6 + 0, 8 = 0, 57 Pregunta 32: Dibuixa una corba de Lorenz aproximada per il·lustrar el grau de desigualtat als Estats Units al 2014. Resposta: Una corba de Lorenz aproximada és: Exercici 7: Contesta en un full a part – Llargada de components (6 punts) El 10,56 per cent del components de l’empresa Ruleman SA té una llargada que està per sobre de 340 mm, mentre que el 4,01 per cent dels components té una llarga que està sobre 348 mm. A més la distribució és aproximadament normal. Pregunta 33: Calcula la mitjana i la desviació estàndard dels components de l’empresa Ruleman SA. Resposta: A la taula de la distribució normal estàndard podem veure que el valor de z que deixa 10,56% a la dreta (89,44% a l’esquerra) és z1 = 1, 25, mentre que el valor de z que deixa 4,01% a la dreta (95,99% a l’esquerra) és z2 = 1, 75. Això ens permet plantejar les dues següents equacions: z1 = 340− µ σ = 1, 25 z2 = 348− µ σ = 1, 75 Respostes a l’examen Universitat Pompeu Fabra - Anàlisi de Dades Permutació Número: 3 Examen de Desembre 2014 L’examen consta de 8 exercicis diferents (Exercicis I-VIII). Els exercicis I a IV s’hauran de con- testar en les plantilles de respostes que es proveeixen. Cada pregunta compta 1 punt si es respon correctament i resta un quart de punt si la resposta és incorrecta. Aquestes preguntes es corregiran mecànicament, aix́ı que assegureu-vos d’entrar les respostes correctament a les plantilles. Els Exercicis V a VIII es contesten en fulls d’examen que s’han de lliurar. No es pot utilitzar més d’un full per pregunta i s’ha de contestar cada una en un full separat. Aquests quatre exercicis es corregiran de forma manual. Les respostes incorrectes d’aquesta part no compten negativament. Escriviu de forma clara i precisa. El total de punts a guanyar de cada exercici consta en el t́ıtol de l’exercici. Instruccions per omplir les plantilles (Exercicis I-IV) Usa sols llapis, boĺıgraf o retolador negre i omple bé les caselles. A la primera part de dalt posa sols el Nom i el Cognom, aix́ı com el grup. Omple (marcant les caselles de la plantilla) el DNI, la PERMUTACIÓ i el GRUP. DNI: el teu número de document d’identitat (si no en tens, el número que et van assignar en el moment de matricular-te). PERMUT.: Entra un 3 GRUP: Posa el número de grup (amb un 0 endavant, o sigui, 01, 02, 03 ó 04). Entra les respostes en les ĺınies de sota. Cada resposta disposa de dues ĺınies, la primera és per a la resposta correcta i la segona per anul·lar en cas d’equivocació. Exemple: Instruccions per contestar els exercicis V a VIII Contesta cada pregunta en un full separat. Pots utilitzar llapis o tinta. No t’oblidis de posar el teu nom, DNI o NIA i grup en cada full. Distribueix-te el temps adequadament! MOLT BONA SORT! Exercici 1: Consum de refrescos (10 punts) En el seu treball d’anàlisi de dades, el grup format pel Joan, la Júlia, l’Albert i la Mireia volen explicar el consum de refrescos. Per això entrevisten 10 estudiants sobre el nombre de refrescos que consumeixen durant una setmana. Amb les dades recollides construeixen el següent diagrama de caixa: En base a aquest diagrama responeu a les preguntes següents: Pregunta 1: Els 10 estudiants que s’analitzen al diagrama de caixa són (A) la mostra (B) la dispersió (C) la variable (D) la població (E) Cap de les respostes anteriors és correcta Resposta: És la mostra que té l’equip de treball per analitzar el consum de refrescos. Pregunta 2: Un individu en aquest conjunt de dades és (A) un estudiant entrevistat per al treball (B) un refresc (C) una setmana (D) un membre de l’equip (E) Cap de les respostes anteriors és correcta Resposta: La unitat d’observació és un estudiant entrevistat per al treball. Pregunta 3: La variable que es presenta al diagrama de caixa és (A) una sèrie temporal (B) una variable categòrica (C) una variable numèrica discreta (D) una variable numèrica cont́ınua (E) Cap de les respostes anteriors és correcta Resposta: Es tracta d’una variable numèrica discreta, el consum de refrescos sols pot agafar valors entre els números naturals positius o ser 0. Pregunta 4: El valor màxim de consum de refrescos que s’ha observat és (A) No se sap (B) Aproximadament 10 refrescos (C) 17 refrescos (D) 20 refrescos (E) Cap de les respostes anteriors és correcta Resposta: Com podem apreciar al diagrama de caixa, la ĺınia de la dreta arriba a 17, i per tant aquest és el màxim. Pregunta 5: Respecte a les observacions at́ıpiques (A) no n’hi ha (B) hi ha una observació at́ıpica, el 20 (C) hi ha 2 observacions at́ıpiques (D) no es pot veure res amb aquest diagrama (E) Cap de les respostes anteriors és correcta Resposta: El diagrama de caixa representa les observacions at́ıpiques com un punt (asterisc o creu o algun altre śımbol) separat de la resta, com no hi ha podem dir que no hi ha observacions at́ıpiques. Pregunta 6: La mediana de la distribució és (A) una mica més gran de 6 refrescos (B) 4 refrescos (C) el 50% (D) 10 refrescos (E) Cap de les respostes anteriors és correcta Resposta: Com ens mostra el diagrama amb el śımbol dins de la caixa, la mediana és una mica més gran que 6. Pregunta 7: Al diagrama de caixa Resposta: El valor de z que deixa un 90% a l’esquerra és z = 1, 28. Necessitem determinar x perquè es compleixi: x− 15 4 = 1, 28 Per tant: x = 1, 28 · 4 + 15 = 20, 12 El test ha d’acabar en 20,12 minuts perquè aproximadament un 90% dels alumnes puguin completar-lo a temps. Pregunta 14: Useu la regla 68-95-99,7% per a aquesta pregunta: Si es vol premiar amb un punt extra al 2,5% d’alumnes que acaben el test més ràpid, quin seria el temps ĺımit per obtenir el premi? (A) 3 minuts (B) 10 minuts (C) 5 minuts (D) 7 minuts (E) Cap de les respostes anteriors és correcta Resposta: El 2,5% correspon a la part de la regla referent al 95%, aix́ı que això són dos desviacions t́ıpiques per sota de la mitjana: 15− 4 · 2 = 7 Es premiarà amb un punt extra als alumnes que acabin en 7 minuts o menys. Pregunta 15: Un alumne amb un temps estandaritzat de realització del test igual a 1 acaba el test en (A) 11 minuts (B) 19 minuts (C) 25 minuts (D) 23 minuts (E) Cap de les respostes anteriors és correcta Resposta: Un temps estandaritzat de 1 minut correspon a un alumne amb un temps de realització del test que està una desviació estàndard per sobre de la mitjana, per tant triga 15 + 4 = 19 minuts. Pregunta 16: Un alumne que triga 23 minuts en realitzar el test, té un temps estandaritzat de realització igual a (A) 1 (B) 0 (C) 2 (D) -1 (E) Cap de les respostes anteriors és correcta Resposta: 23 són dues desviación t́ıpiques per sobre de la mitjana, per tant el temps estandaritzat és igual a 2. Exercici 3: Antiguitat a Muntam (6 punts) L’empresa de venda de mobles Muntam vol analitzar si amb l’antiguitat els treballadors munten els mobles més ràpid, i per això recullen dades sobre antiguitat i temps de muntatge d’un moble estàndar per a 6 treballadors: Treballador Temps de muntatge (minuts) Antiguitat (anys) 1 16 3 2 5 8 3 10 5 4 3 11 5 6 10 6 13 1 Mitjana 8,83 6,33 Des. t́ıpica 5,04 3,98 Mobles Muntam contracta un consultor que, usant aquestes dades, li calcula la regressión lineal següent: Temps de muntatge predit = 16, 15− 1, 16 Antiguitat En base a aquesta informació contesta les preguntes següents: Pregunta 17: Per cada any addicional d’antiguitat, les dades prediuen que (A) el temps de muntatge augmenta 1,16 minuts (B) el temps de muntatge es redueix en 1,16 minuts (C) el temps de muntatge augmenta 14.99 minuts (D) el temps de muntatge augmenta 16,16 minuts (E) Cap de les respostes anteriors és correcta Resposta: El pendent és igual a −1, 16, per tant el temps de muntatge disminueix en aquesta quantitat. Pregunta 18: El temps de muntatge predit per a un treballador que porta 2 anys a l’empresa Muntam és: (A) 16,15 minuts (B) 15 minuts (C) 13,83 minuts (D) 12,32 minuts (E) Cap de les respostes anteriors és correcta Resposta: Utilitzem la recta de regressió: 16, 16− 1, 16 · 2 = 13, 84 Pregunta 19: La recta de regressió prediu que una persona que ha estat just contractada (per tant té antiguitat igual a 0), (A) muntarà un moble en 16,15 minuts (B) muntarà un moble en 17,31 minuts (C) muntarà un moble en 1,16 minuts (D) muntarà un moble en 14,99 minuts (E) Cap de les respostes anteriors és correcta Resposta: Per a una persona amb 0 antiguitat, la recta prediu 16, 15− 1, 16 · 0 = 16, 15 minuts. Pregunta 20: Per a un treballador que portés 6,33 anys a l’empresa, i que trigués 8,83 minuts en realitzar la tasca, l’error de predicció de la recta arrodonit a un decimal (A) seria igual a 0 (B) seria positiu (C) seria negatiu (D) seria impossible de calcular (E) Cap de les respostes anteriors és correcta Resposta: Els valors suggerits són les mitjanes de la variable dependent i explicativa, per tant la recta passa per aquest punt i l’error de predicció és igual a 0. Pregunta 21: La variació en l’antiguitat a la feina dels treballadors aconsegueix explicar (A) un percentatge que no podem calcular amb aquestes dades (B) un 84% de la variació en el temps de muntatge (C) un 92% de la variació en el temps de muntatge (D) 1,16 minuts del temps del muntatge (E) Cap de les respostes anteriors és correcta. Resposta: Hem de calcular el coeficient de correlació, cosa que ens permet calcular el coeficient de determinació Hi ha 7 compradors de Priorat, del quals 2 tenen menys de 30 anys: 2/7 = 0, 29, 3 de 30-50 anys: 3/7 = 0, 43 i 2 tenen més de 50 anys: 2/7 = 0, 29. Pregunta 27: Entre el compradors de Rioja i Ribera del Duero (A) podem dir que l’edat té relació amb la compra de vins amb denominació Rioja o Ribera del Duero (B) no podem veure la distribució per edats (C) podem dir que els compradors més grans que 50 anys prefereixen aquestes denominacions de forma forta (D) podem dir que l’edat no té relació amb la compra de vins amb denominació Rioja o Ribera del Duero (E) Cap de les respostes anteriors és correcta Resposta: Per veure si hi ha relació, hem de calcular la distribució de les edats condicionada al vi que es compra, i obtenim les següents freqüències relatives: Edat Denominació d’origen Menys de 30 anys 30-50 anys Més de 50 anys Total Rioja 0,77 0,14 0,09 1,00 Ribera del Duero 0,04 0,57 0,38 1,00 Priorat 0,29 0,43 0,29 1,00 Altres 0,29 0,43 0,29 1,00 Total 0,55 0,27 0,18 1,00 Com podem apreciar, les distribucions condicionals no són iguals per als compradors de Rioja i Ribera del Duero, per tant veiem que śı que hi ha relació entre l’edat i la preferència pel vi per als compradors de Rioja i Ribera del Duero. En canvi per als compradors de Priorat i Altres no sembla haver-hi relació amb l’edat. Pregunta 28: D’acord amb les dades, podem veure que entre els compradors de més de 30 anys (A) no hi ha relació entre l’edat i la preferència de vi (B) hi ha relació entre l’edat i la preferència de vi (C) hi ha una preferència forta per Ribera del Duero (D) no hi ha una preferència forta per Rioja (E) Cap de les respostes anteriors és correcta Resposta: Per veure si hi ha relació, hem de calcular la distribució de la preferència de vi condicionada a la edat, i obtenim les següents freqüències relatives: Edat Denominació d’origen Menys de 30 anys 30-50 anys Més de 50 anys Total Rioja 0,93 0,33 0,33 0,66 Ribera del Duero 0,02 0,50 0,50 0,24 Priorat 0,02 0,06 0,06 0,04 Altres 0,04 0,11 0,11 0.07 Total 1,00 1,00 1,00 1,00 Com podem apreciar, les distribucions condicionals són iguals per als compradors de més de 30 anys, per tant podem concloure que per a aquest grup no hi ha relació entre l’edat i la preferència pel vi. Exercici 5: Contesta en un full a part – Cost de restaurants (5 punts) Es recull informació sobre el cost de sopar a restaurants italians de la ciutat de Barcelona i a l’àrea metropolitana: Cost per sopar (euros) Freqüències Freqüències relatives relatives (Ciutat de Barcelona) (Àrea metropolitana) 10-15 0,00 0,05 15-20 0,06 0,26 20-25 0,20 0,30 25-30 0,30 0,20 30-35 0,25 0,12 35-40 0,19 0,07 Pregunta 29: Calcula valors aproximats per al primer quartil, la mediana i el tercer quartil. Resposta: Per calcular els resums demanats és útil calcular les freqüències relatives acumulades: Cost per sopar (euros) Freqüències Freqüències relatives acumulades relatives acumulades (Ciutat de Barcelona) (Àrea metropolitana) 10-15 0,00 0,05 15-20 0,06 0,31 20-25 0,26 0,61 25-30 0,56 0,81 30-35 0,81 0,92 35-40 1,00 1 Per als restaurants de la ciutat de Barcelona el primer quartil està a l’interval 20-25, la mediana a l’interval 25-30 i el tercer quartil a l’interval 30-35. Per a l’àrea metropolitana el primer quartil està a l’interval 15-20, la mediana a l’interval 20-25 i el tercer quartil a l’interval 25-30. Per tant els valors aproximats d’aquestes mesures són: Mesura Ciutat de Barcelona Àrea metropolitana Q1 22,5 17,5 Med 27,5 22,5 Q3 32,5 27,5 Pregunta 30: Utilitzant 10 com a mı́nim i 40 com a màxim, utilitza els 5 números resum per a comparar les distribucions del preu del sopar a la ciutat de Barcelona i a l’àrea metropolitana de Barcelona. Resposta: Els cinc números resum són el mı́nim, el primer quartil, la mediana, el tercer quartil i el màxim. Per a la ciutat de Barcelona són: 10 22, 5 27, 5 32, 5 40 Per a la ciutat de Barcelona el preu més habitual dels sopars a restaurant italians és al voltant de 27,5 euros, perquè aquest és el valor de la mediana i ens mostra el centre de la distribució. Hi ha un rang de 10 euros on es concentra el 50% dels restaurants al voltant del centre de la distribució, perquè 10 és el valor del rang interquart́ılic. Hi ha més freqüència de sopars amb preus alts que baixos, cosa que es veu perquè la distribució és lleument asimètrica cap a l’esquerra. Per a l’àrea metropolitana de Barcelona els 5 números resum són: 10 17, 5 22, 5 27, 5 40 El preu més habitual dels sopars és ara 22,5, més redüıt que per a la ciutat de Barcelona. La dispersió al voltant del centre és la mateixa, 10 euros, però hi ha més freqüència de sopars a preus baixos del rang possible, ja que per al cas de l’àrea metropolitana la distribució és lleument asimètrica cap a la dreta. Exercici 6: Contesta en un full a part – Desigualtat als Estats Units 2014 (5 punts) A l’Informe sobre Pobresa i Desigualtat de l’any 2014 elaborat per la Universitat de Stanford es recullen les següents dades sobre la distribució de la renda de les unitats familiars del Estats Units: Quintil Ĺımit inferior Ĺımit superior (dòlars E.U.) (dòlars E.U.) 1 0 20000 2 20000 40000 3 40000 70000 4 70000 100000 5 100000 300000 Nota: Cada quintil recull un 20% de les unitats familiars. Pregunta 31: Calcula l’́ındex de Lorenz-Gini correponent a l’any 2014 per als Estats Units. Resposta: Hem de calcular les proporcions acumulades d’unitats familiars i de renda. Les proporcions acumulades de població són clarament: De la primera equació podem escriure: µ = 340− 1, 25σ Substitüım a la segona equació: 348− 340 + 1, 25σ σ = 1, 75 resolent obtenim σ = 16 i µ = 320. Pregunta 34: Calcula quina llargada màxima té el 5% dels components més curts. Resposta: Mirem a la taula de la distribució normal estàndard quin valor aproximat de z deixa 5% a l’esquerra y veiem que és z = −2, 57. Per tant tenim: z = −2, 57 = X − 320 16 Resolent obtenim X = 279, 88, que és la llargada màxima per al 5% de component més curts. Exercici 8: Contesta en un full a part – Índex de salaris (6 punts) Per a una empresa mitjana tenim les següens dades per als salaris dels treballadors: Any 0 Any 1 Grup Salari Nombre treballadors Salari Nombre treballadors Gestió 300 40 330 50 Qualificat 255 60 270 70 No qualificat 90 100 150 100 Pregunta 35: Calcula un ı́ndex salarial compost de Laypeyres usant l’any 0 com a base. Resposta: Per a un ı́ndex de Laspeyres hem de calcular les ponderacions per a l’any base: Gestió: 40 · 300 40 · 300 + 60 · 255 + 100 · 90 = 0, 33 Qualificat: 60 · 255 40 · 300 + 60 · 255 + 100 · 90 = 0, 42 No qualificat: 100 · 90 40 · 300 + 60 · 255 + 100 · 90 = 0, 25 També hem de calcular l’́ındex salarial simple per a cada grup, que a l’any 0 és igual a 100 i a l’any 1 és igual a: Gestió: 330 300 100 = 110 Qualificat: 270 255 100 = 105, 88 No qualificat: 150 90 100 = 166, 67 I per últim calculem la mitjana ponderada: 0, 33 · 110 + 0, 42 · 105, 88 + 0, 25 · 166, 67 = 122, 44 Per tant l’́ındex de Laypeyres agafant l’any 0 com a base és: Peŕıode Índex Any 0 100 Any 1 122,44 Pregunta 36: Indica la taxa de creixement (en percentatge) del salari entre l’any 0 i l’any 1. Resposta: La taxa de creixement en percentatge és igual a: 122, 44− 100 100 · 100 = 22, 44 o sigui 22,44%. Respostes a l’examen Universitat Pompeu Fabra - Anàlisi de Dades Permutació Número: 4 Examen de Desembre 2014 L’examen consta de 8 exercicis diferents (Exercicis I-VIII). Els exercicis I a IV s’hauran de con- testar en les plantilles de respostes que es proveeixen. Cada pregunta compta 1 punt si es respon correctament i resta un quart de punt si la resposta és incorrecta. Aquestes preguntes es corregiran mecànicament, aix́ı que assegureu-vos d’entrar les respostes correctament a les plantilles. Els Exercicis V a VIII es contesten en fulls d’examen que s’han de lliurar. No es pot utilitzar més d’un full per pregunta i s’ha de contestar cada una en un full separat. Aquests quatre exercicis es corregiran de forma manual. Les respostes incorrectes d’aquesta part no compten negativament. Escriviu de forma clara i precisa. El total de punts a guanyar de cada exercici consta en el t́ıtol de l’exercici. Instruccions per omplir les plantilles (Exercicis I-IV) Usa sols llapis, boĺıgraf o retolador negre i omple bé les caselles. A la primera part de dalt posa sols el Nom i el Cognom, aix́ı com el grup. Omple (marcant les caselles de la plantilla) el DNI, la PERMUTACIÓ i el GRUP. DNI: el teu número de document d’identitat (si no en tens, el número que et van assignar en el moment de matricular-te). PERMUT.: Entra un 4 GRUP: Posa el número de grup (amb un 0 endavant, o sigui, 01, 02, 03 ó 04). Entra les respostes en les ĺınies de sota. Cada resposta disposa de dues ĺınies, la primera és per a la resposta correcta i la segona per anul·lar en cas d’equivocació. Exemple: Instruccions per contestar els exercicis V a VIII Contesta cada pregunta en un full separat. Pots utilitzar llapis o tinta. No t’oblidis de posar el teu nom, DNI o NIA i grup en cada full. Distribueix-te el temps adequadament! MOLT BONA SORT! (A) es poden veure els cinc números resum (B) es pot veure la població de l’estudi (C) es poden veure els resums no resistents (D) es poden veure la mitjana, la desviació t́ıpica, el máxim i el mı́nim (E) Cap de les respostes anteriors és correcta Resposta: El diagrama de caixa és una representació dels cinc números resum, i de valors at́ıpics si n’hi ha. Pregunta 8: El valor màxim de consum de refrescos que s’ha observat és (A) 20 refrescos (B) 17 refrescos (C) No se sap (D) Aproximadament 10 refrescos (E) Cap de les respostes anteriors és correcta Resposta: Com podem apreciar al diagrama de caixa, la ĺınia de la dreta arriba a 17, i per tant aquest és el màxim. Pregunta 9: El 50% dels joves consumeix entre aproximadament (A) 0 i 4 refrescos per setmana (B) 6 i 10 refrescos per setmana (C) 4 i 10 refrescos per setmana (D) 10 i 20 refrescos per setmana (E) Cap de les respostes anteriors és correcta Resposta: Veiem al diagrama de caixa que el primer quartil és aproximadament 4 i el tercer quartil aproximada- ment 10, per tant entre aquests dos valors hi ha aproximadament el 50%. Pregunta 10: El 50% dels joves consumeix (A) més de 6 refrescos per setmana (B) una quantitat que no podem determinar (C) 6 refrescos per setmana (D) menys de 4 refrescos per setmana (E) Cap de les respostes anteriors és correcta Resposta: Com la mediana és una mica més de 6, el 50% dels joves consumeixen una mica més de 6 refrescos a la setmana. Exercici 2: Temps en acabar un test (6 punts) El temps que triga el seminari 103 d’Anàlisi de Dades en completar el test de seminari segueix una distribució normal, amb una mitjana igual a 15 minuts i una desviació t́ıpica igual a 4 minuts. En base a aquesta informació contesta a les preguntes següents: Pregunta 11: Quin és el percentatge aproximat d’estudiants que acaba en 17 minuts o menys? (A) 30,85% (B) 52,23% (C) 76,32% (D) 69,15% (E) Cap de les respostes anteriors és correcta Resposta: Estandaritzem: z = 17− 15 4 = 0, 5 A la taula de la distribució normal estàndard podem veure que hi ha un 69,15% dels estudiants que acaben en 17 minuts o menys. Pregunta 12: Useu la regla 68-95-99,7% per a aquesta pregunta: Quin és el percentatge aproximat d’alumnes que acaba el test en 11 minuts o més? (A) 84% (B) 68% (C) 95% (D) 16% (E) Cap de les respostes anteriors és correcta Resposta: 11 és exactament una desviació t́ıpica per sota de la mitjana, per tant el percentatge és 68 + 32/2 = 84%. Pregunta 13: Quin ĺımit aproximat de temps s’hauria de posar el test perquè un 90% dels alumnes poguessin completar-lo a temps? (A) 23,12 minuts (B) 20,12 minuts (C) 15,23 minuts (D) 17,82 minuts (E) Cap de les respostes anteriors és correcta Resposta: El valor de z que deixa un 90% a l’esquerra és z = 1, 28. Necessitem determinar x perquè es compleixi: x− 15 4 = 1, 28 Per tant: x = 1, 28 · 4 + 15 = 20, 12 El test ha d’acabar en 20,12 minuts perquè aproximadament un 90% dels alumnes puguin completar-lo a temps. Pregunta 14: Useu la regla 68-95-99,7% per a aquesta pregunta: Si es vol premiar amb un punt extra al 2,5% d’alumnes que acaben el test més ràpid, quin seria el temps ĺımit per obtenir el premi? (A) 5 minuts (B) 7 minuts (C) 10 minuts (D) 3 minuts (E) Cap de les respostes anteriors és correcta Resposta: El 2,5% correspon a la part de la regla referent al 95%, aix́ı que això són dos desviacions t́ıpiques per sota de la mitjana: 15− 4 · 2 = 7 Es premiarà amb un punt extra als alumnes que acabin en 7 minuts o menys. Pregunta 15: Un alumne amb un temps estandaritzat de realització del test igual a 1 acaba el test en (A) 23 minuts (B) 25 minuts (C) 11 minuts (D) 19 minuts (E) Cap de les respostes anteriors és correcta Resposta: Un temps estandaritzat de 1 minut correspon a un alumne amb un temps de realització del test que està una desviació estàndard per sobre de la mitjana, per tant triga 15 + 4 = 19 minuts. Pregunta 16: Un alumne que triga 23 minuts en realitzar el test, té un temps estandaritzat de realització igual a (A) 1 (B) -1 (C) 2 o mesura de bondat de l’ajust. Usant la fórmula pel pendent: b = r sy sx sabem que r = b sx sy = −1, 16 · 3, 98 5, 04 = −0, 92 El coeficient de determinació R2 és el quadrat del coeficient de correlació, o sigui R2 = 0, 922 = 0, 84 per tant s’aconsegueix explicar un 84% de la variació en el temps de muntatge. Pregunta 22: Per al treballador amb codi igual a 1, l’error de predicció o residu de la recta de regressió és igual a (A) 3,33 (B) 0 (C) 12,52 (D) 12,68 (E) Cap de les respostes anteriors és correcta Resposta: L’error de predicció és el valor real de la variable dependent menys el valor predit, és a dir y − ŷ = 16− 16, 15 + 1, 16 · 3 = 3, 33 Exercici 4: Vinoteca El Celler (6 punts) La Vinoteca El Celler vol gestionar millor el seu catàleg, i per això obté una mostra de 200 compradors i registra quina és la denominació d’origen del vi que compren i l’edat dels compradors: Edat Denominació d’origen Menys de 30 anys 30-50 anys Més de 50 anys Total Rioja 102 18 12 132 Ribera del Duero 2 27 18 47 Priorat 2 3 2 7 Altres 4 6 4 14 Total 110 54 36 200 En base a aquesta informació contesta les preguntes plantejades. Pregunta 23: Dins de la distribució conjunta, la freqüència relativa corresponent al compradors entre 30 i 50 anys que compren Rioja és igual a (A) 0,27 (B) 0,13 (C) 0,02 (D) 0,09 (E) Cap de les respostes anteriors és correcta Resposta: Hi ha 102 compradors que tenen entre 30 i 50 anys i que compren Rioja, per tant la freqüència relativa és igual a 18/200 = 0, 09. Pregunta 24: La distribució marginal corresponent a l’edat té les següents freqüències relatives (A) 0,55 0,27 0,18 (B) 0,04 0,11 0,11 (C) 0,51 0,01 0,02 0,02 (D) 0,66 0,24 0,04 0,07 (E) Cap de les respostes anteriors és correcta Resposta: Es tracta de la distribució per edats sense considerar el tipus de vi que es compra, i hi ha un total de 200 compradors, aleshores per a menys de 30 anys: 110/200 = 0, 55, 30-50: 54/200 = 0, 27, més de 50 anys: 36/200 = 0, 18. Pregunta 25: Les freqüències relatives de la distribució de vi comprat condicionada a ser més gran que 50 anys són: (A) 0,04 0,11 0,11 (B) 0,09 0,38 0,29 0,29 (C) 0,93 0,33 0,33 (D) 0,33 0,50 0,06 0,11 (E) Cap de les respostes anteriors és correcta Resposta: Tenim un total de 36 compradors que són més grans de 50 anys, dels quals 12 compren Rioja, per tant 12/36 = 0, 33, Ribera del Duero: 18/36 = 0, 50, Priorat: 2/36 = 0, 06 i Altres: 4/36 = 0, 11. Pregunta 26: Les freqüències relatives de la distribució d’edat entre els que compren Priorat és (A) 0,09 0,38 0,29 0,29 (B) 0,29 0,43 0,29 (C) 0,77 0,04 0,29 0,29 (D) 0,55 0,57 0,18 (E) Cap de les respostes anteriors és correcta Resposta: Hi ha 7 compradors de Priorat, del quals 2 tenen menys de 30 anys: 2/7 = 0, 29, 3 de 30-50 anys: 3/7 = 0, 43 i 2 tenen més de 50 anys: 2/7 = 0, 29. Pregunta 27: D’acord amb les dades, podem veure que entre els compradors de més de 30 anys (A) hi ha relació entre l’edat i la preferència de vi (B) no hi ha relació entre l’edat i la preferència de vi (C) hi ha una preferència forta per Ribera del Duero (D) no hi ha una preferència forta per Rioja (E) Cap de les respostes anteriors és correcta Resposta: Per veure si hi ha relació, hem de calcular la distribució de la preferència de vi condicionada a la edat, i obtenim les següents freqüències relatives: Edat Denominació d’origen Menys de 30 anys 30-50 anys Més de 50 anys Total Rioja 0,93 0,33 0,33 0,66 Ribera del Duero 0,02 0,50 0,50 0,24 Priorat 0,02 0,06 0,06 0,04 Altres 0,04 0,11 0,11 0.07 Total 1,00 1,00 1,00 1,00 Com podem apreciar, les distribucions condicionals són iguals per als compradors de més de 30 anys, per tant podem concloure que per a aquest grup no hi ha relació entre l’edat i la preferència pel vi. Pregunta 28: Entre el compradors de Rioja i Ribera del Duero (A) podem dir que l’edat no té relació amb la compra de vins amb denominació Rioja o Ribera del Duero (B) podem dir que els compradors més grans que 50 anys prefereixen aquestes denominacions de forma forta (C) no podem veure la distribució per edats (D) podem dir que l’edat té relació amb la compra de vins amb denominació Rioja o Ribera del Duero (E) Cap de les respostes anteriors és correcta Resposta: Per veure si hi ha relació, hem de calcular la distribució de les edats condicionada al vi que es compra, i obtenim les següents freqüències relatives: Hem de calcular les proporcions acumulades d’unitats familiars i de renda. Les proporcions acumulades de població són clarament: pi 0,2 0,4 0,6 0,8 1 Per a calcular la renda acumulada necessitem el punt mig de cada interval, que són els següents: Quintil Punt mig renda (dòlars) 1 10000 2 30000 3 55000 4 85000 5 200000 Com tots els intervals tenen el mateix nombre de famı́lies (un 20% del total), calculem la proporció de renda de cada quintil, i obtenim la renda acumulada (arrodonint a dos decimals): qi 0,03 0,11 0,25 0,47 1 L’́ındex de Lorenz-Gini serà doncs: (0, 2− 0, 03) + (0, 4− 0, 11) + (0, 6− 0, 25) + (0, 8− 0, 47) 0, 2 + 0, 4 + 0, 6 + 0, 8 = 0, 57 Pregunta 32: Dibuixa una corba de Lorenz aproximada per il·lustrar el grau de desigualtat als Estats Units al 2014. Resposta: Una corba de Lorenz aproximada és: Exercici 7: Contesta en un full a part – Llargada de components (6 punts) El 10,56 per cent del components de l’empresa Ruleman SA té una llargada que està per sobre de 340 mm, mentre que el 4,01 per cent dels components té una llarga que està sobre 348 mm. A més la distribució és aproximadament normal. Pregunta 33: Calcula la mitjana i la desviació estàndard dels components de l’empresa Ruleman SA. Resposta: A la taula de la distribució normal estàndard podem veure que el valor de z que deixa 10,56% a la dreta (89,44% a l’esquerra) és z1 = 1, 25, mentre que el valor de z que deixa 4,01% a la dreta (95,99% a l’esquerra) és z2 = 1, 75. Això ens permet plantejar les dues següents equacions: z1 = 340− µ σ = 1, 25 z2 = 348− µ σ = 1, 75 De la primera equació podem escriure: µ = 340− 1, 25σ Substitüım a la segona equació: 348− 340 + 1, 25σ σ = 1, 75 resolent obtenim σ = 16 i µ = 320. Pregunta 34: Calcula quina llargada màxima té el 5% dels components més curts. Resposta: Mirem a la taula de la distribució normal estàndard quin valor aproximat de z deixa 5% a l’esquerra y veiem que és z = −2, 57. Per tant tenim: z = −2, 57 = X − 320 16 Resolent obtenim X = 279, 88, que és la llargada màxima per al 5% de component més curts. Exercici 8: Contesta en un full a part – Índex de salaris (6 punts) Per a una empresa mitjana tenim les següens dades per als salaris dels treballadors: Any 0 Any 1 Grup Salari Nombre treballadors Salari Nombre treballadors Gestió 300 40 330 50 Qualificat 255 60 270 70 No qualificat 90 100 150 100 Pregunta 35: Calcula un ı́ndex salarial compost de Laypeyres usant l’any 0 com a base. Resposta: Per a un ı́ndex de Laspeyres hem de calcular les ponderacions per a l’any base: Gestió: 40 · 300 40 · 300 + 60 · 255 + 100 · 90 = 0, 33 Qualificat: 60 · 255 40 · 300 + 60 · 255 + 100 · 90 = 0, 42 No qualificat: 100 · 90 40 · 300 + 60 · 255 + 100 · 90 = 0, 25 També hem de calcular l’́ındex salarial simple per a cada grup, que a l’any 0 és igual a 100 i a l’any 1 és igual a: Gestió: 330 300 100 = 110 Qualificat: 270 255 100 = 105, 88
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved