Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Diseños Muestrales (Teoría y Ejercicios Resueltos), Monografías, Ensayos de Estadística

Este trabajo está dividido en dos partes: PARTE I - TEORÍA (diseños muestrales, tamaño de la población para el tamaño de una muestra, selección de una mala muestra). PARTE II - EJERCICIOS

Tipo: Monografías, Ensayos

2019/2020

Subido el 26/11/2022

Valeli.UCAB
Valeli.UCAB 🇻🇪

3 documentos

Vista previa parcial del texto

¡Descarga Diseños Muestrales (Teoría y Ejercicios Resueltos) y más Monografías, Ensayos en PDF de Estadística solo en Docsity! Diseños Muestrales Valeria C. Garrido R. Facultad de Humanidades y Educación, Universidad Católica Andrés Bello 01244: Estadística II M.Sc. Omar Castro Julio 07, 2020 Índice P.p. Introducción 3 Objetivos 4 Contenido 5 PARTE I – TEORÍA 5 Diseños Muestrales. 5 Tamaño de la Población para el tamaño de una Muestra. 6 Selección de una mala Muestra. 6 PARTE II – EJERCICIOS 7 Conclusión 12 Bibliografía 13 5 Contenido PARTE I – TEORÍA Diseños Muestrales Muestreo Aleatorio Simple. Como lo establece Kelmansky (2009), una muestra aleatoria simple es la que se obtiene a partir de un mecanismo que le da a cada una de las unidades muestrales la misma probabilidad de ser elegida. Esto se refiere a que todos los individuos tienen la misma probabilidad de ser seleccionados. Por ejemplo, uno de los mecanismos es utilizar una tabla de números aleatorios, o también con un ordenador generar números aleatorios, comprendidos entre cero y uno, y multiplicarlos por el tamaño de la población (Ferrer, 2010). Muestreo Sistemático. Como lo establece Kelmansky (2009), este muestreo comienza con una unidad elegida al azar y a partir de allí continúa cada k unidades. Si n es el tamaño muestral y N es el tamaño de la población, entonces k es aproximadamente N/n. En pocas palabras, se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra (Ferrer, 2010). Muestreo Estratificado. Como lo establece Kelmansky (2009), la población se divide en grupos homogéneos llamados estratos. Luego se realiza un muestreo aleatorio simple de unidades muestrales dentro de cada estrato. También se debe tener en cuenta el establecimiento de la proporción de unidades, o fracción de muestreo, que se incluirá para cada estrato. Muestreo por Conglomerados. Como lo establece Kelmansky (2009), la población se divide en grupos heterogéneos llamados conglomerados. Luego se realiza un muestreo aleatorio simple en el que las unidades muestrales son los conglomerados. Para este, se debe recordar también establecer la proporción de unidades que se incluirá. 6 Tamaño de la Población para el tamaño de una Muestra Para calcular el tamaño de una muestra, es determinante conocer el tamaño de la población en la mayoría de los casos, ya que por lo general cuando los investigadores quieren averiguar algo sobre una población, no siempre existe el suficiente tiempo o dinero para estudiar a todos los individuos que la conforman, por lo cual recurren a seleccionar una cantidad pequeña de unidades muestrales de dicha población (muestra) y la estudian, para poder sacar conclusiones sobre toda la población. Por ello, conociendo el tamaño de la población, mediante ciertos cálculos matemáticos se puede obtener una buena muestra que será capaz de tener, en la misma proporción que en la población, todas las características importantes de la población. Esto significa que conociendo el tamaño de la población, se puede obtener una muestra representativa de la misma, teniendo un margen de error más bajo en comparación del caso en el que no se conoce el tamaño de la población, ya que se obtienen resultados más precisos. Selección de una mala Muestra Estos son algunos casos que pueden conducir al investigador a la selección de una mala muestra, referidos al sesgo, propuestos por Kelmansky (2009):  Muestras por conveniencia: Pretende seleccionar unidades de análisis que cumplen los requisitos de la población objeto de estudio, pero sin embargo, no son seleccionados al azar (Carrasquedo, 2017). Obtener una muestra de esta manera es rápido y económico, pero la gente que contactan no es representativa de la mayoría de la población.  Muestras con sesgo personal: Por simpatía, gusto o interés, quien está realizando la encuesta puede preferir encuestar a cierto tipo de personas y no a otras.  Muestras de respuesta voluntaria: Surgen a partir de los individuos que se ofrecen voluntariamente a participar. Se trata, por ejemplo, de las que alimentan las votaciones organizadas por programas de radio, televisión o de algún sitio de Internet. No producen resultados que tengan algún significado en relación a la opinión de la población en general. Los participantes voluntarios, que por algún motivo decidieron participar, suelen tener opiniones más polarizadas. 7 PARTE II – EJERCICIOS Ejercicio 1. Una fábrica produce dardos con diámetros que tienen un desvío estándar σ= 0.25mm. De un lote grande, se seleccionó una muestra aleatoria simple de 40 dardos, y se obtuvo un promedio de 3.09mm en sus diámetros. a) Obtenga un intervalo de confianza de aproximadamente el 95% para la media de los diámetros de todos los dardos producidos de la misma forma. 𝜇 ∈ [?̅? ± 𝑍𝛼 2⁄ ∙ 𝜎 √𝑛 ] = [3.09 ± 1.96 ∙ 0.25 √40 ] = [3.09 ± 0.08] = [3.01 − 3.17] La verdadera media de los diámetros de todos los dardos estará comprendida entre [3.01 − 3.17] 𝑚𝑚 con una probabilidad del 95%, existiendo una probabilidad de que 2.5% tengan un diámetro por debajo de 3.01mm y 2.5% por encima de 3.17mm. b) Ídem a pero con una confianza aproximada del 99.7%. 𝑃[𝑍 < 𝑍𝛼 2⁄ ] = 𝑃[𝑍 < 0] + 99.7 2 ∙ 100 = 0.5 + 0.4985 = 0.9985 ⟹ 𝒁𝜶 𝟐⁄ = 𝟐. 𝟗𝟔 𝜇 ∈ [?̅? ± 𝑍𝛼 2⁄ ∙ 𝜎 √𝑛 ] = [3.09 ± 2.96 ∙ 0.25 √40 ] = [3.09 ± 0.12] = [2.97 − 3.21] La verdadera media de los diámetros de todos los dardos estará comprendida entre [2.97 − 3.21] 𝑚𝑚 con una probabilidad del 99.7%, existiendo una probabilidad de que 0.15% tengan un diámetro por debajo de 2.97mm y 0.15% por encima de 3.21mm. c) De qué tamaño debe ser la muestra para que la longitud del intervalo de confianza del 95% sea 0.1mm. 2 ∙ 𝑍𝛼 2⁄ ∙ 𝜎 √𝑛 = 𝐿 ⟹ 𝑛 = ( 2 ∙ 𝑍𝛼 2⁄ ∙ 𝜎 𝐿 ) 2 ⟹ 𝑛 = ( 2 ∙ 1.96 ∙ 0.25 0.1 ) 2 ⟹ 𝒏 = 𝟗𝟔 Ejercicio 4. Se sabe que el 82% de los alumnos del último año de las escuelas secundarias dependientes de alguna universidad planean seguir estudios superiores. Supongamos que se selecciona una muestra aleatoria simple de alumnos del último año de dichas escuelas y se obtiene un intervalo de confianza en base a la proporción que manifiesta tener interés en continuar sus estudios. Entonces: a) El centro del intervalo de confianza es 0.82. Esta es la respuesta correcta, ya que el enunciado nos asegura que el 82% de los alumnos planea seguir estudios superiores; es decir, 10 No tiene derecho de afirmar que los focos tienen un promedio de vida de 400 horas ya que, luego de obtener el intervalo, podemos observar que el valor de 400 horas está fuera del intervalo esperado para la media. c) ¿Debe suponerse que la vida de la población de focos se distribuye normalmente? Explique por qué. Sí, ya que, guiándonos de la definición del teorema central del límite (TCL), la distribución de muestreo de un ?̅? es aproximadamente normal siempre y cuando se tomen tamaños de muestra lo suficientemente grandes. Generalmente, para afirmar esto, se utiliza un tamaño de muestra (n) que sea de al menos 30, y en este problema nuestro tamaño de muestra es 64, por ende se puede suponer que la vida de la población de focos se distribuye normalmente. d) Suponga que la desviación estándar cambió a 80 horas. ¿Cuáles son sus respuestas para los incisos a) y b)? Para el inciso a): 𝜇 ∈ [?̅? ± 𝑍𝛼 2⁄ ∙ 𝜎 √𝑛 ] = [350 ± 1.96 ∙ 80 √64 ] = [350 ± 19.6] = [330.4 − 369.6] Para el inciso b): No tiene derecho de afirmar que los focos tienen un promedio de vida de 400 horas ya que, luego de obtener el intervalo, podemos observar que el valor de 400 horas está fuera del intervalo esperado para la media, el cual expone que la vida media de los focos de este embarque estará comprendida entre [330.4 − 369.6] ℎ con una probabilidad del 95%, existiendo una probabilidad de que 2.5% tengan una vida por debajo de 330.4h y 2.5% por encima de 369.6h. Ejercicio 8.9. La división de inspección de Pesos y Medidas del condado de Lee desea estimar la cantidad real de contenido en botellas de 2 litros de bebida refrescante en la planta embotelladora local de una empresa conocida a nivel nacional. La planta embotelladora ha informado a la división de inspección que la desviación estándar poblacional para las botellas de 2 litros es de 0.05 litro. Una muestra aleatoria de 100 botellas de 2 litros en la planta embotelladora indica una media muestral de 1.99 litros. a) Construya una estimación de intervalo de confianza del 95% de la media poblacional cantidad de bebida refrescante en cada botella. 𝜇 ∈ [?̅? ± 𝑍𝛼 2⁄ ∙ 𝜎 √𝑛 ] = [1.99 ± 1.96 ∙ 0.05 √100 ] = [1.99 ± 0.01] = [1.98 − 2.00] 11 Este intervalo expone que la media para la cantidad de bebida refrescante en cada botella estará comprendida entre [1.98 − 2.00] 𝑙𝑖𝑡𝑟𝑜𝑠 con una probabilidad del 95%, existiendo una probabilidad de que 2.5% tengan una cantidad de bebida por debajo de 1.98 litros y 2.5% por encima de 2 litros. b) ¿Debe suponerse que la población de relleno de refresco se distribuye normalmente? Explique por qué. Sí, ya que, guiándonos de la definición del teorema central del límite (TCL), la distribución de muestreo de un ?̅? es aproximadamente normal siempre y cuando se tomen tamaños de muestra lo suficientemente grandes. Generalmente, para afirmar esto, se utiliza un tamaño de muestra (n) que sea de al menos 30, y en este problema nuestro tamaño de muestra es 100, por ende se puede suponer que la población de relleno de refresco se distribuye normalmente. c) Explique por qué el valor de 2.02 litros para una botella sola no es inusual, aun cuando esté fuera del intervalo de confianza calculado. El valor de 2.02 litros para una botella sola no es inusual ya que, considerando que se tomó un nivel de confianza del 95%, existe un 5% de probabilidades de que el valor de la cantidad de bebida en una botella esté fuera del intervalo calculado, siendo así un 2.5% probable que esté por debajo del intervalo y otro 2.5% probable que esté por encima. Viendo el intervalo, observamos que existe un 2.5% de probabilidades de que la cantidad de bebida en una botella esté por encima de 2 litros, lo que significa que es posible que una botella tenga 2.02 litros. d) Suponga que la media muestral hubiera sido de 1.97 litros. ¿Cuál sería su respuesta al inciso a)? 𝜇 ∈ [?̅? ± 𝑍𝛼 2⁄ ∙ 𝜎 √𝑛 ] = [1.97 ± 1.96 ∙ 0.05 √100 ] = [1.97 ± 0.01] = [1.96 − 1.98] Este intervalo expone que la media para la cantidad de bebida refrescante en cada botella estará comprendida entre [1.96 − 1.98] 𝑙𝑖𝑡𝑟𝑜𝑠 con una probabilidad del 95%, existiendo una probabilidad de que 2.5% tengan una cantidad de bebida por debajo de 1.96 litros y 2.5% por encima de 1.98 litros. 12 Conclusión En Estadística existen distintas maneras para lograr obtener una muestra que sea representativa de la población en estudio. Dichos métodos son llamados diseños muestrales, y dependen de la manera en la que se decida estudiar la población. Ellos también pueden ser probabilísticos (aleatorio simple, sistemático, estratificado, por conglomerados) o no probabilísticos (por conveniencia, con sesgo personal, de respuesta voluntaria), lo cual influye directamente en qué tan representativa será esa muestra para la población. Durante una investigación, es importante tener en claro cuál es la población y cuáles son las características que se le deseen estudiar, para así poder seleccionar el diseño muestral adecuado mediante el cual se podrá obtener una muestra capaz de tener, en la misma proporción que en la población, todas las características importantes de la población. En otros casos, es importante definir cuál será el nivel de confianza que se desee utilizar, ya que mediante el mismo se obtiene un intervalo de confianza con el cual se puede observar los valores posibles que definen la media muestral. En resumen, junto con los distintos diseños muestrales y los conceptos que envuelven lo que es el nivel de confianza, se puede estudiar y obtener información de manera rápida y eficaz de situaciones cotidianas o de importancia para cualquier persona, grupo o sociedad.
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved