Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

1 DISTRIBUCIÓN CHI-CUADRADO O JI-CUADRADO X2 ..., Esquemas y mapas conceptuales de Probabilidad

Se representa por Ha. Page 2. 2. Prueba chi-cuadrada para la independencia (pruebas para tablas de.

Tipo: Esquemas y mapas conceptuales

2021/2022

Subido el 10/10/2022

verano86
verano86 🇪🇸

4.5

(32)

16 documentos

1 / 11

Toggle sidebar

Documentos relacionados


Vista previa parcial del texto

¡Descarga 1 DISTRIBUCIÓN CHI-CUADRADO O JI-CUADRADO X2 ... y más Esquemas y mapas conceptuales en PDF de Probabilidad solo en Docsity! 1 DISTRIBUCIÓN CHI-CUADRADO O JI-CUADRADO X2 CONCEPTO BÁSICO Frecuencia: es el número de datos que caen en cada celda. Frecuencias Observadas (fo): son aquellas que representan los valores muestrales observados correspondientes a una variable categórica o cuantitativa sometida a estudio. Ejemplo: afiliación partidaria; reacción ante un nuevo plan de impuesto sobre la renta; edad y sexo, etc. Frecuencias Esperadas (fe): son aquellas que representan los valores muestrales esperados que corresponden a una variable categórica o cuantitativa sometida a estudio, considerando que la hipótesis nula es correcta. Variable Categórica: una variable categórica es aquella en la que se clasifica o categoriza cada individuo en solo una de varias celdas o clases; estas celdas o clases son totalmente incluyentes o mutuamente excluyentes. Nivel de significancia (α) de la distribución chi-cuadrado: es una probabilidad expresada en porcentaje que nos permite tomar la decisión de aceptar o rechazar la hipótesis nula o alternativa basándonos en la evidencia mostrada por los datos muestrales. Regularmente se utilizan valores de 0.01, 0.05, 0.10 u otro valor dependiendo del tipo de prueba que se realice o de la confiabilidad deseada. Tabla de Contingencia: es una representación de datos de una clasificación de doble entrada. Los datos se clasifican en celdas y se reporta cuantos hay en cada una de ellas. La tabla de contingencia implica dos factores (o variables) y la pregunta usual respecto a tales tablas es si los datos indican que una de las variables es independiente o dependiente. Hipótesis Nula: es aquella que especifica un valor numérico del parámetro de la población, el cual, esperamos aceptar o desaprobar a partir de la evidencia proporcionada por la muestra. Se representa simbólicamente por Ho Hipótesis Alternativa: es la conclusión que se obtiene cuando la información que proporcionan los datos muestrales no nos permiten apoyar la hipótesis nula que ha sido planteada. Se representa por Ha. 2 Prueba chi-cuadrada para la independencia (pruebas para tablas de contingencias) Este tipo de prueba implican dos variables categóricas y/o cuantitativas y lo que se prueba es la hipótesis de que las dos son estadísticas independientes. DISEÑO O FORMATO DE LA TABLA DE CONTINGENCIA PARA ESTE TIPO DE PRUEBA ENCABEZADO DE RENGLÓN (1ERA. VARIABLE) ENCABEZADO DE COLUMNAS (2DA. VARIABLE) Col. 1 Col. 2 Col. 3 Total Renglón 1 Celda Celda Celda RT1 Renglón 2 Celda Celda Celda RT2 TOTAL CT1 CT2 CT3 n Procedimiento de cálculo para realizar esta prueba a) Se determinan los valores de todas las frecuencias esperadas para cada una de las celdas o casillas tomando como base los datos muestrales que se presenten en la tabla de contingencia y a partir de ésta, se calculan las frecuencias esperadas. ENCABEZADO DE RENGLÓN ENCABEZADO DE COLUMNAS Col. 1 Col. 2 Col. 3 Total Renglón 1 Fe (11) Fe (12) Fe (13) RT1 Renglón 2 Fe (21) Fe (22) Fe (23) RT2 Renglón 3 Fe (31) Fe (32) Fe (33) RT3 TOTAL CT1 CT2 CT3 n Totales de renglones Total de observaciones (muestra) Totales de columnas Totales de renglones Total de observaciones (muestra) Totales de columnas 5 Donde: g.l.= número de grados de libertad = (r-1) (C-1) α= nivel de significancia r= número de filas de la tabla de contingencia (renglones) c= número de columnas de la tabla de contingencia - Si 𝒙𝒄 𝟐 > 𝒙𝒕 𝟐, entonces se rechaza la 𝐻𝑜 y se acepta la 𝐻𝑎 se concluye que las variables están relacionadas. - Si 𝒙𝒄 𝟐 < 𝒙𝒕 𝟐, entonces se acepta la 𝐻𝑜 y se rechaza la 𝐻𝑎 se concluye que las variables no están relacionadas. Gráfica de la distribución chi-cuadrado x2 a través de la cual podemos determinar la aceptación o rechazo de la hipótesis nula (Ho) Donde: - La región de rechazo se sustenta en base al nivel de significancia a la que siempre es posible asignarle un porcentaje comprendido regularmente entre 1% y 10%, es decir α=1%, 2%,…10%. - Valor crítico o de la tabla, el cual se calcula para un determinado grado de libertad (g.l.) y el nivel de significancia que se tome en consideración, este valor crítico representa el llamado chi-cuadrado de la tabla y se representa por la fórmula: 𝑋𝑡 2 = [g.l.α] 𝑋𝑡 2 = [(C-1) (r-1), α] • Determinamos el valor Chi-cuadrado crítico o de la tabla utilizando la siguiente fórmula: • 𝑋𝑡 2 = [g.l.α] 𝑋𝑡 2 = [(C-1) (r-1), α] 3er. paso • Realizar la decisión (comparar los estadísticos). Para hacer esta comparación se procede de la siguiente manera: 4to. paso Región de rechazo Escala de x2 Valor crítico Región de aceptación. Aceptar la hipótesis nula si el valor de x2 de la muestra cae en esta región. 𝒙𝒄 𝟐 < 𝒙𝒕 𝟐 X2=chi-cuadrado de la muestra 6 Donde: g.l.= grado de libertad=(r-1)(C-1), siendo r =no total de renglones y C= no total de columnas. α= nivel de significancia • Se concluye que: con un nivel de confianza del 99% o 95%, etc hay o existe independencia o dependencia entre las dos variables que se hayan investigado. 5to. Paso Conclusión: 7 EJERCICIO DE APLICACIÓN (ESTUDIO DE CASO) El señor George McMahon, presidente de la Compañía Nacional General Aseguradora de Salud, se opone al seguro de salubridad nacional. Argumenta que sería muy costoso de implantar, en particular debido a que la existencia de este sistema, entre otras cosas, tendería a fomentar en la gente permanecer más tiempo en los hospitales. George tiene la creencia de que las hospitalizaciones dependen del tipo de seguro de salud que tengan las personas. Le pide a Donna McClish, la especialista en estadística de la empresa, que verifique el asunto. Donna, recogió datos de una muestra aleatoria de 660 hospitalizaciones, y la información la resumió en una tabla de doble entrada, para la cual, se dan las frecuencias observadas, en las nueve diferentes hospitalizaciones y el tipo de seguro (o “celdas”) en que fue dividida la muestra. Donna desea probar la hipótesis: ¿Son independientes la estancia en un hospital y la cobertura de un seguro, con un nivel de significancia del 1% (α=0.01)? Datos de hospitalizaciones clasificados según el tipo de cobertura del seguro y el tiempo de estancia Fracción de costos cubiertos por el seguro Días de hospitalización <5 5-10 >10 Total < 25% 40 75 65 180 25-50% 30 45 75 150 >50% 40 100 190 330 Total 110 220 330 660 Solución: a) Calculamos las frecuencias esperadas de los datos muestrales que representa la tabla, esto es: fe (11)= 110 𝑥 180 660 =30 , fe (21)= 110 𝑥 150 660 =25 , fe (31)= 330 𝑥 330 660 =55 fe (12)= 220 𝑥 180 660 =60 , fe (22)= 220 𝑥 150 660 =50 , fe (32)= 330 𝑥 330 660 =110 fe (13)= 3300 𝑥 180 660 =90 , fe (23)= 330 𝑥 150 660 =75 , fe (33)= 330 𝑥 330 660 =165 b) Se aplica la regla de decisión, la cual consiste en desarrollar los 5 pasos que establece esta regla: 1. Planteamos la hipótesis nula y la alternativa, de la siguiente manera: H0= tiempo de estancia y tipo de seguro son independientes Ha= tiempo de estancia depende del tipo de seguro 10 4. Se realiza la decisión (comparar los estadísticos), es decir, comparamos el valor de chi-cuadrado de prueba ( 𝑥𝑐 2 =24.315) con el chi-cuadrado de la tabla o teórico (𝑥𝑡 2=13.28), esto es: 𝑥𝑐 2>𝑥𝑡 2 24.315 > 13.28 Luego: el chi-cuadrado de prueba es mayor que el chi-cuadrado de la tabla, se rechaza la hipótesis nula y se acepta la hipótesis alternativa, por lo tanto, se puede observar en la gráfica que el valor de la chi-cuadrada de prueba (𝑥𝑐 2=24.315) no cae en la región de aceptación (ver gráfica) Región de rechazo Se rechaza α=0.01 Ho 13.28 Escala de x2 Valor crítico 𝑥𝑐 2=24.315 (Valor chi-cuadrado de la muestra) 5. Conclusión Con un nivel de confianza del 99%, se concluye que: las hospitalizaciones dependen del tipo de seguro de salud que tengan las personas, es decir, la duración de las hospitalizaciones y la cobertura de los seguros son dependiente entre sí. PRÁCTICA O ecc dais dal la siguiente peegunta ¿ enlificuria el desempeño del señor Y Sono só de la regidas, malo? Las respuestas, clasificadas de acuerdo al nivel las encuestados, fueron: Viilizando un nivel del 9%, ¿podemos cooc huir que la enlificación de su desempe- fio va indepemibente del nuvei educacional de los encuestados? Supumga que se bere dus vesultajos de ma muesa alvatoria de 1,900 choctores €o un barrio de la condal, <'asificados por alibiación de partidos y preferencia sobre determonado programa. Proterumra Cora Probar la hipótesis, al civel del 9%, de que la afiliación ul partido mo tiene que ver con la preferencia de voto. 11
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved