Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

ESTADISTICA - ingenieria estadistica, Ejercicios de Estadística

Estadística - Qué es, definición y concepto ejercicios

Tipo: Ejercicios

2020/2021

Subido el 10/06/2021

jhon159
jhon159 🇵🇪

13 documentos

Vista previa parcial del texto

¡Descarga ESTADISTICA - ingenieria estadistica y más Ejercicios en PDF de Estadística solo en Docsity! USAC FACULTAD DE INGENIERÍA ÁREA DE ESTADÍSTICA Coordinación MANUAL DE ESTADÍSTICA DESCRIPTIVA Guatemala, noviembre 2011 ÍNDICE DE CONTENIDOS página ESTADÍSTICA DESCRIPTIVA ................................................................................................................................................ 1 DÍA 1.................................................................................................................................................................................. 1 I. UNIDAD: INTRODUCCIÓN A LA ESTADÍSTICA .................................................................................................................. 1 1.1 ESTADÍSTICA ................................................................................................................................................................ 1 1.2 TIPOS DE ESTADÍSTICA .................................................................................................................................................... 1 1.2.1 ESTADÍSTICA DESCRIPTIVA ............................................................................................................................................ 1 1.2.2 ESTADÍSTICA INFERENCIAL ............................................................................................................................................ 1 1.3 TIPOS DE VARIABLES ...................................................................................................................................................... 2 1.4 NIVELES DE MEDICIÓN .................................................................................................................................................... 2 1.5 RECOPILACIÓN DE DATOS ................................................................................................................................................ 4 1.5.1 FUENTES PARA OBTENER DATOS ..................................................................................................................................... 4 1.5.2 TÉCNICAS PARA RECOPILAR DATOS .................................................................................................................................. 4 DÍA 2.................................................................................................................................................................................. 5 II. UNIDAD: PRESENTACIÓN DE DATOS DE UNA SOLA VARIABLE ....................................................................................... 5 2.1 DISTRIBUCIÓN DE FRECUENCIAS ........................................................................................................................................ 5 2.1.1 INTERVALOS, MARCAS DE CLASE Y FRECUENCIAS ................................................................................................................. 5 2.1.2 CONSTRUCCIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS CUANTITATIVOS ................................................................. 6 2.1.3 DISTRIBUCIÓN DE FRECUENCIA RELATIVA .......................................................................................................................... 8 2.1.4 DISTRIBUCIONES DE FRECUENCIA ACUMULADA .................................................................................................................. 9 DÍA 3................................................................................................................................................................................ 10 2.2 PRESENTACIÓN GRÁFICA DE DATOS .................................................................................................................................. 10 2.2.1 DATOS CUALITATIVOS ................................................................................................................................................ 10 2.2.1.1 GRÁFICA DE BARRAS .............................................................................................................................................. 10 2.2.1.2 GRÁFICA CIRCULAR ............................................................................................................................................... 10 DÍA 4................................................................................................................................................................................ 10 2.2.2 DATOS CUANTITATIVOS ............................................................................................................................................. 10 2.2.2.1 HISTOGRAMA ....................................................................................................................................................... 10 2.2.2.2 POLÍGONO DE FRECUENCIAS ..................................................................................................................................... 10 2.2.2.3 OJIVA ................................................................................................................................................................. 11 2.2.2.4 GRÁFICAS DE PUNTOS............................................................................................................................................. 11 2.2.2.5 GRÁFICAS LINEALES................................................................................................................................................ 11 DÍA 5................................................................................................................................................................................ 11 III. UNIDAD: ANÁLISIS DESCRIPTIVO DE DATOS DE UNA SOLA VARIABLE ........................................................................................................................................................................................ 11 3. MEDIDAS DE POSICIÓN ................................................................................................................................................... 11 3.1 MEDIDAS DE TENDENCIA CENTRAL ................................................................................................................................... 11 3.1.1 MEDIA .................................................................................................................................................................. 11 3.1.1.1 MEDIA ARITMÉTICA .............................................................................................................................................. 12 3.1.1.2 MEDIA PONDERADA ............................................................................................................................................... 12 3.1.1.3 MEDIA GEOMÉTRICA .............................................................................................................................................. 13 3.1.2 MEDIANA .............................................................................................................................................................. 13 3.1.3 MODA .................................................................................................................................................................. 14 DÍA 6................................................................................................................................................................................ 15 2 Una segunda clasificación del muestreo surge en la forma en que se selecciona la muestra, así el muestreo puede ser con reemplazo y sin reemplazo. El muestreo con reemplazo es el muestreo en el cual cada miembro de una población puede seleccionarse más de una vez, cada vez que se toma un elemento la población conservará su tamaño. El Muestreo sin reemplazo es en el cual cada miembro de una población puede seleccionarse únicamente una vez y en este caso el tamaño de la población se va reduciendo conforme se conforma la muestra. 1.3 Tipos de variables Una variable es una característica de interés sobre cada elemento individual de una población o muestra. Un dato es el valor de la variable asociada a un elemento de una población o muestra. Este valor puede ser un número, una palabra o un símbolo. Un experimento es una actividad planeada cuyos resultados producen un conjunto de datos. Dependiendo del número de características que se analizan de la población, las variables se pueden clasificar en: a) Variables unidimensionales: sólo recogen información sobre una característica. Ejemplo: edad de los alumnos de una clase. b) Variables bidimensionales: recogen información sobre dos características de la población. Ejemplo: edad y altura de los alumnos de una clase. c) Variables pluridimensionales o multidimensionales: recogen información sobre tres o más características. Ejemplo: edad, altura y peso de los alumnos de una clase. Dependiendo del tipo de datos las variables pueden clasificarse en: a) Variables cualitativas o atributos: no se pueden medir numéricamente. Ejemplo: religión, nacionalidad, color de la piel, sexo. b) Variables cuantitativas: tienen valor numérico. Ejemplo: edad, longitud, precio. Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas. a) Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Estas variables representan conteos, por ejemplo: el número de alumnos en un salón de clase puede ser: 35, 60, 100, etc., nunca podrá ser 41.3. b) Continuas: pueden tomar cualquier valor real dentro de un intervalo. Estas variables representan mediciones, por ejemplo, la altura de una persona puede ser 1.35 m, 1.68, 1.90, etc. 1.4 Niveles de medición Los Niveles o Escalas de medición son las formas de clasificar los datos, pueden ser: a) Escala Nominal: se caracteriza por datos que consisten exclusivamente en nombres, rótulos o categorías. Los datos no pueden acomodarse según esquema de ordenamiento (digamos de bajo alto). El término nominal puede asociarse con “sólo nombres”. La escala de medida nominal, puede considerarse la escala de nivel más bajo, y consiste en la asignación, puramente arbitraria de números o símbolos a cada una de las diferentes categorías en las cuales podemos dividir el carácter que observamos, sin que puedan establecerse relaciones entre dichas categorías, a no ser el de que cada elemento pueda pertenecer a una y solo una de estas categorías. Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma sean equivalentes respecto del atributo o propiedad en estudio, después de lo cual se 3 asignan nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se le atribuyan números, puede ser una de las razones por las cuales se le conoce como "medidas nominales". Se ha de tener presente que los números asignados a cada categoría sirven única y exclusivamente para identificar la categoría y no poseen propiedades cuantitativas. b) Escala Ordinal: implica datos que pueden acomodarse en algún orden, pero no es posible determinar diferencias entre los valores de los datos, o tales diferencias carecen de significado. En caso de que puedan detectarse diversos grados de un atributo o propiedad de un objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de "orden" de los números asignándolo a los objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse que A posee un mayor grado de atributo que B. La asignación de números a las distintas categorías no puede ser completamente arbitraria, debe hacerse atendiendo al orden existente entre éstas. Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de poder ordenar todas sus categorías, el cálculo de las medidas estadísticas de posición, como por ejemplo la mediana. Ejemplo: Al asignar un número a los vehículos en un taller de servicio, según el orden de llegada, estamos llevando una escala ordinal, es decir que al primero en llegar le asignamos el nº 1, al siguiente el nº 2 y así sucesivamente, de esta forma, cada número representará una categoría en general, con un solo elemento y se puede establecer relaciones entre ellas, ya que los números asignados guardan la misma relación que el orden de llegada al taller. c) Escalas por intervalos es como el nivel ordinal, con la propiedad adicional que podemos determinar magnitudes de diferencias entre los datos que tienen algún significado. Sin embargo, no hay un punto de partida o cero inherente (natural) en el que la cantidad esté totalmente ausente. En esta escala, además de poseer las características de la escala ordinal, encontramos que la asignación de los números a los elementos es tan precisa que podemos determinar la magnitud de los intervalos (distancia) entre todos los elementos de la escala. Sin lugar a dudas, podemos decir que la escala por intervalos es la primera escala verdaderamente cuantitativa y a los caracteres que posean esta escala de medida pueden calculársele todas las medidas estadísticas a excepción del coeficiente de variación. Ejemplos: El lapso transcurrido entre 1998-1999 es igual al que transcurrió entre 2000-2001. Si a una hora tenemos una temperatura ambiente de 15ºC significa que hace frío, si después de varias horas la temperatura cambia a 30ºC no significa que hace el doble de frío, y si se tuviera 0ºC no significa que ya no hace frío o bien que no hay temperatura. d) Escala de razón: Es el nivel de medida más elevado y se diferencia de las escalas de intervalos únicamente por poseer un punto cero propio como origen; es decir que el valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se observa una carencia total de propiedad, se dispone de una unidad de medida para el efecto. A iguales diferencias entre los números asignados corresponden iguales diferencias 4 en el grado de atributo presente en el objeto de estudio. Además, siendo que cero ya no es arbitrario, sino un valor absoluto, podemos decir que A tiene dos, tres o cuatro veces la magnitud de la propiedad presente en B. 1.5 Recopilación de datos 1.5.1 Fuentes para obtener datos Los datos pueden obtenerse de dos tipos de fuentes: a) Fuentes internas: cuando los datos son parte de la propia actividad del ente que los recopila, se dice que el dato es interno y la fuente es interna. b) Fuentes externas: cuando se tiene que otras empresas, instituciones, poblaciones, etc., fuera del ente recopilador. 1.5.2 Técnicas para recopilar datos Para obtener la información existen varias técnicas, entre estas: encuesta, entrevista, cuestionario y observación. a) Encuesta: Conjunto de preguntas tipificadas dirigidas a una muestra representativa, para averiguar estados de opinión o diversas cuestiones de hecho. A diferencia de un censo, donde todos los miembros de la población son estudiados, las encuestas recogen información de una porción de la población de interés, dependiendo el tamaño de la muestra en el propósito del estudio. b) Entrevista: Las entrevistas se utilizan para recabar información en forma verbal, a través de preguntas que propone el analista. Quienes responden pueden ser gerentes o empleados, los cuales son usuarios actuales del sistema existente, usuarios potenciales del sistema propuesto o aquellos que proporcionarán datos o serán afectados por la aplicación propuesta. El analista puede entrevistar al personal en forma individual o en grupos. Sin embargo, las entrevistas no siempre son la mejor fuente de datos de aplicación. En otras palabras, la entrevista es un intercambio de información que se efectúa cara a cara. Es un canal de comunicación entre el analista y la organización; sirve para obtener información acerca de las necesidades y la manera de satisfacerlas, así como concejo y comprensión por parte del usuario para toda idea o método nuevos. Por otra parte, la entrevista ofrece al analista una excelente oportunidad para establecer una corriente de simpatía con el personal usuario, lo cual es fundamental en transcurso del estudio. c) Cuestionario: se entiende por cuestionario a la lista de preguntas que se proponen por cualquier fin, el cuestionario proporcionan una alternativa muy útil para la entrevista; si embargo, existen ciertas características que pueden ser apropiada en algunas situaciones e inapropiadas en otra. Al igual que la entrevistas, deben diseñarse cuidadosamente para una máxima efectividad. d) Observación: Otra técnica útil para el analista en su progreso de investigación, consiste en observar a las personas cuando efectúan su trabajo. Como técnica de investigación, la observación tiene amplia aceptación científica. Los sociólogos, sicólogos e ingenieros industriales utilizan extensamente ésta técnica con el fin de estudiar a las personas en sus actividades de grupo y como miembros de la organización. El propósito de la organización es múltiple: permite al analista determinar que se está haciendo, como se está haciendo, quien lo hace, cuando se lleva a cabo, cuánto tiempo toma, dónde se hace y por qué se hace. 7 15 21 23 24 25 27 28 29 32 36 43 18 21 23 24 25 27 28 29 33 37 43 18 22 23 24 26 27 28 30 33 38 45 18 22 23 25 26 27 29 31 34 38 48 20 22 23 25 26 28 29 32 35 41 63 Segundo Calcular el número de clases. K = 1 + 3.3 Log (55) K = 6.743 De acuerdo a la regla de Sturges, deberíamos tener 6 ó 7 clases. Para efectos de cálculos el valor de K se aproxima el entero más próximo. K = 7 Tercero. Calcular la amplitud. Para esto previamente identificamos el dato mayor y el menor, en nuestro caso tales datos son 15 y 63 A = 63 - 15 7 A = 6.857 La amplitud debe aproximarse al entero más cercano. A = 7 Cuarto. Una vez determinado el número de de clases y la amplitud, debe elegirse el extremo inferior de la primera clase. Dado que aquí el valor mínimo es 15, el extremo inferior puede ser 15 o menos; por consiguiente tomaremos como criterio usar el número 15. Quinto. Establecido el extremo inferior, se sumará la amplitud a éste para obtener el valor del límite inferior de la siguiente clase y así sucesivamente. Para obtener los límites superiores, se le resta uno al límite inferior posterior. Se tiene que tomar en cuenta que en la última clase esté contenido el dato mayor. Sexto. Corresponde ahora calcular la frontera inferior de la clase. Puesto que los valores están dados en números enteros y como las fronteras deben darse con un decimal más, tomamos como frontera inferior el valor de la primera clase inferior menos 0.05 (si los valores se hubieran dado con un decimal, se le restaría 0.005) y como frontera superior el valor de la primera clase superior más 0.05 (si los valores se hubieran dado con un decimal, se le sumaría 0.005) 8 Intervalo de Frontera Frontera Amplitud clase Inferior Superior de clase 15 - 21 14.5 21.5 7 22 - 28 21.5 28.5 7 29 - 35 28.5 35.5 7 36 - 42 35.5 42.5 7 43 - 49 42.5 49.5 7 50 - 56 49.5 56.5 7 57 - 63 56.5 63.5 7 Séptimo. Una vez construidos los diversos intervalos de clase, se cuenta el número de elementos que cae en cada uno, obteniéndose así las respectivas frecuencias. Tabla No. 3 Distribución de frecuencia Velocidades de un grupo de conductores en una autopista Intervalo de clase frecuencia 15 - 21 7 22 - 28 26 29 - 35 12 36 - 42 5 43 - 49 4 50 - 56 1 T o t al 55 2.1.3 Distribución de frecuencia relativa La distribución de frecuencias es una tabla resumen en la que los datos originales se condensan o agrupan para facilitar el análisis de los datos. Sin embargo, para ampliar el análisis, es deseable formar la distribución de frecuencia relativa o la distribución de porcentaje, dependiendo de si se prefieren fracciones o porcentajes. La frecuencia relativa (fr) es la relación entre la frecuencia de un intervalo y el número total de datos: fr = fi/n La frecuencia porcentual (fr%) es la expresión en porcentaje de la frecuencia relativa: (fr%) = fr * 100 Tabla No. 4 Distribución de frecuencias absoluta y relativa Velocidades de un grupo de conductores en una autopista frecuencia absoluta frecuencia realtiva frecuencia porcentual f fr fr% 15 - 21 7 0.1273 12.73 22 - 28 26 0.4727 47.27 29 - 35 12 0.2182 21.82 36 - 42 5 0.0909 9.09 43 - 49 4 0.0727 7.27 50 - 56 1 0.0182 1.82 55 1.0000 100.00 Intervalo de clase T o t al 9 2.1.4 Distribuciones de frecuencia acumulada Otras representaciones de datos que facilitan el análisis y la interpretación son las distribuciones acumulativas. Éstas pueden desarrollarse a partir de la tabla de distribución de frecuencia, de la tabla de distribución de frecuencia relativa y de la tabla de distribución de frecuencia porcentual La frecuencia acumulada (F) indica el número de observaciones acumuladas en cada intervalo. Para calcularla, en cada intervalo se consideran las frecuencias anteriores, de tal forma que el último intervalo contenga el total de observaciones. Dependiendo de la preferencia o necesidad para presentar los resultados, esta frecuencia puede calcularse utilizando las frecuencias relativas, en este caso se denomina frecuencia relativa acumulada (Fr) o bien si se usa la frecuencia porcentual frecuencia relativa porcentual acumulada (Fr%). Tabla No. 5 Distribución de frecuencia acumulada Velocidades de un grupo de conductores en una autopista Tabla No. 6 Distribución de frecuencia relativa acumulada Velocidades de un grupo de conductores en una autopista Tabla No. 7 Distribución de frecuencia relativa porcentual acumulada Velocidades de un grupo de conductores en una autopista frecuencia absoluta frecuencia acumulada f F 15 - 21 7 7 22 - 28 26 33 29 - 35 12 45 36 - 42 5 50 43 - 49 4 54 50 - 56 1 55 T o t al 55 Intervalo de clase frecuencia absoluta frecuencia realtiva frecuencia relativa acumulada f fr Fr 15 - 21 7 0.1273 0.1273 22 - 28 26 0.4727 0.6000 29 - 35 12 0.2182 0.8182 36 - 42 5 0.0909 0.9091 43 - 49 4 0.0727 0.9818 50 - 56 1 0.0182 1.0000 55 1.0000 Intervalo de clase T o t al frecuencia porcentual frecuencia porcentual acumulada fr Fr 15 - 21 12.73% 12.73% 22 - 28 47.27% 60.00% 29 - 35 21.82% 81.82% 36 - 42 9.09% 90.91% 43 - 49 7.27% 98.18% 50 - 56 1.82% 100.00% 100.00% Intervalo de clase T o t al 12 puede servir de base para medir o evaluar valores extremos y brinda mayor facilidad para efectuar comparaciones. Es importante poner en relieve que la notación de promedio lleva implícita la idea de variación y que este número promedio debe cumplir con la condición de ser representativo de conjunto de datos. El promedio como punto típico de los datos es el valor al rededor del cual se agrupan los demás valores de la variable. 3.1.1.1 Media Aritmética Es una medida matemática, un número individual que representa razonablemente el comportamiento de todos los datos. Características de la Media: a. En su cálculo están todos los valores del conjunto de datos por lo que cada uno afecta la media. b. La suma algebraica de las desviaciones de los valores individuales respecto a la media es cero. c. La suma del cuadrado de las desviaciones de una serie de datos a cualquier número A es mínimo si A = X d. Aunque es confiable porque refleja todos los valores del conjunto de datos puede ser afectada por los valores extremos, y de esa forma llegar a ser una medida menos representativa, por lo que si la distribución es asimétrica, la media aritmética no constituye un valor típico. CÁLCULO DE LA MEDIA ARITMÉTICA Para datos no agrupados n x X i __ Para datos agrupados if fx X ii   )*( __ 3.1.1.2 Media ponderada La media ponderada toma en cuenta la importancia relativa de las observaciones, así, para cada uno de los valores de xi se asigna un factor wi de peso, que depende de la importancia que el investigador desee darle. CÁLCULO DE LA MEDIA PONDERADA Para datos no agrupados i ii w w wx X   )*( __ Para datos no agrupados ii ii w wf wx X   * )*(__ 13 3.1.1.3 Media geométrica La media geométrica es útil cuando la variable cambia a lo largo del tiempo, esto es, en el cálculo del promedio de tasas, razones, proporciones geométricas y relaciones de variables. Se utiliza en Matemáticas Financieras y Finanzas para promediar números índices, tasas de cambio, etc. Esta media se ve afectada por todos los números y valores extremos pero en menor grado que la Media Aritmética, su valor siempre es menor que el de ésta. Según el tipo de datos que se analice será más apropiado utilizar la media aritmética o la media geométrica. La media geométrica se suele utilizar en series de datos como tipos de interés anuales, inflación, etc., donde el valor de cada año tiene un efecto multiplicativo sobre el de los años anteriores. En todo caso, la media aritmética es la medida de posición central más utilizada. La media Geométrica de una serie de números es la raíz n-ésima del producto de esos números: CÁLCULO DE LA MEDIA GEOMÉTRICA n nG xxxxX *...** 321 __  3.1.2 Mediana Es el valor de la observación que ocupa la posición central de un conjunto de datos ordenados según su magnitud. Es el valor medio o la media aritmética de los valores medios. La mediana es un valor de la variable que deja por debajo de él un número de casos igual al que deja por arriba. Geométricamente la mediana es el valor de la variable que corresponde a la vertical que divide al histograma en dos áreas iguales. Cuando determinados valores de un conjunto de observaciones son muy grandes o pequeños con respecto a los demás, entonces la media aritmética se puede distorsionar y perder su carácter representativo, en esos casos es conveniente utilizar la mediana como medida de tendencia central, es decir que la mediana no presenta el problema de estar influida por los valores extremos, pero en cambio no utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido). Características de la mediana a. Es una medida de tendencia central no afectada por los valores extremos. b. No está definida algebraicamente. c. Cuando la localización del elemento central puede ser determinada y los límites de clase mediana son conocidos, la mediana para la distribución de frecuencias puede ser calculada por interpolación, no importando que ésta contenga intervalos abiertos, cerrados, iguales o diferentes. d. La suma de los valores absolutos, sin considerar el signo, de las desviaciones individuales respecto a la mediana es mínimo. e. La mediana en caso de una distribución asimétrica, no resulta desplazado del punto de tendencia central. f. Si el universo tiene curtosis excesiva la mediana como estadístico, varía menos que cualquier otra medida. 14 g. Si la mediana se calcula por interpolación y hay lagunas en los valores de la clase mediana o los datos son irregulares, esta medida no es buena ya que su ubicación puede resultar falsa. h. Si se desea ubicar las condiciones de un elemento en una clase, la mediana resulta se indicada, ya que por comparación pone en evidencia si un elemento está en la mitad superior a ella o en la inferior. CÁLCULO DE LA MEDIANA Para datos no agrupados: 1ero. Se ordenan los datos ascendentemente. 2do. La mediana corresponde al dato que está en la posición central. Para datos agrupados 1ero. Se calcula la clase de la mediana, la cual corresponde a la clase cuya frecuencia acumulada es mayor o igual a n/2. 2do. En la clase de la mediana se aplica la siguiente fórmula: A f Fn LM me mee *2           Donde : Lme = Límite real inferior de la clase de la mediana F = frecuencia acumulada de la clase anterior a la mediana fme = frecuencia absoluta de la clase de la mediana A = amplitud del intervalo de la clase de la mediana 3.1.3 Moda Es el valor de un conjunto de datos que ocurre más frecuentemente, se considera como el valor más típico de una serie de datos. Para datos agrupados se define como Clase Modal el intervalo que tiene más frecuencia. La moda puede no existir o no ser única, las distribuciones que presentan dos o más máximos relativos se designan de modo general como bimodales o multimodales respectivamente. Características de la Moda: a. Representa más elementos que cualquier otro valor b. No está afectada por los valores extremos pero para datos continuos es dudoso su cálculo. c. La moda para una distribución de frecuencias de datos agrupados no puede ser calculada exactamente, el valor de la moda puede ser afectado por el método de agrupación de los intervalos de clase. d. La moda no permite conocer la mayor parte de los datos. e. Algunas veces el azar interviene de manera importante y hace que un valor no representativo se repita frecuentemente. f. Puede usarse para datos cuantitativos como cualitativos. g. La moda como estadístico, varía mucho de una muestra a otra. 17 Asimismo, la dispersión puede medirse desde tres enfoques, la distancia, la dispersión promedio y la dispersión relativa. 3.3.1 Medidas de distancia La dispersión puede medirse en términos de la diferencia entre dos valores seleccionados del conjunto de datos, a continuación se presentan tres de las llamadas medidas de distancia. 3.3.1.1 Rango Es la diferencia entre el más alto y el más pequeño de los valores observados. El rango es fácil de entender y de calcular, pero su utilidad como medida de dispersión es limitada, pues solo toma en cuenta el valor más grande y el más pequeño y ninguna otra observación del conjunto de datos, restándole importancia a las variaciones entre todas las demás observaciones. RANGO (R) R = Dato mayor – Dato menor 3.3.1.2 Rango Intercuartilico El rango intercuartilico mide aproximadamente qué tan lejos de la mediana se debe ir en cualquiera de las dos direcciones antes de recorrer una mitad de los valores del conjunto de datos. RANGO INTERCUARTÍLICO (RIQ) RIQ = Q3 – Q1 3.3.1.3 Rango Interpercentìlico Es una medida de dispersión de la diferencia entre los valores del percentil 90 y el percentil 10. RANGO INTERPERCENTÌLICO (RIP) RIP = P90 - P10 3.3.2 Medidas de desviación promedio Las descripciones más completas de la dispersión son aquellas que manejan la desviación promedio respecto a alguna medida de tendencia central. En esta clasificación las más utilizadas son la varianza y la desviación estándar. Ambas medidas dan una distancia promedio de cualquier observación del conjunto de datos respecto a la media de la distribución. 3.3.2.1 Varianza Medida del cuadrado de la distancia promedio entre la media y cada observación de la población. VARIANZA DE POBLACIÓN ( 2 )   N x  2 2  VARIANZA DE DATOS AGRUPADOS DE POBLACIÓN ( 2 )   N xif  2 2 *  18 VARIANZA DE UNA MUESTRA (S2)    1 2 2     n Xx S VARIANZA DE DATOS AGRUPADOS DE MUESTRA ( 2S )    1 * 22     n Xxif S 3.3.2.2. Desviación Estándar Se calcula obteniendo la raíz cuadrada positiva de la varianza. Esta medida de dispersión tiene las mismas unidades que los datos originales, a diferencia de la varianza en la que las unidades están expresadas por los cuadrados de las unidades. 3.3.3 Dispersión relativa La desviación estándar es una medida absoluta de la dispersión que expresa la variación en las mismas unidades que los datos originales, el coeficiente de variación es una medida relativa de dispersión que relaciona la desviación estándar y la media, expresando la desviación estándar como porcentaje de la media, la unidad de media es entonces “porcentaje”, en lugar de las unidades de los datos originales. El interés del coeficiente de variación es que al ser un porcentaje permite comparar el nivel de dispersión de dos muestras. Esto no ocurre con la desviación típica, ya que viene expresada en las mismas unidas que los datos de la serie. COEFICIENTE DE VARIACIÓN (CV) 100*   CV DÍA 8 3.4 Medidas de forma La forma es la manera en que los datos se distribuyen, es decir la forma que tiene la curva que representa la serie de datos muestrales. La forma se mide en dos aspectos: Sesgo o Asimetría y Curtosis o Apuntamiento. 3.4.1 Sesgo (Asimetría) Mide si la curva de la gráfica que representa a los datos es simétrica respecto al eje vertical, si lo es se dice que la hay simetría (distribución Simétrica o Insesgada) y si no lo es se dice que es Asimétrica o Sesgada. 19 Existen varias formas de calcular el sesgo de una distribución, a continuación se presentan dos de ellas: COEFICIENTES DE SESGO DE PEARSON (SK1 Y SK2) S MoXSk 1 S MeXSk )(32   SESGO EN FUNCIÓN DE CUANTILES O FRACTILOS Sesgo cuartìlico Sesgo percentìlico 13 123 3 2 QQ QQQSk    1090 105090 4 2 PP PPPSk    El signo en los coeficientes de sesgo determina la asimetría: El signo positivo corresponde a una distribución asimétrica positiva El signo negativo corresponde a una distribución asimétrica negativa Asimismo, cuando el coeficiente de sesgo es igual a 0, indica que la distribución es simétrica. 3.4.2 Curtosis (apuntamiento) Mide la altura o grado de apuntamiento de la gráfica que representa a los datos (eje horizontal). Se definen 3 tipos de distribuciones según su grado de curtosis: Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable. El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución, se calcula a través de la siguiente fórmula:
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved