MEDIDAS DE DISPERSIÓN
Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución.Las medidas de dispersión son:
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.
Desviación media
La desviación respecto a la media es la diferencia entre cada valor de la variable estadística y la media aritmética.
Di = x - x
La desviación media es la media aritmética de los valores absolutos
de las desviaciones respecto a la media.
La desviación media se representa por
Ejemplo
Calcular la desviación media de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
Desviación media para datos agrupados
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es:
Ejemplo
Calcular la desviación media de la distribución:
xi | fi | xi · fi | |x - x| | |x - x| · fi | |
[10, 15) | 12.5 | 3 | 37.5 | 9.286 | 27.858 |
---|---|---|---|---|---|
[15, 20) | 17.5 | 5 | 87.5 | 4.286 | 21.43 |
[20, 25) | 22.5 | 7 | 157.5 | 0.714 | 4.998 |
[25, 30) | 27.5 | 4 | 110 | 5.714 | 22.856 |
[30, 35) | 32.5 | 2 | 65 | 10.174 | 21.428 |
21 | 457.5 | 98.57 |
Varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.
La varianza se representa por .
Varianza para datos agrupados
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Varianza para datos agrupados
Ejercicios de varianza
Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
Calcular la varianza de la distribución de la tabla:
xi | fi | xi · fi | xi2 · fi | |
---|---|---|---|---|
[10, 20) | 15 | 1 | 15 | 225 |
[20, 30) | 25 | 8 | 200 | 5000 |
[30,40) | 35 | 10 | 350 | 12 250 |
[40, 50) | 45 | 9 | 405 | 18 225 |
[50, 60 | 55 | 8 | 440 | 24 200 |
[60,70) | 65 | 4 | 260 | 16 900 |
[70, 80) | 75 | 2 | 150 | 11 250 |
42 | 1 820 | 88 050 |
Para Datos Agrupados en Intervalos
Se emplea la ecuación:
Donde xm es la marca de clase.
Ejemplo ilustrativo: Calcular la desviación media de un curso de 40 estudiantes en la asignatura de Estadística en base a la siguiente tabla:
Calificación
|
Cantidad de estudiantes
| |
2-4
|
6
| |
4-6
|
8
| |
6-8
|
16
| |
8-10
|
10
| |
Total
|
40
|
Solución:
Para calcular la media aritmética se llena la siguiente tabla:
Intervalo
|
f
|
xm
|
f·xm
| |
2-4
|
6
|
3
|
18
| |
4-6
|
8
|
5
|
40
| |
6-8
|
16
|
7
|
112
| |
8-10
|
10
|
9
|
90
| |
Total
|
40
|
260
|
Calculando la media aritmética se obtiene:
Varianza y desviación estándar
La varianza es la media aritmética de los cuadrados de las desviaciones respecto a la media aritmética, es decir, es el promedio de las desviaciones de la media elevadas al cuadrado. La desviación estándar o desviación típica es la raíz de la varianza.
La varianza y la desviación estándar proporcionan una medida sobre el punto hasta el cual se dispersan las observaciones alrededor de su media aritmética.
2.1) PROPIEDADES
- La varianza y desviación estándar (o cualquier otra medida de dispersión) indican el grado en que están dispersos los datos en una distribución. A mayor medida, mayor dispersión.
- La varianza es un número muy grande con respecto a las observaciones, por lo que con frecuencia se vuelve difícil para trabajar.
- Debido a que las desviaciones son elevadas al cuadrado y la varianza siempre se expresa en términos de los datos originales elevados al cuadrado, se obtiene unidades de medida de los datos que no tiene sentido o interpretación lógica. Por ejemplo, si se calcula la varianza de una distribución de datos medidos en metros, segundos, dólares, etc, se obtendrá una varianza mediada en metros cuadrados, segundos cuadrados, dólares cuadrados, respectivamente, unidades de medida que no tienen significado lógico respecto a los datos originales.
- Para solucionar las complicaciones que se tiene con la varianza, se halla la raíz cuadrada de la misma, es decir, se calcula la desviación estándar, la cual es un número pequeño expresado en unidades de los datos originales y que tiene un significado lógico respeto a los mismos.
A pesar de lo anterior, es difícil describir exactamente qué es lo que mide la desviación estándar. Sin embargo, hay un resultado útil, que lleva el nombre del matemático ruso Pafnuty Lvovich Chebyshev, y se aplica a todos los conjuntos de datos. Este teorema de Chebyshev establece que para todo conjunto de datos, por lo menos 1- 1/k2 de las observaciones están dentro de k desviaciones estándar de la media, en donde k es cualquier número mayor que 1. Este teorema se expresa de la siguiente manera:
Así por ejemplo, si se forma una distribución de datos con k =3 desviaciones estándar por debajo de la media hasta 3 desviaciones estándar por encima de la media, entonces por lo menos
Interpretación: El 88,89% de todas las observaciones estarán dentro ± 3 desviaciones de la media.
MÉTODOS DE CÁLCULO
Para Datos No Agrupados
La varianza para una población se calcula con:
Gracias muy bueno y completo el blog
ResponderEliminar