Análisis exploratorio de datos

El análisis exploratorio de datos permite usar operaciones aritméticas sencillas y representaciones gráficas fáciles de dibujar para resumir datos.


Resumen de cinco números.
En el resumen de cinco números se usan los cinco números siguientes para resumir los datos.
1. El valor menor.
2. El primer cuartil (Q1).
3. La mediana (Q2).
4. El tercer cuartil (Q3).
5. El valor mayor.

La manera más fácil de elaborar un resumen de cinco números es, primero, colocar los datos en orden ascendente. Hecho esto, es fácil identificar el valor menor, los tres cuartiles y el valor mayor. Entre cada dos números adyacentes del resumen de cinco números se encuentran aproximadamente 25% de los datos.

Diagrama de caja.
Un diagrama de caja es un resumen gráfico de los datos con base en el resumen de cinco números. La clave para la elaboración de un diagrama de caja es el cálculo de la mediana y de los cuartiles Q1 y Q3. También se necesita el rango intercuartílico, RIC = Q3-Q1. Los pasos para elaborar un diagrama de caja son los siguientes.

1. Se dibuja una caja cuyos extremos se localicen en el primer y tercer cuartiles. Esta caja contiene 50% de los datos centrales.

2. En el punto donde se localiza la mediana se traza una línea vertical.

3. Usando el rango intercuartílico, RIC = Q3 – Q1, se localizan los límites. En un diagrama de caja los límites se encuentran 1.5 (RIC) abajo del Q1 y 1.5 (RIC) arriba del Q3. Los datos que quedan fuera de estos límites se consideran observaciones atípicas.

4. A las líneas punteadas se les llama bigotes. Los bigotes van desde los extremos de la caja hasta los valores menor y mayor de los límites calculados en el paso 3.

5. Por último mediante un asterisco se indica la localización de las observaciones atípicas.



Fuente: Anderson, Sweeney & Williams – Estadística para Administración y Economía.









Comentarios

Lo más popular de la semana

25 Preguntas de Ciencia y Tecnología

25 Preguntas de Economía