Medidas de Localización

Si estas medidas las calcula con los datos de una muestra, se llaman estadísticos muestrales. Si estas medidas las calcula con los datos de una población se llaman parámetros poblacionales. En inferencia estadística, al estadístico muestral se le conoce como el estimador puntual del correspondiente parámetro poblacional.


 Media.

En la fórmula anterior el numerador es la suma de los valores de las n observaciones. Es decir:













Mediana.
La mediana es otra medida de localización central. Es el valor de enmedio en los datos ordenados de menor a mayor (en forma ascendente). Cuando tiene un número impar de observaciones, la mediana es el valor de enmedio. Cuando la cantidad de observaciones es par, no hay un número enmedio. En este caso, se sigue una convención y la mediana es definida como el promedio de las dos observaciones de enmedio. Por conveniencia, la definición de mediana se replantea así:

Ordenar los datos de menor a mayor (en forma ascendente).
a. Si el número de observaciones es impar, la mediana es el valor de enmedio.
b. Si el número de observaciones es par, la mediana es el promedio de las dos observaciones de enmedio. Aunque la media es la medida de localización central más empleada, en algunas situaciones se prefiere la mediana. A la media la influyen datos en extremo pequeños o considerablemente grandes. Es posible decir que cuando los datos contengan valores extremos, es preferible usar a la mediana como medida de localización central.

Moda.
La tercera medida de localización es la moda. La moda se define como sigue: Es el valor que se presenta con mayor frecuencia.

Hay situaciones en que la frecuencia mayor se presenta con dos o más valores distintos. Cuando esto ocurre hay más de una moda. Si los datos contienen más de una moda se dice que los datos son bimodales. Si contienen más de dos modas, son multimodales. En los casos multimodales casi nunca se da la moda, porque dar tres o más modas no resulta de mucha ayuda para describir la localización de los datos.

Percentiles.
Un percentil aporta información acerca de la dispersión de los datos en el intervalo que va del menor al mayor valor de los datos. En los conjuntos de datos que no tienen muchos valores repetidos, el percentil p divide a los datos en dos partes. Cerca de p por ciento de las observaciones tienen valores menores que el percentil p y aproximadamente (100-p) por ciento de las observaciones tienen valores mayores que el percentil p. El percentil p se define como sigue:

El percentil p es un valor tal que por lo menos p por ciento de las observaciones son menores o iguales que este valor y por lo menos (100-p) por ciento de las observaciones son mayores o iguales que este valor.

Para calcular el percentil p se emplea el procedimiento siguiente.

Paso 1. Ordenar los datos de menor a mayor (colocar los datos en orden ascendente).
Paso 2.Calcular el índice i.

i = (p/100) n

Donde p es el percentil deseado y n es el número de observaciones.
Paso 3.
(a) Si i no es un número entero, debe redondearlo. El primer entero mayor que i denota la posición del percentil p.
(b) Si i es un número entero, el percentil p es el promedio de los valores en las posiciones i e i + 1.


Cuartiles.

Con frecuencia es conveniente dividir los datos en cuatro partes; así, cada parte contiene una cuarta parte o 25% de las observaciones. En la figura mostrada previamente se muestra una distribución de datos dividida en cuatro partes. A los puntos de división se les conoce como cuartiles y están definidos como sigue:


Q1 = Primer Cuartil, o percentil 25.
Q2 = Segundo Cuartil, o percentil 50.
Q3 = Tercer Cuartil, o percentil 75.
Q4 = Cuarto Cuartil, o percentil 100.

Los cuartiles han sido definidos como el percentil 25, el percentil 50 y el percentil 75. Por lo que los cuartiles se calculan de la misma manera que los percentiles. Sin embargo, algunas veces se siguen otras convenciones para calcular los cuartiles, por ello los valores que se dan para los cuartiles varían ligeramente, dependiendo de la convención que se siga. De cualquier manera, el objetivo de calcular los cuartiles siempre es dividir los datos en cuatro partes iguales.

Cuando el conjunto de datos contiene valores extremos, es preferible usar la mediana que la media como unidad de localización central. Otra medida que suele ser usada cuando hay valores extremos es la media recortada. La media recortada se obtiene eliminando del conjunto de datos un determinado porcentaje de los valores menores y mayores y calculando después la media de los valores restantes. Por ejemplo, la media recortada a 5% se obtiene eliminando el 5% menor y el 5% mayor de los valores y calculando después la media de los valores restantes.

Fuente: Anderson, Sweeney & Williams – Estadística para Administración y Economía.









Comentarios