En esta fórmula, a cada xi se le
da la misma importancia o el mismo peso. Aunque esto es lo más común, en
algunas situaciones la media se calcula dando a cada observación un peso que
refleja su importancia. A una media calculada de esta manera se le llama media
ponderada.
Media ponderada.
La media ponderada se calcula:
Donde xi es el valor de la
observación i, y wi es el peso para la observación i.
Si los datos provienen de una muestra, la
ecuación proporciona la media ponderada muestral. Si son de una población, se
obtiene la media ponderada poblacional.
La selección de las ponderaciones para el
cálculo de una determinada media ponderada dependen de la aplicación. En cualquier
caso, si la importancia de las observaciones varía, el analista debe elegir los
pesos que mejor reflejen la relevancia de cada observación en la determinación
de la media.
Datos agrupados.
En la mayor parte de los casos, las medidas
de localización y variabilidad se calculan mediante los valores individuales de
los datos. Sin embargo, otras veces sólo se tienen datos agrupados o datos en
una distribución de frecuencias. En la argumentación siguiente se muestra cómo
usar la fórmula de la media ponderada para obtener aproximaciones a la media,
la varianza y la desviación estándar de datos agrupados.
Para calcular la media usando datos
agrupados, considere el punto medio de cada clase como representativo de los
elementos de esa clase. Si Mi denota el punto medio de la clase i y
fi denota la frecuencia de la clase i. Entonces la fórmula para la
media ponderada se usa con los valores de los datos denotados por Mi
y los pesos dados por las frecuencias fi. En este caso, el denominador
de la ecuación es la suma de las frecuencias, que es el tamaño de la muestra n.
Es decir, Σfi=n. De manera que la
ecuación para la media muestral de datos agrupados es la siguiente:
Donde Mi es el punto medio de la
clase i, fi es la frecuencia de la clase i, y n es el tamaño de la
muestra.
Para calcular la varianza de datos agrupados
se emplea una versión ligeramente modificada de la fórmula para la varianza de
datos no agrupados. En esa ecuación los cuadrados de las desviaciones de los
datos respecto a la media muestral se escribieron como (xi-x)2.
Pero cuando se tienen datos agrupados no se conocen los valores. En este caso,
se considera el punto medio de clase, Mi, como representativo de los
valores xi de la clase correspondiente. Por tanto, los cuadrados de
las desviaciones respecto a la media (xi-x)2 son
sustituidos por (Mi-x)2. Entonces, igual que en el
cálculo de la media muestral de datos agrupados, pondere cada valor por la
frecuencia de la clase, fi. La suma de los cuadrados de las
desviaciones respecto a la media de todos los datos se aproxima mediante Σfi(Mi-x)2.
En el denominador aparece el término n – 1 en lugar de n, con objeto de hacer
que la varianza muestral sea un estimador de la varianza poblacional. Por
consiguiente, la fórmula usada para obtener la varianza muestral de datos
agrupados es:
La
desviación estándar de datos agrupados es simplemente la raíz cuadrada de la
varianza de los datos agrupados.
El cálculo de las medidas poblacionales es
semejante. A continuación se presentan las fórmulas para la media y la varianza
poblacional de datos agrupados.
Al
calcular los estadísticos descriptivos de datos agrupados, se usan los puntos
medios de clase para aproximar los valores de los datos de cada clase. Por
tanto, los estadísticos descriptivos de datos agrupados aproximan los
estadísticos descriptivos que se obtendrían si se usaran los datos originales.
En consecuencia, es recomendable calcular los estadísticos descriptivos con los
datos originales y no con los datos agrupados, siempre que sea posible.
Fuente:
Anderson, Sweeney & Williams –
Estadística para Administración y Economía, p. 119 – 122.
Comentarios
Publicar un comentario
Si deseas comentar dentro de la línea del respeto, eres bienvenido para expresarte