Tabulaciones cruzadas y diagramas de dispersión

Con frecuencia, los directivos o quienes deben tomar decisiones requieren métodos tabulares o gráficos que les ayuden a entender la relación entre dos variables. La tabulación cruzada y los diagramas de dispersión son dos métodos de este tipo.

Tabulación cruzada.
Una tabulación cruzada es un resumen tabular de los datos de dos variables. Las distribuciones de frecuencia y de frecuencia relativa obtenidas de los márgenes de las tabulaciones cruzadas proporcionan información de cada una de las variables por separado, pero no dan ninguna luz acerca de la relación entre las variables. El principal valor de una tabulación cruzada es que permite ver la relación entre las variables. Si se convierten las cantidades de una tabulación cruzada en porcentajes de columna o de renglón, se obtiene más claridad sobre la relación entre las variables. La tabulación cruzada se utiliza mucho para examinar la relación entre dos variables. En la práctica, los informes finales de muchos estudios estadísticos contienen una gran cantidad de tabulaciones cruzadas.

Paradoja de Simpson.
Es posible combinar o agregar los datos de dos o más tabulaciones cruzadas para obtener una tabulación cruzada resumida que muestre la relación entre dos variables. En tales casos hay que tener mucho cuidado al sacar conclusiones acerca de la relación entre las dos variables de la tabulación cruzada agregada. En algunos casos las conclusiones obtenidas de la tabulación cruzada agregada se invierten por completo al observar los datos no agregados, situación conocida como paradoja de Simpson.

Debido a la paradoja de Simpson, es necesario tener mucho cuidado al sacar conclusiones cuando se usan datos agregados. Antes de cualquier conclusión acerca de la relación entre dos variables, en una tabulación cruzada en la que se usan datos agregados, es preciso investigar si no existen variables ocultas que afecten los resultados.

Diagrama de dispersión y línea de tendencia.
Un diagrama de dispersión es una representación gráfica de la relación entre dos variables cuantitativas y una línea de tendencia es una línea que da una aproximación de la relación.




La gráfica arriba a la izquierda representa una relación positiva, donde y tiende a aumentar conforme x se incrementa. En la gráfica de arriba a la derecha no aparece ninguna relación entre las dos variables. La gráfica inferior representa una relación negativa en la que y tiende a disminuir a medida que x aumenta.

Fuente: Anderson, Sweeney & Williams – Estadística para Administración y Economía.










Comentarios

Lo más popular de la semana

Infografía 4. Mapa Conceptual de Antecedentes de los Filósofos de la Calidad

Análisis de Amparo Dávila – Alta Cocina