Análisis por regresión lineal

Se usa para marcar la línea de tendencia que resulta de los datos estadísticos recabados en ámbitos de negocio o científicos, entre otros.

Correlación.

Antes de hacer un análisis de regresión lineal debes saber qué tan correlacionadas están dos variables, esto solo para identificar el grado de dependencia de una sobre la otra en un gráfico de dispersión, es decir, cómo afectan los cambios de una a la otra.

Existen dos tipos de correlaciones:

  • Directa: Cuando una variable aumenta, la otra también. Por ejemplo, si la radiación solar aumenta, la temperatura aumenta.
  • Inversa: Cuando una variable aumenta, la otra disminuye. Por ejemplo, si la temperatura aumenta, el ozono disminuye.

El grado de correlación es dado por el coeficiente de correlación (r) y este valor puede estar en el rango de -1 a 1, deduciendo que:

  • -1.0 a -0.6 es una correlación inversa fuerte.
  • 0.6 a 1.0 es una correlación directa fuerte.
  • -0.5 a 0.0 es una correlación inversa débil.
  • 0.1 a 0.5 es una correlación directa débil.

Debes tomar en cuenta que entre más fuerte es la correlación, ya sea inversa o directa, es más lógico que se desee calcular la tendencia para poder aproximar valores futuros con mayor precisión.

Para calcular el coeficiente de correlación entre dos variables, divide la covarianza entre la multiplicación de las desviaciones estándar de las dos variables antes mencionadas.

Covarianza.

Es el grado de variación que existe entre dos variables, y se calcula de la siguiente manera: La sumatoria de la multiplicación de las variables entre el número de elementos a analizar menos la multiplicación de los promedios de las variables.

Ahora ya puedes calcular el coeficiente de correlación para saber si es viable obtener la línea de tendencia.

Regresión Lineal.

También llamada ajuste lineal, busca encontrar un modelo matemático para aproximar la relación entre dos variables. Este modelo debe estar basado en la ecuación general de la línea recta, por lo que el método se centra en encontrar los coeficientes.

La ecuación general de la línea recta es la siguiente: y=mx+b. Donde x es el eje horizontal (variable independiente), y es el eje vertical (variable dependiente), m es la pendiente o qué tan inclinada es la línea, b es la intersección de la línea con el eje vertical.

Como se podrá observar, el método de regresión lineal encuentra m y b basado en los valores de x y y. No es fácil encontrar estos valores, por lo que te apoyarás del software de análisis estadístico para encontrar una solución.

Fuente:
Fundación Carlos Slim – Curso Analista de Datos.

Comentarios

Lo más popular de la semana

Principio de Excepción

Análisis de Amparo Dávila – Alta Cocina