Regresión Lineal con software

Con ayuda del software de análisis estadístico, obtendrás las correlaciones entre columnas de una tabla de datos, es decir, encontrar relaciones entre variables. Lo primero que debes hacer es obtener los datos históricos.

Como ejemplo, llama a la tabla mtcars, que está precargada en el software y haz que las columnas se puedan utilizar como variables a graficar.

Para definir de qué variables obtendrás el modelo lineal, observa todas las correlaciones de las columnas de la tabla con el siguiente comando: cor(mtcars). Entre paréntesis escribe el nombre de la tabla.

Cada uno de los números se refiere al coeficiente de correlación, tiene más sentido graficar variables con coeficiente mayor a 0.8 o menor a -0.8 para poder realizar mejores predicciones.

Como ejemplo, las columnas de millas por galón y el peso del automóvil tienen un coeficiente de correlación de -0.86, esto significa que es una correlación inversa y fuerte.

Realiza un gráfico de dispersión para observar el comportamiento de las columnas de la tabla con el siguiente comando: >plot(mtcars$wt,mtcars$mpg,col=”blue”).

Regresión Lineal con software de análisis estadístico.

El software de análisis estadístico tiene funciones del método de regresión lineal para calcular los coeficientes del modelo matemático. Para calcularlos usa esta sintaxis: lm(mtcarsSmpg=mtcarsSwt). El resultado de esta función es la ecuación matemática de la recta con los coeficientes calculados. Para graficar esta línea sobre el gráfico de dispersión escribe este comando, en el caso del ejemplo se escribe >abline(lm(mtcars$mpg~mtcars$wt,col=”red”). Esta línea significa que a mayor peso del automóvil menos millas por galón podrá recorrer, y entre menos peso más millas por galón recorrerá.

 

Fuente:
Fundación Carlos Slim – Curso Analista de Datos.

Comentarios

Lo más popular de la semana

Infografía 4. Mapa Conceptual de Antecedentes de los Filósofos de la Calidad

Análisis de Amparo Dávila – Alta Cocina