¿Cómo hacer un análisis de regresión en Excel?

Muchas veces queremos saber si entre 2 variables existe una relación (correlación) para poder predecir los resultados de una en función de la otra. Excel nos permite hacer esto entre 2 variables, de manera súper sencilla. ¿Quieres saber como hacer una análisis de regresión simple en Excel? Sigue leyendo pues:

grafico XY con regresión lineal

¿Qué es un análisis de regresión?

El análisis de regresión lineal es una técnica estadística utilizada para modelar la relación entre una variable dependiente y una o más variables independientes, en el caso de excel, solo admite una variable. El objetivo principal es encontrar una relación que mejor represente los datos observados y permita predecir o estimar valores futuros.

Existen diferentes tipos, según la relación entre las variables, pero a modo de ejemplo vamos a hablar de los modelos de regresión lineal monovariable, el más usado en Excel, que se basa en la suposición de que la relación entre las variables puede ser aproximada por una línea recta. Matemáticamente, un modelo de regresión lineal se define como:

Donde:

y = ax+b

  • y es la variable dependiente que se desea predecir.
  • x es la variable independiente que se utiliza para predecir y.
  • a y b son los coeficientes de regresión que representan la relación entre las variables.

El objetivo del análisis de regresión lineal es estimar los valores óptimos para los coeficientes de regresión de manera que minimicen la suma de los cuadrados de los errores (método de los mínimos cuadrados). Esto implica encontrar la línea recta que mejor se ajuste a los datos observados.

Una vez que se han estimado los coeficientes, el modelo puede utilizarse para realizar predicciones sobre nuevos datos. Se pueden calcular los valores esperados de la variable dependiente (y) para valores dados de las variables independientes.

Es importante destacar que el análisis de regresión tiene supuestos y limitaciones. El más importante: correlación no implica causalidad. Para más info de esto podéis ver esta divertida web: Spurious Correlations (tylervigen.com)

¿Cómo se hace con Excel un análisis de regresión?

Micosoft Excel permite hacer análisis de regresión de 2 variables de una manera ultra sencilla. Para ello, utilizaremos los gráficos XY. primero seleccionamos ambas variables a graficar y vamos a la pestaña “Insertar” y seleccionamos gráfico XY.

insertar grafico XY en excel

Una vez el gráfico está creado, podemos hacer click sobre uno de los puntitos y seleccionar “agregar línea de tendencia”:

agregar linea de tendencia en excel

Se abrirá un menú de opciones que permite elegir el tipo de regresión que queremos hacer:

tipos de regresión en excel

Para elegir cual es la mejor regresión, podemos visualizar el indicador R^2 para ver la bondad del ajuste. Para visualizarlo, elegimos la opción, “Presentar el valor R cuadrado en el gráfico”:

presentar R cuadrado en un grafico de excel

¿Pero que es R^2?

El término “R cuadrado” (R^2) es una medida estadística utilizada en la regresión lineal para evaluar la bondad de ajuste del modelo. Representa la proporción de la variabilidad de la variable dependiente que puede explicarse por la variable independiente(s) en el modelo.

El valor de R^2 varía entre 0 y 1, y se interpreta de la siguiente manera:

  • R^2 = 0: Significa que el modelo no puede explicar ninguna variabilidad de la variable dependiente.
  • R^2 = 1: Indica que el modelo explica toda la variabilidad de la variable dependiente, es decir, se ajusta perfectamente a los datos.

Por lo tanto, cuanto más se parezca a 1 más podremos decir que hay correlación entre las variables. En general está aceptado afirmar que hay correlación a partir de un R cuadrado de 0,8.

Ecuación de la regresión

Excel te permite también obtener la ecuación de regresión con un solo click:

ecuación de regresión en Excel

Una vez tengamos la ecuación, podremos predecir los valores de X o de Y simplemente llenando el valor en la ecuación.

Conclusiones

En conclusión, Excel es una herramienta útil para realizar análisis de regresión lineal. Su capacidad para generar gráficos XY, agregar líneas de tendencia y proporcionar medidas como R^2 y la ecuación de regresión facilita el proceso de modelar la relación entre variables y predecir valores. Sin embargo, es importante tener en cuenta que el análisis de regresión tiene sus supuestos y limitaciones, y la correlación entre variables no implica causalidad. Espero que este artículo te ayude a analizar tus datos y saber como hacer gráficos de regresión en Excel.