domingo, 6 de diciembre de 2009

Regresión y correlación

Las técnicas de regresión y correlación cuantifican la asociación estadística entre dos o más variables. La regresión lineal simple expresa la relación entre una variable dependiente Y y una variable independiente X, en términos de la pendiente y la intersección de la línea que mejor se ajuste a las variables.

La correlación simple expresa el grado o la cercanía de la relación entre las dos variables en términos de un coeficiente de correlación que proporciona una medida indirecta de la variabilidad de los puntos alrededor de la mejor línea de ajuste- Ni la regresión ni la correlación dan pruebas de relaciones causa – efecto.

Regresión: El modelo de regresión lineal simple toma la forma

Y = a + bx,
donde
y = variable dependiente
x = variable independiente.
Los valores de la pendiente b y la intersección a se obtienen usando las ecuaciones normales escritas en la forma conveniente.
Correlación

El coeficiente de correlación lineal simple r es un número entre -1 y 1 que indica qué tan bien describe la ecuación lineal la relación entre las dos variables. Como se muestra en la siguiente figura, r se designa como positiva si Y se incrementa cuando lo hace X, y negativa si Y decrece al incrementarse X. Una r de cero indica una ausencia de relación entre las dos variables.
El coeficiente de correlación r es la raíz cuadrada del coeficiente de determinación:

Ejemplo

El gerente general de una planta de producción de materiales de construcción considera que la demanda de embarques de aglomerado puede estar relacionado con el número de permisos de construcción emitidos en el municipio durante el trimestre anterior.

El gerente ha recolectado los datos que se muestran en la tabla.

Si se pide determinar una estimación de los embarques cuando el número de permisos de construcción es 30.

En el siguiente diagrama de dispersión se puede ver que los datos no son perfectamente lineales; sin embargo, se puede hacer un enfoque lineal sobre este periodo corto.

Si se pide determinar una estimación de los embarques cuando el número de permisos de construcción es 30.

En el siguiente diagrama de dispersión se puede ver que los datos no son perfectamente lineales; sin embargo, se puede hacer un enfoque lineal sobre este periodo corto.


Se realizan los cálculos como se muestra en la siguiente tabla