Correlación vs covarianza
La correlación y la covarianza son conceptos estrechamente relacionados en las estadísticas teóricas. Son importantes para determinar la relación entre dos variables aleatorias.
¿Qué es la correlación??
La correlación es una medida de la fuerza de la relación entre dos variables. El coeficiente de correlación cuantifica el grado de cambio de una variable basada en el cambio de la otra variable. En estadísticas, la correlación está conectada al concepto de dependencia, que es la relación estadística entre dos variables
El coeficiente de correlación de Pearson o simplemente el coeficiente de correlación R es un valor entre -1 y 1 (-1≤r≤+1). Es el coeficiente de correlación más utilizado y válido solo para una relación lineal entre las variables. Si r = 0 no existe relación, y si r≥0 la relación es directamente proporcional; El valor de una variable aumenta con el aumento de la otra. Si r≤0 la relación es inversamente proporcional; una variable disminuye a medida que la otra aumenta.
Debido a la condición de linealidad, el coeficiente de correlación R también se puede utilizar para establecer la presencia de una relación lineal entre las variables.
¿Qué es la covarianza??
En la teoría estadística, la covarianza es una medida de cuánto cambian dos variables aleatorias juntas. En otras palabras, la covarianza es una medida de la fuerza de la correlación entre dos variables aleatorias.
En otra perspectiva, se puede ver que la correlación es solo la versión normalizada de la covarianza, donde la covarianza se divide por el producto de las desviaciones estándar de las dos variables aleatorias. El rango de covarianza puede ser grande; Por lo tanto, no es fácil de comparar. Esta dificultad se supera al llevar los valores de covarianza a un rango en el que se puede comparar normalizándolo (algo así como lo que hace Z-Score). Aunque la covarianza y la varianza están vinculadas entre sí de la manera anterior, sus distribuciones de probabilidad no se unen entre sí de manera simple y deben tratarse por separado.
¿Cuál es la diferencia entre correlación y covarianza??
• Tanto la correlación como la covarianza son medidas de relación entre dos variables aleatorias. La correlación es la medida de la resistencia de la linealidad de las dos variables y la covarianza es una medida de la fuerza de la correlación.
• Los valores del coeficiente de correlación son un valor entre -1 y +1, mientras que el rango de covarianza no es constante, pero puede ser positivo o negativo. Pero si las variables aleatorias se estandarizan antes de calcular la covarianza, entonces la covarianza es igual a la correlación y tiene un valor entre -1 y +1.