Varianza vs covarianza
La varianza y la covarianza son dos medidas utilizadas en estadísticas. La varianza es una medida de la dispersión de los datos, y la covarianza indica el grado de cambio de dos variables aleatorias juntas. La varianza es más bien un concepto intuitivo, pero la covarianza se define matemáticamente en no tan intuitiva al principio.
Más sobre la varianza
La varianza es una medida de dispersión de los datos del valor medio de la distribución. Dice hasta qué punto se encuentran los puntos de datos de la media de la distribución. Es uno de los principales descriptores de la distribución de probabilidad y uno de los momentos de la distribución. Además, la varianza es un parámetro de la población, y la varianza de una muestra de la población actúa como un estimador de la varianza de la población. Desde una perspectiva, se define como el cuadrado de la desviación estándar.
En lenguaje sencillo, se puede describir como el promedio de los cuadrados de la distancia entre cada punto de datos y la media de la distribución. La siguiente fórmula se usa para calcular la varianza.
Var (x) = e [(x-µ)2 ] para una población, y
Var (x) = e [(x-‾x)2 ] para una muestra
Se puede simplificar además para dar Var (x) = E [x2 ]-(EX])2.
La varianza tiene algunas propiedades de firma, y a menudo se usa en estadísticas para simplificar el uso. La varianza no es negativa porque es el cuadrado de las distancias. Sin embargo, el rango de la varianza no se limita y depende de la distribución particular. La varianza de una variable aleatoria constante es cero, y la varianza no cambia con respecto a un parámetro de ubicación.
Más sobre covarianza
En la teoría estadística, la covarianza es una medida de cuánto cambian dos variables aleatorias juntas. En otras palabras, la covarianza es una medida de la fuerza de la correlación entre dos variables aleatorias. Además, puede considerarse como una generalización del concepto de varianza de dos variables aleatorias.
Covarianza de dos variables aleatorias x e y, que se distribuyen conjuntamente con el segundo momento finito, se conoce como σXy= E [(x-e [x]) (y-e [y])]. A partir de esto, la varianza puede verse como un caso especial de covarianza, donde dos variables son las mismas. Cov (x, x) = var (x)
Al normalizar la covarianza, se puede obtener el coeficiente de correlación lineal o el coeficiente de correlación de Pearson, que se define como ρ = e [(x-e [x]) (y-e [y])]/(σX σY ) = (Cov (x, y))/(σX σY)
Gráficamente, la covarianza entre un par de puntos de datos puede verse como el área del rectángulo con los puntos de datos en los vértices opuestos. Se puede interpretar como una medida de magnitud de separación entre los dos puntos de datos. Teniendo en cuenta los rectángulos para toda la población, la superposición de los rectángulos correspondientes a todos los puntos de datos puede considerarse como la fuerza de la separación; varianza de las dos variables. La covarianza está en dos dimensiones, debido a dos variables, pero simplificarla a una variable da la varianza de un solo como la separación en una dimensión.
¿Cuál es la diferencia entre varianza y covarianza??
• La varianza es la medida de propagación/ dispersión en una población, mientras que la covarianza se considera una medida de la variación de dos variables aleatorias o la fuerza de la correlación.
• La varianza puede considerarse como un caso especial de covarianza.
• La varianza y la covarianza dependen de la magnitud de los valores de datos, y no se pueden comparar; Por lo tanto, están normalizados. La covarianza se normaliza en el coeficiente de correlación (dividiendo por el producto de las desviaciones estándar de las dos variables aleatorias) y la varianza se normaliza en la desviación estándar (tomando la raíz cuadrada)