Población versus desviación estándar de muestra
En estadísticas, se utilizan varios índices para describir un conjunto de datos correspondiente a su tendencia central, dispersión y asimetría. La desviación estándar es una de las medidas más comunes de dispersión de datos del centro del conjunto de datos.
Debido a dificultades prácticas, no será posible utilizar los datos de toda la población cuando se pruebe una hipótesis. Por lo tanto, empleamos valores de datos de muestras para hacer inferencias sobre la población. En tal situación, estos se denominan estimadores ya que estiman los valores de los parámetros de la población.
Es extremadamente importante usar estimadores imparciales en inferencia. Se dice que un estimador es imparcial si el valor esperado de ese estimador es igual al parámetro de población. Por ejemplo, usamos la media de la muestra como un estimador imparcial para la media de la población. (Matemáticamente, se puede demostrar que el valor esperado de la media de la muestra es igual a la media de la población). En el caso de estimar la desviación estándar de la población, la desviación estándar de la muestra es un estimador imparcial también.
¿Qué es la desviación estándar de la población??
Cuando los datos de toda la población se pueden tener en cuenta (por ejemplo, en el caso de un censo), es posible calcular la desviación estándar de la población. Para calcular la desviación estándar de la población, primero se calculan las desviaciones de los valores de datos de la media de la población. El cuadrado medio de la raíz (media cuadrática) de las desviaciones se denomina desviación estándar de la población.
En una clase de 10 estudiantes, los datos sobre los estudiantes se pueden recopilar fácilmente. Si se prueba una hipótesis en esta población de estudiantes, entonces no es necesario usar valores de muestra. Por ejemplo, los pesos de los 10 estudiantes (en kilogramos) se miden como 70, 62, 65, 72, 80, 70, 63, 72, 77 y 79. Entonces el peso medio de las diez personas (en kilogramos) es (70+62+65+72+80+70+63+72+77+79)/10, que es 71 (en kilogramos). Esta es la media de la población.
Ahora para calcular la desviación estándar de la población, calculamos las desviaciones de la media. Las desviaciones respectivas de la media son (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 y (79 - 71) = 8. La suma de cuadrados de desviación es (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. La desviación estándar de la población es √ (366/10) = 6.05 (en kilogramos). 71 es el peso medio exacto de los estudiantes de la clase y 6.05 es la desviación estándar exacta del peso de 71.
¿Qué es la desviación estándar de la muestra??
Cuando se utilizan datos de una muestra (de tamaño n) para estimar los parámetros de la población, se calcula la desviación estándar de la muestra. Primero se calculan las desviaciones de los valores de datos de la media de la muestra. Dado que la media de la muestra se usa en lugar de la media de la población (que es desconocida), tomar la media cuadrática no es apropiada. Para compensar el uso de la media de la muestra, la suma de cuadrados de desviaciones se divide por (N-1) en lugar de N. La desviación estándar de la muestra es la raíz cuadrada de este. En símbolos matemáticos, s = √ ∑ (xi-X)2 / (N-1), donde S es la desviación estándar de la muestra, ẍ es la media de muestra y Xison los puntos de datos.
Ahora suponga que, en el ejemplo anterior, la población es los estudiantes de toda la escuela. Entonces, la clase será solo una muestra. Si esta muestra se usa en la estimación, la desviación estándar de la muestra será √ (366/9) = 6.38 (en kilogramos) ya que 366 se dividió por 9 en lugar de 10 (el tamaño de la muestra). El hecho de observar es que este no se garantiza que sea el valor de desviación estándar de la población exacta. Es simplemente una estimación para ello.
¿Cuál es la diferencia entre la desviación estándar de la población y la desviación estándar de la muestra?? • La desviación estándar de la población es el valor exacto del parámetro utilizado para medir la dispersión del centro, mientras que la desviación estándar de la muestra es un estimador imparcial para ello. • La desviación estándar de la población se calcula cuando se conocen todos los datos con respecto a cada individuo de la población. Más, se calcula la desviación estándar de la muestra. • La desviación estándar de la población viene dada por σ = √ ∑ (xi-µ)2/ n donde µ es la media de la población y N es el tamaño de la población, pero la desviación estándar de la muestra viene dada por S = √ ∑ (xi- ẍ)2 / (N-1) donde ẍ es la media de la muestra y N es el tamaño de la muestra.
|