Fórmula

La desviación estándar mide la distancia promedio de los puntos de datos respecto a la media de un conjunto de datos. Para calcular la varianza de la población, la fórmula es σ² = Σ(x - μ)² / N, donde Σ es la suma de todos los valores, x es cada punto de datos individual, μ es la media de la población y N es el número total de puntos. La desviación estándar de la población (σ) es la raíz cuadrada de esta varianza. Este enfoque se utiliza cuando se tiene acceso a cada punto de datos de todo el grupo que se está estudiando. Para la mayoría de las aplicaciones del mundo real en las que solo se dispone de un subconjunto de un grupo mayor, la desviación estándar de la muestra (s) se calcula mediante la fórmula s = √[Σ(x - x̄)² / (n - 1)]. Esta versión utiliza x̄ para la media de la muestra y aplica la corrección de Bessel dividiendo por n - 1 en lugar de n. Este ajuste compensa el hecho de que una muestra tiende a mostrar una variabilidad ligeramente menor que la población completa, proporcionando una estimación más precisa e imparcial para el análisis científico o estadístico.

Ejemplo

Considere un pequeño conjunto de datos de tres pesos de objetos: 5 kg, 7 kg y 9 kg. Primero, halle la media sumando los valores y dividiendo por tres, lo que equivale a 7 kg. A continuación, reste la media de cada valor y eleve el resultado al cuadrado: (5 - 7)² = 4, (7 - 7)² = 0 y (9 - 7)² = 4. Al sumar estos cuadrados se obtiene una suma de 8. Para hallar la varianza de la muestra, divida esta suma por n - 1, que es 3 - 1 = 2, lo que da como resultado una varianza de 4. Por último, calcule la raíz cuadrada de 4 para determinar que la desviación estándar de la muestra es 2 kg.

Qué significa el resultado

  • ±1 σ Distribución normal
    Significado En una distribución normal, aproximadamente el 68.3 por ciento de todos los puntos de datos caen dentro de este rango.
    Acción Esto representa los resultados más comunes y la concentración central del conjunto de datos.
  • ±2 σ Alta variabilidad
    Significado Aproximadamente el 95.4 por ciento de los puntos de datos caen dentro de dos desviaciones estándar de la media.
    Acción Los puntos que caen fuera de este rango suelen considerarse estadísticamente significativos o inusuales.
  • ±3 σ Valores atípicos extremos
    Significado Alrededor del 99.7 por ciento de los datos caen dentro de este amplio rango, dejando muy poco fuera.
    Acción Los puntos de datos que superan este umbral son extremadamente raros y deben investigarse como anomalías.
  • 0 Varianza cero
    Significado Una desviación estándar de cero indica que cada uno de los puntos de datos del conjunto es idéntico.
    Acción Confirme si esta falta de variación es esperada o indica un error de medición.
Rango Estado Significado Acción
±1 σ Distribución normal En una distribución normal, aproximadamente el 68.3 por ciento de todos los puntos de datos caen dentro de este rango. Esto representa los resultados más comunes y la concentración central del conjunto de datos.
±2 σ Alta variabilidad Aproximadamente el 95.4 por ciento de los puntos de datos caen dentro de dos desviaciones estándar de la media. Los puntos que caen fuera de este rango suelen considerarse estadísticamente significativos o inusuales.
±3 σ Valores atípicos extremos Alrededor del 99.7 por ciento de los datos caen dentro de este amplio rango, dejando muy poco fuera. Los puntos de datos que superan este umbral son extremadamente raros y deben investigarse como anomalías.
0 Varianza cero Una desviación estándar de cero indica que cada uno de los puntos de datos del conjunto es idéntico. Confirme si esta falta de variación es esperada o indica un error de medición.

Cuándo usar esta calculadora

Rango válido: La desviación estándar de la muestra es válida para cualquier conjunto de datos con al menos dos valores numéricos.

La fórmula falla cuando n es inferior a dos para las muestras porque conduce a una división por cero. La desviación estándar es muy sensible a los valores atípicos, lo que significa que un solo valor extremo puede inflar significativamente el resultado y falsear la dispersión general de los datos.

La desviación estándar es la medida de dispersión estadística más utilizada, que cuantifica cuánto difieren los miembros de un grupo del valor medio de ese grupo. Es una herramienta fundamental en diversos campos, incluidas las finanzas, donde se utiliza para medir la volatilidad del mercado y el riesgo de inversión. Una desviación estándar baja indica que los puntos de datos tienden a estar muy cerca de la media, mientras que una desviación estándar alta indica que los puntos de datos están dispersos en un amplio rango de valores. Este cálculo es esencial porque permite a los investigadores y analistas comprender la fiabilidad y consistencia de sus datos. En la fabricación y el control de calidad, la desviación estándar ayuda a determinar si un proceso es estable o si las variaciones en productos como la longitud de un perno en cm (in) están dentro de los límites aceptables. Al identificar cuánto se desvía un proceso de su objetivo, los ingenieros pueden implementar mejoras para garantizar que los productos cumplan con las estrictas especificaciones. Además, el concepto es fundamental para la metodología Six Sigma, cuyo objetivo es reducir la variación del proceso para que prácticamente todos los resultados caigan dentro de un rango muy estrecho de la media. La comprensión de la desviación estándar también permite el uso de las puntuaciones Z, que determinan a cuántas desviaciones estándar se encuentra un punto específico de la media, lo que permite comparar puntos de datos de diferentes conjuntos de datos.

Calculadoras relacionadas

Preguntas frecuentes

Una desviación estándar alta indica que los puntos de datos están dispersos en un rango más amplio de valores, lo que sugiere una alta variabilidad o inconsistencia. En finanzas, esto suele representar un mayor riesgo, mientras que en la fabricación, puede indicar una falta de precisión en los procesos de producción. Muestra que los datos están menos agrupados alrededor de la media.

La desviación estándar de la población se utiliza cuando se mide a cada miembro de un grupo, mientras que la desviación estándar de la muestra estima la variabilidad de un grupo mayor basándose en un subconjunto. La fórmula de la muestra utiliza n - 1 en el denominador, lo que se conoce como corrección de Bessel, para proporcionar una estimación más precisa e imparcial.

La regla 68-95-99.7, o regla empírica, establece que para una distribución normal, casi todos los datos caen dentro de tres desviaciones estándar de la media. Específicamente, el 68 por ciento cae dentro de una, el 95 por ciento dentro de dos y el 99.7 por ciento dentro de tres. Esto ayuda a identificar valores atípicos y a comprender la probabilidad de puntos de datos específicos.

La desviación estándar no puede ser negativa porque se calcula como la raíz cuadrada de la varianza, que es una suma de valores al cuadrado. El valor más pequeño posible es cero, lo que indica que todos los puntos de datos son idénticos. Si calcula un valor negativo, es probable que haya un error en la aritmética o en la aplicación de la fórmula.

La desviación estándar es simplemente la raíz cuadrada de la varianza. Mientras que la varianza proporciona una descripción matemática de la dispersión en unidades al cuadrado, la desviación estándar expresa esa dispersión en las mismas unidades que los datos originales. Esto hace que la desviación estándar sea mucho más fácil de interpretar y aplicar a mediciones o comparaciones del mundo real.

Debe consultar a un estadístico profesional cuando trate con distribuciones de datos complejas que no sigan una curva de campana normal o cuando tome decisiones de alto riesgo basadas en muestras pequeñas. Los expertos pueden ayudar a aplicar métodos avanzados más allá de la desviación estándar básica para garantizar que sus conclusiones sean matemáticamente sólidas y tengan en cuenta los posibles sesgos.