Формула

Стандартное отклонение измеряет среднее расстояние точек данных от среднего значения набора данных. Для расчета дисперсии генеральной совокупности используется формула σ² = Σ(x - μ)² / N, где Σ — сумма всех значений, x — каждая отдельная точка данных, μ — среднее значение совокупности, а N — общее количество точек. Стандартное отклонение совокупности (σ) — это квадратный корень из этой дисперсии. Этот подход используется, когда у вас есть доступ к каждой точке данных всей изучаемой группы. Для большинства реальных приложений, где у вас есть только подмножество более крупной группы, стандартное отклонение выборки (s) рассчитывается по формуле s = √[Σ(x - x̄)² / (n - 1)]. В этой версии используется x̄ для среднего значения выборки и применяется поправка Бесселя путем деления на n - 1 вместо n. Эта корректировка компенсирует тот факт, что выборка имеет тенденцию показывать чуть меньшую изменчивость, чем вся совокупность, обеспечивая более точную и несмещенную оценку для научного или статистического анализа.

Пример

Рассмотрим небольшой набор данных о весе трех объектов: 5 kg, 7 kg и 9 kg. Сначала найдите среднее значение, сложив величины и разделив на три, что равно 7 kg. Затем вычтите среднее из каждого значения и возведите результат в квадрат: (5 - 7)² = 4, (7 - 7)² = 0 и (9 - 7)² = 4. Сложение этих квадратов дает сумму 8. Чтобы найти выборочную дисперсию, разделите эту сумму на n - 1, то есть 3 - 1 = 2, что дает дисперсию 4. Наконец, извлеките квадратный корень из 4, чтобы определить, что стандартное отклонение выборки составляет 2 kg.

Что означает результат

  • ±1 σ Нормальное распределение
    Значение В нормальном распределении примерно 68.3 процента всех точек данных попадают в этот диапазон.
    Действие Это представляет наиболее распространенные результаты и основную концентрацию набора данных.
  • ±2 σ Высокая изменчивость
    Значение Примерно 95.4 процента точек данных попадают в пределы двух стандартных отклонений от среднего.
    Действие Точки, выходящие за пределы этого диапазона, часто считаются статистически значимыми или необычными.
  • ±3 σ Экстремальные выбросы
    Значение Около 99.7 процента данных попадают в этот широкий диапазон, оставляя очень мало за его пределами.
    Действие Точки данных за этим порогом крайне редки и должны исследоваться как аномалии.
  • 0 Нулевая дисперсия
    Значение Стандартное отклонение, равное нулю, указывает на то, что каждая точка данных в наборе идентична.
    Действие Подтвердите, ожидается ли такое отсутствие вариативности или оно указывает на ошибку измерения.
Диапазон Статус Значение Действие
±1 σ Нормальное распределение В нормальном распределении примерно 68.3 процента всех точек данных попадают в этот диапазон. Это представляет наиболее распространенные результаты и основную концентрацию набора данных.
±2 σ Высокая изменчивость Примерно 95.4 процента точек данных попадают в пределы двух стандартных отклонений от среднего. Точки, выходящие за пределы этого диапазона, часто считаются статистически значимыми или необычными.
±3 σ Экстремальные выбросы Около 99.7 процента данных попадают в этот широкий диапазон, оставляя очень мало за его пределами. Точки данных за этим порогом крайне редки и должны исследоваться как аномалии.
0 Нулевая дисперсия Стандартное отклонение, равное нулю, указывает на то, что каждая точка данных в наборе идентична. Подтвердите, ожидается ли такое отсутствие вариативности или оно указывает на ошибку измерения.

Когда использовать этот калькулятор

Допустимый диапазон: Стандартное отклонение выборки действительно для любого набора данных, содержащего как минимум два числовых значения.

Формула перестает работать, когда n меньше двух для выборок, так как это приводит к делению на ноль. Стандартное отклонение очень чувствительно к выбросам, что означает, что одно экстремальное значение может значительно завысить результат и исказить общее представление о разбросе данных.

Стандартное отклонение — наиболее широко используемая мера статистической дисперсии, количественно определяющая, насколько члены группы отличаются от среднего значения для этой группы. Это фундаментальный инструмент в различных областях, включая финансы, где оно используется для измерения волатильности рынка и инвестиционного риска. Низкое стандартное отклонение указывает на то, что точки данных имеют тенденцию быть очень близкими к среднему значению, в то время как высокое стандартное отклонение указывает на то, что точки данных распределены в большом диапазоне значений. Этот расчет важен, так как позволяет исследователям и аналитикам понять надежность и последовательность своих данных. В производстве и контроле качества стандартное отклонение помогает определить, стабилен ли процесс или находятся ли отклонения в продуктах, таких как длина болта в cm (in), в допустимых пределах. Определяя, насколько процесс отклоняется от цели, инженеры могут внедрять улучшения, чтобы гарантировать соответствие продукции строгим спецификациям. Кроме того, эта концепция занимает центральное место в методологии «Шесть сигм», целью которой является снижение вариативности процесса, чтобы практически все результаты попадали в очень узкий диапазон среднего значения. Понимание стандартного отклонения также позволяет использовать Z-оценки, которые определяют, на сколько стандартных отклонений конкретная точка удалена от среднего, что позволяет сравнивать точки данных из разных наборов данных.

Связанные калькуляторы

Часто задаваемые вопросы

Высокое стандартное отклонение указывает на то, что точки данных распределены в более широком диапазоне значений, что предполагает высокую изменчивость или непоследовательность. В финансах это часто представляет собой более высокий риск, а в производстве может сигнализировать о недостатке точности в производственных процессах. Это показывает, что данные менее сгруппированы вокруг среднего значения.

Стандартное отклонение совокупности используется, когда измеряется каждый член группы, в то время как стандартное отклонение выборки оценивает изменчивость более крупной группы на основе подмножества. В формуле выборки в знаменателе используется n - 1, известное как поправка Бесселя, для обеспечения более точной и несмещенной оценки.

Правило 68-95-99.7, или эмпирическое правило, гласит, что для нормального распределения почти все данные попадают в пределы трех стандартных отклонений от среднего. В частности, 68 процентов попадают в пределы одного, 95 процентов — в пределы двух и 99.7 процента — в пределы трех. Это помогает выявлять выбросы и понимать вероятность конкретных точек данных.

Стандартное отклонение не может быть отрицательным, так как оно рассчитывается как квадратный корень из дисперсии, которая является суммой квадратов значений. Минимально возможное значение — ноль, что указывает на идентичность всех точек данных. Если вы получили отрицательное значение, вероятно, допущена ошибка в арифметике или применении формулы.

Стандартное отклонение — это просто квадратный корень из дисперсии. В то время как дисперсия дает математическое описание разброса в квадратных единицах, стандартное отклонение выражает этот разброс в тех же единицах, что и исходные данные. Это делает стандартное отклонение гораздо более простым для интерпретации и применения к реальным измерениям или сравнениям.

Вам следует проконсультироваться с профессиональным статистиком при работе со сложными распределениями данных, которые не следуют нормальной кривой, или при принятии важных решений на основе малых выборок. Эксперты могут помочь применить передовые методы, выходящие за рамки базового стандартного отклонения, чтобы гарантировать математическую обоснованность ваших выводов и учет возможных искажений.